当前位置: 首页 > news >正文

制作微网站的平台四川省住房和建设厅网站

制作微网站的平台,四川省住房和建设厅网站,攻击自己做的网站吗,台州网站开发前言 最近在学习Python爬虫的知识,既然眼睛会了难免忍不住要实践一把。 不废话直接上主题 代码不复杂,简单的例子奉上: import requests from lxml import etreecookie 浏览器F12网络请求标头里有 user_agent 浏览器F12网络请求标头里有…

前言

最近在学习Python爬虫的知识,既然眼睛会了难免忍不住要实践一把。

不废话直接上主题

代码不复杂,简单的例子奉上:

import requests
from lxml import etreecookie = '浏览器F12网络请求标头里有'
user_agent = '浏览器F12网络请求标头里有'
# 具体的方法网上有很多这里不是叙述的重点headers= {'User-Agent': user_agent,'Cookie': cookie,'Host': 'fanqienovel.com','Connection': 'keep-alive'
}url = "https://****"# 使用get方法请求网页
resp = requests.get(url, headers=headers)# 将网页内容按utf-8规范解码为文本形式
content = resp.content.decode('utf-8')# 将文本内容创建为可解析元素
html = etree.HTML(content)# 获取1
title1 = html.xpath('//*[@id="app"]/div/div[2]/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]# 获取2
title2 = html.xpath('//*[@id="app"]/div/div/div/div[1]/div/div[2]/div[2]/div[1]/h1/text()')[0]

“获取1”是页面打开后直接复制的XPath路径,但根据这个路径获取不到数据,见截图。

但content是有内容的,参阅网上的方案都未决解,但提供了思路。

是网站做了反爬虫处理,复制的XPath不准确导致的,想了个办法将content的内容复制到txt文档,然后修改为html的后缀用浏览器打开,在新的网页下重新复制XPath就得到了“获取2”的路径,可以发现1和2路径是有差异的。

问题到这就解决了。

http://www.yayakq.cn/news/756481/

相关文章:

  • 建设厅网站关于建筑资质合并ui设计的作用
  • 清风算法受影响的网站网站qq在线状态
  • 网站建设需要会什么软件有哪些方面网站各类模块内容说明
  • 河东做网站沈阳网站建设求职简历
  • 湖南网站建设360o江苏省建设局报考网站
  • 即墨专业医院网站制作公司网站建设实训结论
  • 佛山个性化网站开发平面设计有什么网站
  • 中山网站建设文化咨询备案域名出售是否违法
  • html5旅游网站怎么制做网站
  • 研学网站平台建设方案工业产品设计是科学技术与什么的融合
  • 高速公路建设网站wordpress部份变英文
  • 港口建设网站自己建网站能赚钱吗
  • 学做面包到什么网站中小企业erp系统哪个好
  • 泉州响应式网站建设协会网站制作
  • 外销网站自己做的网站出现广告
  • 做网站用asp还是php好做暧暧视频网站在线
  • 国外设计教程网站网站推广是网站建设完成之后的长期工作
  • 放射科网站建设400网站建设价格
  • 建站网站都用不了的做设计参考的网站
  • 静安网站建设公司自己做的网站怎么设置地址
  • 网站开发制作全包内蒙古建筑培训网官网
  • 建企业网站要多少钱软件外包公司名单
  • 秦皇岛优化网站排名用织梦做网站都需要用什么
  • html网页设计代码购物网站网架公司招聘施工队伍
  • 怎么做业务网站网站建设需要会代码吗
  • 网站的色调织梦游戏网站模板
  • wordpress全站静态页面全球互联网企业100强名单
  • 专做展厅设计网站网站需要服务器
  • 台州网站seo外包wordpress仿喜马拉雅
  • 长沙专业的网站建设企业网站建设实训课实训心得