当前位置: 首页 > news >正文

html做网站的毕业设计3g免费网站

html做网站的毕业设计,3g免费网站,教育在线网站怎样做直播,长沙网站排名提升情景:传统的爬虫只需要设置fetch_typejs即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。 直接上例子: 可以…

情景:传统的爬虫只需要设置fetch_type=js即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。

直接上例子:
可以看到,该网页的每一页的数据是通过ajax请求获取到的,方式为POST,所以不能用传统方法。
在这里插入图片描述

可以看到该请求的请求体,我们需要把请求体和请求方法写到crawl函数的参数里。
在这里插入图片描述

直接上代码:

# coding: utf-8
from pyspider.libs.base_handler import *class Handler(BaseHandler):@every(minutes=10)def on_start(self):data = {'channelid': 229105,'sortfield': '-docorderpri,-docreltime','classsql': 'chnlid=40078','classcol': 'publishyear','classnum': 100,'classsort': 0,'cache': 'true','page': 1,'prepage': 75,}save = {'req_body':data}# method指定POST,data指定请求体,save保存一些自定义字段。self.crawl('http://yjt.fujian.gov.cn/fjdzapp/search', callback=self.index_page, method="POST", data=data, save=save)# 抓取请求的响应数据后会调用此接口@config(age=10*60)def index_page(self, response):print(response.save['req_body']) # 查看请求体print(response.json) # 获取所抓到的数据return response.jsondef on_result(self, result):# 处理结果 ...

请求体和响应如下:
在这里插入图片描述

需要注意的地方

可以看到,字典的字段都是u'...',这表明是Unicode编码,所以想要获取字典中的字段,需要做下面的处理:

response字典中有个recordCount的key,我想获取他的值,需要将其先按照utf-8的编码方式解码为Unicode(python2默认Unicode编码,但是我们的脚本是utf-8的编码方式),这样就可以获取到字典的值啦

	recordCount = response.json.get('recordCount'.decode('utf-8'))
http://www.yayakq.cn/news/424924/

相关文章:

  • 简要概括自建网站的优缺点淄博市建设档案馆网站
  • dreamwearver做网站腾讯云免费网站建设
  • 免费ppt模板下载网盘通辽网站seo
  • 网站改版影响排名成都旧房改造装修公司哪家好
  • 惠州做网站多少钱太原市建设工程安全监督站网站
  • 具备网站维护与建设能力网站开发开始阶段的主要任务包括( )。
  • 网站主体备案号什么网站免费做推广
  • 做网站的厉害还是黑网站的厉害广州:推动优化防控措施落
  • 北京做的比较好的网站公司新乡市网站建设有哪些公司
  • 樟树市建设局网站企业名录下载
  • 网站开发职业前景评估一个虚拟空间做两个网站
  • 湖南做网站 f磐石网络推广计划和推广单元什么区别
  • 做网站上传空间什么意思网站title keyword description
  • 网站设计的机构百度一直不收录网站
  • 国家商标查询官方网站偷的网站怎么做seo
  • 清廉医院建设网站网站设计目的怎么写
  • 做图表好用网站或软件网站建设对企业很重要
  • 如何制作课程网站模板下载地址室内设计师网名
  • 移动网站 模板电商运营的核心公式
  • 建行官网网站网页制作源代码
  • 网站开发技术发展历程室内设计效果图手绘图
  • 网站开发工作怎么样网站备案起名要求
  • 做设计什么设计比较好的网站wordpress安装路径
  • 响应式网站是做列表中国分类信息平台
  • asp.net 网站开发实例石龙网站开发
  • 聊城网站建设策划建设公司四川营销网站建设
  • 晋中网站建设哪家强产品开发流程文件
  • 网站推广的岗位要求商品网站建设方案
  • 网站设计工具更好的做网站wordpress博客占用cpu
  • 生成网站 目录徐州市建设局官方网站