当前位置: 首页 > news >正文

绵阳网站排名网站访问速度 云组机

绵阳网站排名,网站访问速度 云组机,建设网站视频,高清视频线转换线情景:传统的爬虫只需要设置fetch_typejs即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。 直接上例子: 可以…

情景:传统的爬虫只需要设置fetch_type=js即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。

直接上例子:
可以看到,该网页的每一页的数据是通过ajax请求获取到的,方式为POST,所以不能用传统方法。
在这里插入图片描述

可以看到该请求的请求体,我们需要把请求体和请求方法写到crawl函数的参数里。
在这里插入图片描述

直接上代码:

# coding: utf-8
from pyspider.libs.base_handler import *class Handler(BaseHandler):@every(minutes=10)def on_start(self):data = {'channelid': 229105,'sortfield': '-docorderpri,-docreltime','classsql': 'chnlid=40078','classcol': 'publishyear','classnum': 100,'classsort': 0,'cache': 'true','page': 1,'prepage': 75,}save = {'req_body':data}# method指定POST,data指定请求体,save保存一些自定义字段。self.crawl('http://yjt.fujian.gov.cn/fjdzapp/search', callback=self.index_page, method="POST", data=data, save=save)# 抓取请求的响应数据后会调用此接口@config(age=10*60)def index_page(self, response):print(response.save['req_body']) # 查看请求体print(response.json) # 获取所抓到的数据return response.jsondef on_result(self, result):# 处理结果 ...

请求体和响应如下:
在这里插入图片描述

需要注意的地方

可以看到,字典的字段都是u'...',这表明是Unicode编码,所以想要获取字典中的字段,需要做下面的处理:

response字典中有个recordCount的key,我想获取他的值,需要将其先按照utf-8的编码方式解码为Unicode(python2默认Unicode编码,但是我们的脚本是utf-8的编码方式),这样就可以获取到字典的值啦

	recordCount = response.json.get('recordCount'.decode('utf-8'))
http://www.yayakq.cn/news/370689/

相关文章:

  • 江苏省建设工程设计施工图审核中心网站广告设计软件photoshop
  • ppt 做的最好的网站wordpress怎么显示摘要
  • 申请一个自己的网站51免费模板网
  • 用php做购物网站友情链接检查
  • 麻城建设局网站停办做建材网站
  • 上海技术公司做网站文件上传网站源码
  • 阿里服务器怎么做网站服务器吗如何让自己的网站被百度收录
  • 如何设计网站首页导航微信公众号网页版入口
  • 网站新款模板每平每方设计家官网
  • 做网站论文江门网站建设
  • 小语种网站开发移动ui设计 网站
  • 网站备案变更接入搜索引擎下载
  • 山东莱钢建设有限公司网站做网站用突发性实例可以吗
  • 网页制作与网站建设试卷珠海公司做网站
  • 登陆工伤保险网站 提示未授权 怎么做医院网站方案
  • 湖南省做网站的WordPress和微信小程序
  • 网站源码提取学短视频剪辑与制作
  • 如何在网站网站做代理长沙做网站好的公司
  • 网站开发学校外贸网站和内贸
  • 晋江市住房和城乡建设网站做网站要费用多少
  • 凯里哪里有做网站的phpcms做网站页面开发
  • 网站优化解决方案网站访问权限
  • wordpress导航站源码一站式海外推广平台
  • 配资网站开发商标设计注册一条龙价格
  • 广扬建设集团网站百度销售岗位怎么样
  • 新乡手机网站建设哪家专业天津建设工程信息网评标专家怎么查询评审项目
  • 做网站网站免费制作简历的app
  • 网站开发文档教学免费做图片的网站有哪些
  • 福建建设厅网站官网企业商务网站建设论文
  • 网站文章收录合肥网站建设之4个细节要注意