当前位置: 首页 > news >正文

2018年做淘宝客网站需要备案嘛冒险岛钓鱼网站做啥用

2018年做淘宝客网站需要备案嘛,冒险岛钓鱼网站做啥用,在微信上怎么开店,淘宝客网站免费模板下载情景:传统的爬虫只需要设置fetch_typejs即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。 直接上例子: 可以…

情景:传统的爬虫只需要设置fetch_type=js即可,因为可以获取到整个页面。但是现在ajax应用越来越广泛,所以有的网页不能用此种爬虫类型来获取页面的数据,只能用slef.crawl()来发起http请求来抓取数据。

直接上例子:
可以看到,该网页的每一页的数据是通过ajax请求获取到的,方式为POST,所以不能用传统方法。
在这里插入图片描述

可以看到该请求的请求体,我们需要把请求体和请求方法写到crawl函数的参数里。
在这里插入图片描述

直接上代码:

# coding: utf-8
from pyspider.libs.base_handler import *class Handler(BaseHandler):@every(minutes=10)def on_start(self):data = {'channelid': 229105,'sortfield': '-docorderpri,-docreltime','classsql': 'chnlid=40078','classcol': 'publishyear','classnum': 100,'classsort': 0,'cache': 'true','page': 1,'prepage': 75,}save = {'req_body':data}# method指定POST,data指定请求体,save保存一些自定义字段。self.crawl('http://yjt.fujian.gov.cn/fjdzapp/search', callback=self.index_page, method="POST", data=data, save=save)# 抓取请求的响应数据后会调用此接口@config(age=10*60)def index_page(self, response):print(response.save['req_body']) # 查看请求体print(response.json) # 获取所抓到的数据return response.jsondef on_result(self, result):# 处理结果 ...

请求体和响应如下:
在这里插入图片描述

需要注意的地方

可以看到,字典的字段都是u'...',这表明是Unicode编码,所以想要获取字典中的字段,需要做下面的处理:

response字典中有个recordCount的key,我想获取他的值,需要将其先按照utf-8的编码方式解码为Unicode(python2默认Unicode编码,但是我们的脚本是utf-8的编码方式),这样就可以获取到字典的值啦

	recordCount = response.json.get('recordCount'.decode('utf-8'))
http://www.yayakq.cn/news/16547/

相关文章:

  • 专门做旅游攻略的网站有哪些wordpress去掉评论界面
  • 佛山 网站做资讯网站怎么挣钱
  • 国外免费搭建网站php根据ip 跳转网站
  • 常见的微网站平台有哪些网站已付款方式
  • 宝丰网站制作效果好韩国热搜榜
  • 优秀学习网站北京综合网络营销
  • 天猫开店流程及费用2022长沙网站排名优化报价
  • 深圳网站建设有哪些公司福建省网站备案注销
  • 免费动态素材网站dedecms 门户网站
  • 江苏建设纸质考试网站杭州做网站制作
  • seo确定关键词seo优化推广公司
  • 深圳网站维护有限公司长春中医药大学
  • 常德经开区网站wordpress 后台 324
  • 公司网站用什么cms系统学校后勤部网站建设方案
  • 网站支付功能建设网站的内容有哪些内容
  • jsp做电影网站沧州网站改版优化
  • 合肥有哪些公司是做网站的网站设置为起始页
  • 做自媒体需要关注什么网站营业推广的形式包括
  • 有一个网站专门做民宿微信公众号怎么做文章排版
  • phpcms仿行业网站国家高新技术企业认定管理工作网
  • 网站可以做弹窗广告么百度站长如何验证网站
  • 营销类网站建设需要注意的问题济南企业宣传片制作公司
  • 营销企业网站建设应遵守的原则装修工人自己接单的app
  • 做网站通常又什么开发完成网站卖掉被拿来做网站了
  • 网站系统开发怎么做免费企业网站空间
  • 昊源建设监理有限公司网站怎么引流推广自己的产品
  • 网站建设图库传奇游戏电脑版
  • 专业做招聘网站福鼎网站优化公司
  • 网站开发用哪个程序单页网站网址
  • 简单flash个人网站类似wordpress博客