当前位置: 首页 > news >正文

dw可以做有后台的网站么?响应式网站制作

dw可以做有后台的网站么?,响应式网站制作,国外网站设计案例,化妆品网站建设目的1. scrapy的概念 Scrapy是一个Python编写的开源网络爬虫框架。它是一个被设计用于爬取网络数据、提取结构性数据的框架。 Scrapy 使用了Twisted[twɪstɪd]异步网络框架,可以加快我们的下载速度。 Scrapy文档地址:http://scrapy-chs.readthedocs.io/zh_…

1. scrapy的概念

Scrapy是一个Python编写的开源网络爬虫框架。它是一个被设计用于爬取网络数据、提取结构性数据的框架。

Scrapy 使用了Twisted['twɪstɪd]异步网络框架,可以加快我们的下载速度。

Scrapy文档地址:http://scrapy-chs.readthedocs.io/zh_CN/1.0/intro/overview.html

2. scrapy框架的作用

少量的代码,就能够快速的抓取

3. scrapy的工作流程

3.1 回顾之前的爬虫流程

在这里插入图片描述

3.2 上面的流程可以改写为

在这里插入图片描述

3.3 scrapy的流程

在这里插入图片描述

其流程可以描述如下:
  1. 爬虫中起始的url构造成request对象–>爬虫中间件–>引擎–>调度器
  2. 调度器把request–>引擎–>下载中间件—>下载器
  3. 下载器发送请求,获取response响应---->下载中间件---->引擎—>爬虫中间件—>爬虫
  4. 爬虫提取url地址,组装成request对象---->爬虫中间件—>引擎—>调度器,重复步骤2
  5. 爬虫提取数据—>引擎—>管道处理和保存数据
注意:
  • 图中中文是为了方便理解后加上去的
  • 图中绿色线条的表示数据的传递
  • 注意图中中间件的位置,决定了其作用
  • 注意其中引擎的位置,所有的模块之前相互独立,只和引擎进行交互
3.4 scrapy的三个内置对象
  • request请求对象:由url method post_data headers等构成
  • response响应对象:由url body status headers等构成
  • item数据对象:本质是个字典
3.5 scrapy中每个模块的具体作用

在这里插入图片描述

注意:
  • 爬虫中间件和下载中间件只是运行逻辑的位置不同,作用是重复的:如替换UA等

小结

  1. scrapy的概念:Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架
  2. scrapy框架的运行流程以及数据传递过程:
    1. 爬虫中起始的url构造成request对象–>爬虫中间件–>引擎–>调度器
    2. 调度器把request–>引擎–>下载中间件—>下载器
    3. 下载器发送请求,获取response响应---->下载中间件---->引擎—>爬虫中间件—>爬虫
    4. 爬虫提取url地址,组装成request对象---->爬虫中间件—>引擎—>调度器,重复步骤2
    5. 爬虫提取数据—>引擎—>管道处理和保存数据
  3. scrapy框架的作用:通过少量代码实现快速抓取
  4. 掌握scrapy中每个模块的作用:
    引擎(engine):负责数据和信号在不腰痛模块间的传递
    调度器(scheduler):实现一个队列,存放引擎发过来的request请求对象
    下载器(downloader):发送引擎发过来的request请求,获取响应,并将响应交给引擎
    爬虫(spider):处理引擎发过来的response,提取数据,提取url,并交给引擎
    管道(pipeline):处理引擎传递过来的数据,比如存储
    下载中间件(downloader middleware):可以自定义的下载扩展,比如设置代理ip
    爬虫中间件(spider middleware):可以自定义request请求和进行response过滤,与下载中间件作用重复

http://www.yayakq.cn/news/960964/

相关文章:

  • 系统开发外包邢台网站关键词优化
  • 企业网站建设技术广告公司海报用的易拉
  • 建设自己的二手房中介网站建设环境工程技术中心网站
  • 做暧暖爱视频网站舒城县建设局网站首页
  • 营销型网站传统网站嵌入式软件开发是青春饭吗
  • 中国建设银行杭州分行网站网页搜索软件
  • 管理案例网站半夜一分快三app推荐直播下载
  • 简单的招聘网站怎么做政务公开与网站建设
  • 怎么用链接进自己做的网站抚顺市+网站建设
  • 宝山网站建设 网站外包杭州做绒毛鉴定网站
  • 学做美食视频网站页面设计多少钱
  • 中国平湖首页规划建设局网站手机端网页开发工具
  • 中国最贵的域名交易seo综合查询工具有什么功能
  • asp 网站建设教程seo学徒培训
  • ps制作个人网站首页分析网站的外链
  • 网站数据没有更新建设六马路小学官方网站
  • 南通医院网站建设方案医药企业vi设计
  • 上海企业网站模板建站平台在线直播网站开发实战项目
  • 网站关键字怎么设置自己的电脑怎么做网站
  • 开设网站需要什么广州网络引流公司
  • 南昌网站建设排行岳阳网站界面设计
  • 河南省住房和城乡建设厅网站首页苏州网站建设搭建
  • 芜湖商城网站建设seo wordpress theme
  • 网站开发微信支付模板网站建设公司 东莞
  • iis 提示网站到期企业网络营销策划方案教程
  • 自己网站首页如何设置删除后台wordpress新闻
  • 网站页面自适应屏幕wordpress tag 转拼音
  • 静态网站源码wordpress 连接微信支付
  • 攻击网站方法台州网站设计飞速
  • 天津装修公司做网站网页设计实训总结500字