当前位置: 首页 > news >正文

自己做网站能否赚钱6湖南长沙关键词推广电话

自己做网站能否赚钱6,湖南长沙关键词推广电话,刷神马关键字排名软件,怎么做就一张图的网站scrapy模块是爬虫工作者最常用的一个模块之一,因它有许多好用的模板,和丰富的中间件,深受欢迎。 一,scrapy的安装 可以通过pypi的指引进行安装 在终端内输入以下代码: pip install scrapy 二,项目的建…

scrapy模块是爬虫工作者最常用的一个模块之一,因它有许多好用的模板,和丰富的中间件,深受欢迎。

一,scrapy的安装

可以通过pypi的指引进行安装

在终端内输入以下代码:

pip install scrapy

二,项目的建立

安装程序后,创建自己项目,在终端中输入以下代码

scrapy startproject yourprojectname

运行完成后,在终端中会提示你执行以下两个命令

需要依次执行

cd yourprojectname

创建你的爬虫模板 

scrapy genspider name name.com

name --根目录的名字, name.com --()域名

创建好之后,在pycharm中可以看到以下的目录:

在name.py中编写爬虫项目,name.py文件中会自带以下代码

import scrapyclass NameSpider(scapy.Spider):name = "name"start_urls = [url, url....]def parse(self, response):pass

其中name为爬取数据的名字,自定义。

此外还要加入要爬取的链接列表。

pase方法为爬取数据的逻辑

使用命令来启动爬虫程序(在终端运行以下代码)

scapy crawl name

也可新建一个文件,运行文件来启动爬虫程序,代码如下:

from scrapy import cmdlinecmdline.execute("scapy crawl name".split())

split()方法将其分割,因为在cmdline中是一个数组

也可将爬虫日志写入在文件中,避免输出在终端时,因终端可显示的长度有限,显示不完全。代码如下:

from scrapy import cmdlinecmdline.execute("scapy crawl name --logfile name.log".split())

爬取好的数据可以通过items.py文件中进行配置

将想要的数据进行保存

import scrapyclass HaodaifuItem(scrapy.Item):# define the fields for your item here like:# name = scrapy.Field()

存储的项目通过进入piplines.py文件中(pipelines.py在settings中默认不开启,需要手动开启 )

# Configure item pipelines
# See https://docs.scrapy.org/en/latest/topics/item-pipeline.html
# 项目管道
ITEM_PIPELINES = {"xxx.pipelines.Pipeline": 300,"xxx.pipelines.xxxPipeline":300,
}

pipslines.py文件中的项目名:数值

数值越小,优先级越高,越先启动,数值相同他们的启动顺序将是随机的,无法确定哪一个会先启动。在这种情况下,scrapy将根据实际情况来决定启动顺序。

http://www.yayakq.cn/news/196792/

相关文章:

  • 上海监理建设协会网站青岛崂山区网站建设
  • 杭州电商网站开发seo机构
  • 网站自己做的记者证erp管理软件开发公司
  • phpcms v9 实现网站搜索seo网站设计招聘
  • 做淘宝优惠网站步骤网页设计怎么做
  • 检查网站收录问题网站开发开题报告引言
  • 郑州艾特网站建设公司国外做仿牌网站
  • php5+mysql网站开发实例精讲推广产品引流的最佳方法
  • 网页网站免费wordpress可以做商城吗
  • 网站制作与网站建设pdf广东手机网站开发公司
  • 免费制作网站的平台在线代理网页浏览网站
  • 做网上购物网站网站免费优化工具
  • 如何做好网站建设的关键重点哔哩哔哩视频推广
  • app网站开发后台处理seo优化轻松seo优化排名
  • 百度网站的优缺点西安长安区建设局网站
  • 做电影网站如何买版权给我播放个免费的片
  • 网站建站wordpress深圳网站设计灵点网络公司不错
  • 期刊网站源码wordpress 文章访问次数
  • 龙华做网站天无涯网络wordpress 音乐自动播放
  • 做网站的域名是做什么用的网站内容策划书
  • 2008 iis 添加 网站 权限设置开发网站需要什么
  • 德州北京网站建设完整网站设计
  • 怎么添加网站权重招远网站设计
  • 眉山网站建设哪家好杭州网页设计制作
  • 网站改版活动整站快速排名优化
  • 乐清网站优化推广做直播网站的上市公司
  • 广州那家做网站最好互联网培训机构哪个好
  • 网站后缀org做企业推广的公司
  • 登陆工伤保险网站 提示未授权 怎么做用cms做个网站
  • 百度下拉框推广网站北京手机站建站