当前位置: 首页 > news >正文

建站之星怎么收费网站阶段推广计划

建站之星怎么收费,网站阶段推广计划,wordpress软件商城,封丘县建设银行网站在DangSpider类中设置一个基础url base_url http://category.dangdang.com/pg page 1在parse方法中 # 每一页的爬取逻辑都是一样的&#xff0c;所以只需要执行每一页的请求再次调用parse方法就可以了if self.page < 100:self.page 1url self.base_url str(self.page)…
  1. 在DangSpider类中设置一个基础url
base_url = 'http://category.dangdang.com/pg'
page = 1
  1. 在parse方法中
# 每一页的爬取逻辑都是一样的,所以只需要执行每一页的请求再次调用parse方法就可以了if self.page < 100:self.page += 1url = self.base_url + str(self.page) + '-cp01.01.07.00.00.00.html'# 调用parse方法# scrapy.Request就是scrapy的get请求# url就是请求地址 callback就是要执行的那个函数  注意不要加()yield scrapy.Request(url=url, callback=self.parse)

完整的dang.py

import scrapy
from ..items import ScrapyDangdang39Itemclass DangSpider(scrapy.Spider):name = "dang"allowed_domains = ["category.dangdang.com"]start_urls = ["http://category.dangdang.com/cp01.01.07.00.00.00.html"]base_url = 'http://category.dangdang.com/pg'page = 1def parse(self, response):# 所有的seletor的对象,都可以再次调用xpath方法li_list = response.xpath('//div[@id="search_nature_rg"]//li')for li in li_list:# 获取图片src = li.xpath('.//img/@data-original').extract_first()# 第一张图片和其他图片的标签的属性不一样# 第一张图片的src是可以使用的,其他图片的地址在data-original里if src:src = srcelse:src = li.xpath('.//img/@src').extract_first()# 获取名字name = li.xpath('.//img/@alt').extract_first()# 获取价格price = li.xpath('.//p[@class="price"]/span[1]/text()').extract_first()book = ScrapyDangdang39Item(src=src, name=name, price=price)# 获取一个book就将book传递给pipelinesyield book# 每一页的爬取逻辑都是一样的,所以只需要执行每一页的请求再次调用parse方法就可以了if self.page < 100:self.page += 1url = self.base_url + str(self.page) + '-cp01.01.07.00.00.00.html'# 调用parse方法# scrapy.Request就是scrapy的get请求# url就是请求地址 callback就是要执行的那个函数  注意不要加()yield scrapy.Request(url=url, callback=self.parse)
http://www.yayakq.cn/news/443747/

相关文章:

  • 济南网站制作费用文化体育局网站建设
  • 建设银行网站证书一级做ae视频直播可以吗多少钱
  • 合肥网站建设多少钱做任务佣金的网站
  • wordpress微官网长春网站建设推广优化
  • 微网站 百度地图seo全网营销公司
  • 无锡做网站企业linux 如何做网站
  • 网站建设和维护工作总结想做网站找什么公司
  • 遵义市做网站的地方wordpress mu 博客群
  • 网站前台功能模块介绍wordpress变慢了
  • 自学网站有哪些自学网中国正规现货交易平台
  • 顺德企业网站制作哪个网站做外单出口好
  • 深圳网站建设 联雅建设网站的网站
  • 做网站的技巧游戏网页版在线玩入口
  • 西安装修一平米大概多少钱南阳网站seo公司
  • 网上书城网站开发说明书旅游包车网站最新模板
  • 网站登录设计欣赏2022年小学生新闻摘抄十条
  • 魔兽世界 建设公会网站医疗器械公司排名
  • 电商网站设计图片全国网页设计大赛
  • 东台做淘宝网站wordpress做门户怎么样
  • 好的漂亮的淘宝客网站wordpress主题 Grace
  • 企业网站主页设计模板电子商务网站建设毕业设计
  • wordpress前台登录框烟台做网站优化哪家好
  • 南宁伯才网络公司做网站好吗wordpress支持广告播放器
  • 烟台建设集团招聘信息网站做的时间长的网站制作公司哪家好
  • 安卓网站开发ui营销型网站托管
  • 地产平面网站网页代理地址
  • 网页设计与网站开发方向移动网站推广如何优化
  • 金峰辉网站建设网站页面禁止访问
  • 外链收录网站网页开发平台
  • tp5企业网站开发黄山网站推广公司