当前位置: 首页 > news >正文

注册新公司网上核名网站上海做网站报价

注册新公司网上核名网站,上海做网站报价,广州市住房 建设局网站,微信网页视频怎么下载本文是本人最近学习Python爬虫所做的小练习。如有侵权,请联系删除。 页面获取url 代码 import requests import os import re# 创建文件夹 path os.getcwd() /images if not os.path.exists(path):os.mkdir(path)# 当前页数 page 1 # 总页数 total_page 2# 自动…

本文是本人最近学习Python爬虫所做的小练习。如有侵权,请联系删除

页面获取url

在这里插入图片描述

代码


import requests
import os
import re# 创建文件夹
path = os.getcwd() + '/images'
if not os.path.exists(path):os.mkdir(path)# 当前页数
page = 1
# 总页数
total_page = 2# 自动翻页,获取全部数据
def get_data():global page, total_pagewhile page <= total_page:# 地址url = f"https://api.bilibili.com/pgc/season/index/result?st=1&order=3&season_version=-1&spoken_language_type=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&sort=0&page={page}&season_type=1&pagesize=20&type=1"# 请求头headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.3.1311 SLBChan/105',}# 发送请求response = requests.get(url, headers=headers)# json数据格式items = response.json()# 循环遍历for data in items['data']['list']:# 标题title = data.get('title')# 封面cover = data.get('cover')# 下载图片到images文件夹中,文件名:titleif title != '' and cover != '':download_image(title, cover)total = items.get('data')['total']size = items.get('data')['size']total_page = get_page_count(total, size)page += 1# 下载图片
def download_image(title, cover):# 请求头headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.3.1311 SLBChan/105',}res = requests.get(cover, headers=headers)# 判断标题是否含有\/:*?"<>|,文件命名不能含有这些,如果有,则用下划线_取代new_title = validateTitle(title)with open(path + '/' + new_title + '.jpg', mode='wb') as f:# 图片内容写入文件f.write(res.content)print(f"正在下载图片,图片名:{title}.jpg")# 去除文件中的非法字符(正则表达式)
def validateTitle(title):pattern = r"[\\\/\:\*\?\"\<\>\|]"new_title = re.sub(pattern, '_', title)return new_title# 求页数
def get_page_count(total, page):page_count = total // pageif total % page != 0:page_count += 1return page_countif __name__ == '__main__':get_data()

效果

在这里插入图片描述

在这里插入图片描述

http://www.yayakq.cn/news/282554/

相关文章:

  • 纯html5网站静态网站特点
  • 企业营销型网站seo推广做网站与全网营销搜索推广排名优化
  • 河南建设工程质量监督局网站阿勒泰建设局网站
  • 页面无法设置wordpress南宁seo优化公司
  • 做美食网站视频下载深圳注册公司怎么注册
  • 杭州大型网站建设枫林seo
  • 部门网站建设内容方案自己创建个人免费网站
  • 大丰区城乡和住房建设局网站盘锦网站开发公司
  • qt做网站服务器挖矿网站怎么做
  • 做国外营销型网站微商城微网站开发
  • 热卖平台网站怎么做网站开发的职业目标
  • 滁州市建设局网站西安最新出行政策
  • 参与网站网站建设做网站的标题图片
  • 做软件常用的网站有哪些软件有哪些wordpress 模板添加图片
  • 网站多久会被百度收录wordpress广告代码是什么
  • 毕业答辩问题怎么做的这个网站网站用图怎么做文件小质量高
  • 备案 网站下线深圳西丽网站建设公司
  • 大连网站前端制作公司山东诚祥建设集团公司网站
  • 做软件网站郑州联通网站备案
  • 如何建设公司网站信息苏州智能网站建设
  • 网站做2微码论坛式网站建设
  • 辽宁省住房和城乡建设厅证件查询搜索引擎优化的方法和技巧
  • 青白江建设网站会议响应式网站开发
  • 网站建设比赛三种常用的网站设计软件
  • 妇幼医院网站建设方案桓台网站建设
  • 皋兰网站建设平台遂溪手机网站建设
  • 利辛网站建设无限空间 网站
  • 网站建设佰首选金手指六vultr搭建wordpress
  • 长寿网站制作怎么做网站教程简单
  • 做网站交付标准企业邮箱登录