当前位置: 首页 > news >正文

万网做网站顺序本地服务网站开发

万网做网站顺序,本地服务网站开发,深圳市招投标信息网,潍坊网站建设小程序本文是本人最近学习Python爬虫所做的小练习。如有侵权,请联系删除。 页面获取url 代码 import requests import os import re# 创建文件夹 path os.getcwd() /images if not os.path.exists(path):os.mkdir(path)# 当前页数 page 1 # 总页数 total_page 2# 自动…

本文是本人最近学习Python爬虫所做的小练习。如有侵权,请联系删除

页面获取url

在这里插入图片描述

代码


import requests
import os
import re# 创建文件夹
path = os.getcwd() + '/images'
if not os.path.exists(path):os.mkdir(path)# 当前页数
page = 1
# 总页数
total_page = 2# 自动翻页,获取全部数据
def get_data():global page, total_pagewhile page <= total_page:# 地址url = f"https://api.bilibili.com/pgc/season/index/result?st=1&order=3&season_version=-1&spoken_language_type=-1&area=-1&is_finish=-1&copyright=-1&season_status=-1&season_month=-1&year=-1&style_id=-1&sort=0&page={page}&season_type=1&pagesize=20&type=1"# 请求头headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.3.1311 SLBChan/105',}# 发送请求response = requests.get(url, headers=headers)# json数据格式items = response.json()# 循环遍历for data in items['data']['list']:# 标题title = data.get('title')# 封面cover = data.get('cover')# 下载图片到images文件夹中,文件名:titleif title != '' and cover != '':download_image(title, cover)total = items.get('data')['total']size = items.get('data')['size']total_page = get_page_count(total, size)page += 1# 下载图片
def download_image(title, cover):# 请求头headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 SLBrowser/9.0.3.1311 SLBChan/105',}res = requests.get(cover, headers=headers)# 判断标题是否含有\/:*?"<>|,文件命名不能含有这些,如果有,则用下划线_取代new_title = validateTitle(title)with open(path + '/' + new_title + '.jpg', mode='wb') as f:# 图片内容写入文件f.write(res.content)print(f"正在下载图片,图片名:{title}.jpg")# 去除文件中的非法字符(正则表达式)
def validateTitle(title):pattern = r"[\\\/\:\*\?\"\<\>\|]"new_title = re.sub(pattern, '_', title)return new_title# 求页数
def get_page_count(total, page):page_count = total // pageif total % page != 0:page_count += 1return page_countif __name__ == '__main__':get_data()

效果

在这里插入图片描述

在这里插入图片描述

http://www.yayakq.cn/news/120880/

相关文章:

  • 公司网站模板免费版做访问量高的网站
  • 建公司网站要多久wordpress搭二级菜单404
  • 网站设计套用模板网站的建立过程
  • 兰陵住房建设局网站wordpress如何上传到服务器
  • 电子商务网站策划书布局设计有哪些网站可以做全景效果图
  • 网站建设方面书籍免费推广手段
  • 凡科建站怎么收费不同类型网站
  • 旅游营销的网站建设wordpress 前端图片上传
  • asp网站授权码如何做vps上的网站运行太慢
  • 网站开发遇到的难题好的产品设计网站
  • 做城市网站的标语做网站毕设任务书
  • 玉环做网站有哪些网站地址栏
  • 哪个网站做的简历最好小红书怎么推广
  • 南阳做网站seo的seo知识培训
  • 电子商务网站建设文档企业公司有哪些
  • 商城网站建设缺点域名里可以建网站
  • 桐乡 网站建设最全的百度网盘搜索引擎
  • 广州和信建设公司网站做网站卖东西流程
  • 教育平台网站可信网站认证
  • 各网站网络营销产品价格策略南京平面设计师联盟
  • 建站系统破解源码凡科做网站有什么用
  • 二次元网站开发的意义Wordpress 十大
  • 服务器做网站好吉林长春建设工程信息网站
  • 朝阳网站建设 慈云寺深圳乐安居网站谁做的
  • 网站开发的职位要求凉州区住房和城乡建设局网站
  • 模板网站建设 百度wordpress修改文字大小
  • 做视频周边的网站网站建设的作业模板
  • 莆田有哪些网站建设公司奇月网络官方网站
  • 购物手机网站怎么做发不了软文的网站怎么做关键词优化
  • 网站设计咨询网站淄博营销网站建设