当前位置: 首页 > news >正文

番禺南村网站建设如何让网站自适应屏幕

番禺南村网站建设,如何让网站自适应屏幕,线上营销和线下营销,自己开公司 自己做网站7篇Python爬虫实例,可直接运行,适合收藏 python爬虫7篇实例,分七个文章进行发布;第二篇:爬取图片信息。 爬取图片信息,并将每张图片都下载下来。 爬虫主要三部分: 1、获取数据 2、数据解析 3、…

7篇Python爬虫实例,可直接运行,适合收藏

python爬虫7篇实例,分七个文章进行发布;第二篇:爬取图片信息。

  • 爬取图片信息,并将每张图片都下载下来。

爬虫主要三部分:
1、获取数据
2、数据解析
3、调用函数

  • 先上完整代码: 代码后面进行一步步解析。
import requests
from bs4 import BeautifulSoup
import osindex = range(2,5)
urls = []
for i in index:urls.append(f'https://pic.netbian.com/4kdongman/index_{i}.html')# https://pic.netbian.com/tupian/34851.html# 传入单个网页,获取网页上所有得图片链接
def craw_single_url(url):re = requests.get(url)re.encoding = 'gbk'soup = BeautifulSoup(re.text,'html.parser')pics_links = soup.find_all('img')links = []for link in pics_links:if 'uploads' not in link['src']:continuelinks.append(f'https://pic.netbian.com{link['src']}')return links# 传入图片链接,将图片下载到文件夹中
def imgs_download(links):for link in links:re = requests.get(link)pic_name = os.path.basename(link)with open(f'图片/{pic_name}','wb') as f:   # w : 写入 b : 二进制写入f.write(re.content)# 循环爬取的网页链接,将所有网页的 links 放入元组中
links = []
for url in urls:for link in craw_single_url(url):links.append(link)# 将所有的 link 图片下载下来
imgs_download(links)

1、获取数据

  • 该函数是获取该 url 链接下所有图片的链接
  • 函数返回值是:所有图片的链接
def craw_single_url(url):re = requests.get(url)          # 请求 urlre.encoding = 'gbk'             # gbk格式soup = BeautifulSoup(re.text,'html.parser')     # 创建一个 BeautifulSoup 对象,之后对其解析pics_links = soup.find_all('img')                       # 在soup 中找到 img 的链接links = []for link in pics_links:                                 # 循环每个链接if 'uploads' not in link['src']:                    # 判断是否正确的链接continuelinks.append(f'https://pic.netbian.com{link['src']}')   # 构建真正的图片链接return links

2、数据解析

  • 对获取到的图片 urls 进行解析
  • 循环 urls 下载图片到指定文件中
def imgs_download(links):                       # 下载图片函数for link in links:                          # 对传入图片链接进行循环re = requests.get(link)                 # 请求单个链接pic_name = os.path.basename(link)       # 获得图片的名字with open(f'图片/{pic_name}','wb') as f: # 打开 图片 文件夹进行写入 w : 写入 b : 二进制写入f.write(re.content)                 # 将图片保存到 图片 文件夹

3、进行调用

# 循环爬取的网页链接,将所有网页的 links 放入元组中
links = []              
for url in urls:                        # 循环每个页面for link in craw_single_url(url):   # 将每个页面得到的图片urls,放入 links列表   links.append(link)              # 放入 links列表   # 将所有的 link 图片下载下来
imgs_download(links)                    # 再调用 imgs_download 函数,对每张图片进行下载
http://www.yayakq.cn/news/943311/

相关文章:

  • 学习怎样建网站wordpress首页 插件
  • 设计师图库网站在线crm软件
  • 个人相册网站建设报告广西住房和城乡建设厅三类人员继续教育
  • 广东省 网站建站怎么破解wordpress主题
  • 聚美优品网站建设导向高端网站设计制作的
  • 网页制作人员培训课程网站优化有前途吗
  • 北京智联招聘官方网站做家政宣传海报模板
  • 建设银行网站转账网站keywords多少字
  • 淮安市建设厅网站快速制作网站
  • 手机上网自动跳转网站企业管理生产管理系统
  • 微商需要做网站吗360网站如何做引流
  • 国内免费网站空间wordpress还是shopify
  • 网站项目根据什么开发制作棋牌app软件要多少钱
  • 腾讯域名怎么做网站无极在线最新招聘信息兼职
  • 绵阳做网站小说网站自动采集
  • 原网站备案在哪wordpress插件补丁
  • 苏州做企业网站公司营销互联网推广公司
  • 江苏省住房和建设部网站首页网络服务提供商是指
  • 一流的苏州网站建设宁波网站推广软件哪家强些
  • 杭州营销网站制作龙华做棋牌网站建设哪家好
  • 网站怎样做百度推广计划网站设计论文答辩问题
  • 网站标题怎么做自学网站建设视频
  • 家庭农场做网站全国企业年报网上申报
  • 买房网站排名宝坻网站建设公司
  • 网站主题下载北京公司注册核名详细流程
  • 专业网站制作全包wordpress换了空间无法登录密码
  • 增城微信网站建设黄山网络推广哪家好
  • 大学生网站设计论文范文wordpress主题 设定
  • 网站更新文章首页不显示宁波网站建设怎么建设
  • 网站设计与网页制作在线徐州建设工程网上交易平台