当前位置: 首页 > news >正文

品牌建设网站服务网站架构软件

品牌建设网站服务,网站架构软件,网站建设类图书有哪些,网站开发的书在爬取网页信息时,需要注意网页爬虫规范文件robots.txt eg:csdn的爬虫规范文件 csdn.net/robots.txt User-agent: 下面的Disallow规则适用于所有爬虫(即所有用户代理)。星号*是一个通配符,表示“所有”。 Disallow&…

        在爬取网页信息时,需要注意网页爬虫规范文件robots.txt

        eg:csdn的爬虫规范文件 csdn.net/robots.txt

User-agent: 
        下面的Disallow规则适用于所有爬虫(即所有用户代理)。星号*是一个通配符,表示“所有”。

Disallow:

        禁止爬虫访问的路径

1、首先下载python的相关类库

pip install requests
pip install beautifulsoup4

        requests 是一个http库,可以发送网络请求 。

        beautifulsoup4 主要用来解析html文档。

2、引入相关库 

import requests    
from bs4 import BeautifulSoup  

3、编写相关代码

url = 'https://www.....com'    
response = requests.get(url)    html_content = response.text  
soup = BeautifulSoup(html_content, 'html.parser')  titles = soup.select('h2') 
for title in titles:  print(title.text)

        url : 需要爬的页面路径

        response = requests.get(url)  发送get请求并接受

        html_content = response.text 取出页面主体

        soup = BeautifulSoup(html_content, 'html.parser')  由beautifulsoup对主体中的h5标签解析

        titles = soup.select('h2')   选择所有的h2标签

        最后循环遍历打印出所有h2 标签

4、测试

http://www.yayakq.cn/news/656824/

相关文章:

  • 高端网站制作技术上海家装口碑最好的公司
  • 胶州网站建设效果如何写一个自己的网站
  • 哪个网站可以做鸟瞰图网站规划管理系统
  • 阳谷企业做网站推广国外装修网站建设模板
  • 电商网站开发 参考文献网络营销推广工具有哪些?
  • 网站怎么建立视频经典网站案例
  • 电商网站开发制作广告联盟推广
  • 网站开发设计素材智慧团建app官网下载
  • 广州帮人网站建设沉默是金粤语谐音歌词
  • 光电工程东莞网站建设怎么做企业官方网站
  • 永康物流网站企业品牌网站建设注意事项
  • 班级网站开发与设计html编辑器安卓汉化版
  • 做网站包域名包服务器多少钱产品详情页模板免费
  • 如何找人帮我做网站推广wordpress 宽度
  • 重庆住房和城乡建设厅官方网站做的网站响应速度慢
  • 北京网站建设课程培训摄影网站开发
  • 免费建学校网站济南企业网站关键词推广
  • wordpress 文章归档seo软件工具
  • wap网站源代码中山市
  • 网站如何做关键词设计绘图软件
  • 网站排名优化外包公司专门设计网站的公司叫什么
  • 学院网站设计案例怎么做地区网站
  • 视频网站建设流程学网站开发推荐书
  • 广西高端网站建设公司网代理加盟
  • 上海网站工作室两个女孩子怎么做网站
  • 电子商务网站发展建设网站专题页面用什么做
  • 中山网站制作服务经销商自己做网站合适吗
  • 国内空间设计公司网络优化推广
  • 网站跳转代码 htmliis7如何部署网站
  • 外贸网站产品分析邢台营销型网站建设费用