当前位置: 首页 > news >正文

静态网站怎么做百度推广全国企业网查询信息官网

静态网站怎么做百度推广,全国企业网查询信息官网,wordpress 页面导航,网站域名的密码import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下&#xff…
import requestsurl = 'https://movie.douban.com/top250'
response = requests.get(url)
# 查看结果
print(response)

在这里插入图片描述

  在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下,不是说不可用就放弃了。爬虫时经常会遇到有些网站有反爬机制,为了能够请求成功该如何操作?那当然是把我们伪装成浏览器了!

  那么如何把自己伪装成浏览器代替我们发送请求呢?pycharm有个字典Headers,我们需要在浏览器中找到键User-Agent对应的值

User-Agent:对应的值包含了浏览器、操作系统的各项信息。如果没有User-Agent,就相当于赤裸裸的去访问对方服务器,只要对方有反爬虫机制,就能发现你是爬虫。

在浏览器中打开想要爬取的网站,右键 --> 检查然后如下图操作:

在这里插入图片描述

  也有的网站刷新后出现的项目很少,甚至点开没有User-Agent对应的值,但是有一个项目里面一定有 : 项目名跟网站地址很相近的项目中。例如在本例中名为www.zhihu.com的项目里一定含有。

  在以贝壳租房为例,打开网页后,右键 --> 检查,在项目名为zufang中一定含有User-Agent对应的值

在这里插入图片描述

获取键user-agent对应的值后,我们把键与值写入字典Headers中

import requests# 1. 浏览器伪装
url = 'https://movie.douban.com/top250'
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
}
# 获取响应结果
response = requests.get(url, headers=headers)
# 查看状态码
print(response.status_code)  # 200
# 获取网页源代码
# print(response.text)
http://www.yayakq.cn/news/662282/

相关文章:

  • 网站建设框架模板下载青海建设兵团青岛战友网站
  • 做盗版网站违法吗wordpress多余页面怎样删除
  • 自己做链接网站企业网站建设有没有模板
  • 2014年百度seo网站排名的详细优化因素统计wordpress调用文章调节每页数量
  • 建设明星网站的目的工作 网站建设内容
  • 华为网站开发流程服装设计在哪里可以学
  • 企业网站部署计划计算机毕设网站开发中期报告
  • 合肥哪里有做网站的.la域名做的网站
  • c 网站开发环境wordpress 爬虫 视频
  • 佛山网站建设与设计西安seo顾问
  • 遵义网站开发公司微网站如何做微信支付宝
  • 网站pv多少可以上海做产地证在哪个网站录入
  • 网站qq代码如何用网页制作网站
  • 用flash做的经典网站广州seo网站策划
  • 东莞市建设安监局网站免费推广广告链接
  • 哪个网站使用vue 做的如何查看网站页面大小
  • 网站建设的卷子搜索关键词查询工具
  • 高端网站制造wordpress面向对象
  • 全民建站中国商标交易官网
  • 手机网站模板 商城哈尔滨市建设工程交易
  • 家教响应式网站网络营销推广公司网站有哪些
  • 二手房中介网站模板网站维护要多久时间
  • 网站开发建设用的软件做跨境的网站
  • 邯郸网站建设有哪些好的建站软件
  • 示范高职建设网站郑州旅游网站设计
  • 做视电影网站赚钱吗信息技术九年级上册网站咋做
  • 备用网站域名体育论坛网站建设
  • 德州网站建设的公司移动互联网应用技术
  • 重庆网站整合营销云南政务网站建设
  • 广州网站优化网站房地产找客源10个方法