当前位置: 首页 > news >正文

做跨境电商有没推荐的网站百度网站的域名地址

做跨境电商有没推荐的网站,百度网站的域名地址,手机端网站怎么做seo,商品展示型网站有哪些import requestsurl https://movie.douban.com/top250 response requests.get(url) # 查看结果 print(response)在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下&#xff…
import requestsurl = 'https://movie.douban.com/top250'
response = requests.get(url)
# 查看结果
print(response)

在这里插入图片描述

  在requests使用一文中我们有讲到,当状态码不是200时表示爬虫不可用,也就是说我们获取不到网页源代码。但是我们还是可以挣扎一下,不是说不可用就放弃了。爬虫时经常会遇到有些网站有反爬机制,为了能够请求成功该如何操作?那当然是把我们伪装成浏览器了!

  那么如何把自己伪装成浏览器代替我们发送请求呢?pycharm有个字典Headers,我们需要在浏览器中找到键User-Agent对应的值

User-Agent:对应的值包含了浏览器、操作系统的各项信息。如果没有User-Agent,就相当于赤裸裸的去访问对方服务器,只要对方有反爬虫机制,就能发现你是爬虫。

在浏览器中打开想要爬取的网站,右键 --> 检查然后如下图操作:

在这里插入图片描述

  也有的网站刷新后出现的项目很少,甚至点开没有User-Agent对应的值,但是有一个项目里面一定有 : 项目名跟网站地址很相近的项目中。例如在本例中名为www.zhihu.com的项目里一定含有。

  在以贝壳租房为例,打开网页后,右键 --> 检查,在项目名为zufang中一定含有User-Agent对应的值

在这里插入图片描述

获取键user-agent对应的值后,我们把键与值写入字典Headers中

import requests# 1. 浏览器伪装
url = 'https://movie.douban.com/top250'
headers = {'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36'
}
# 获取响应结果
response = requests.get(url, headers=headers)
# 查看状态码
print(response.status_code)  # 200
# 获取网页源代码
# print(response.text)
http://www.yayakq.cn/news/504843/

相关文章:

  • 哪个网站可以找设计师做设计师交易所开发深圳网站制作
  • 建站为应用技术济南环保行业网站开发
  • 网站做app开发小程序制作难吗
  • 风格 特别的网站php 数据库转wordpress
  • 雨花台网站建设图书馆建设网站需要哪些费用
  • 电子商务网站建设与管理学习心得笑傲网站建设
  • 网站有二维码吗优化网站界面的工具
  • 广州手机网站建设费用上海网站设计专注乐云seo
  • 网站统计分析工具的主要功能阿里企业邮箱电话
  • 政务网站安全建设工作计划沈阳做网站需要多少钱
  • 医药电商网站建设什么是电子商务专业?
  • 盱眙网站建设网络营销seo招聘
  • 网站建设费算费用还是固定资产国外做旅游攻略的网站
  • 网站的分享按键文化企业网站模板
  • 枣庄手机网站建设公司网络工程专业毕业设计论文
  • 免费建网站最新视频教程网站运营难做嘛
  • 网站主机的类型福州专业建站
  • 自建网站公司网络营销的优势有哪些?
  • 电商网站开发定制长沙seo运营
  • 做网站做手机站还是自适应站给网站人做网站
  • 商业网站网站建设网站开发账务处理
  • 自己做代练网站自己做网站可行吗
  • 企业建站域名无锡网络优化推广公司
  • 网站外链优化方法网页设计实验报告模板
  • 手机端网站开发价格做的网站修改编码
  • 建仿网站室内设计学徒
  • sketch代替ps做网站指数基金怎么选
  • 无锡正规网站建设没有备案的网站怎么做淘宝客
  • 网站用什么做备份网站超链接怎么做 word文档
  • 免费网站建设怎样北京网站设计案例