当前位置: 首页 > news >正文

大连网站建设运营wordpress源代码在哪里

大连网站建设运营,wordpress源代码在哪里,跨境电商网站建设流程成都市公服,做地方分类信息网站需要什么资质吗文章目录 一、爬取目标二、环境准备三、代理IP获取3.1 爬虫和代理IP的关系3.2 巨量IP介绍3.3 超值企业极速池推荐3.4 IP领取3.5 代码获取IP 四、爬虫代码实战4.1分析网页4.2 寻找接口4.3 参数构建4.4 完整代码 一、爬取目标 本次目标网站:百度翻译(http…

文章目录

  • 一、爬取目标
  • 二、环境准备
  • 三、代理IP获取
    • 3.1 爬虫和代理IP的关系
    • 3.2 巨量IP介绍
    • 3.3 超值企业极速池推荐
    • 3.4 IP领取
    • 3.5 代码获取IP
  • 四、爬虫代码实战
    • 4.1分析网页
    • 4.2 寻找接口
    • 4.3 参数构建
    • 4.4 完整代码

一、爬取目标

本次目标网站:百度翻译(https://fanyi.baidu.com/),输入一个关键词后返回翻译结果:

二、环境准备

Python:3.10

编辑器:PyCharm

第三方模块,自行安装:

pip install requests # 网页数据爬取

三、代理IP获取

由于百度翻译限制很严,为了能正常获取数据这里必须使用到代理IP。

3.1 爬虫和代理IP的关系

爬虫和代理IP之间的关系是相互依存的。代理IP为爬虫提供了绕过IP限制、隐藏真实IP、提高访问速度等能力,使得爬虫能够更有效地进行数据抓取。然而,在使用时也需要注意合法性、稳定性、成本以及隐私保护等问题。

3.2 巨量IP介绍

巨量IP提供免费HTTP代理IP和长效静态IP、短效IP、动态IP代理、隧道代理等服务,支持按时、按量、按时按量3种计费方式,根据业务场景需求,让套餐的选择变得更灵活:巨量IP官网

3.3 超值企业极速池推荐

博主经常写爬虫代码使用的是巨量IP家的企业极速池,每日500万去重IP,单IP低至0.005元 (按量计费),并且充值加赠50%,不得不说真的很香:

经常使用爬虫的小伙伴推荐使用IP时效:1分钟的套餐性价比超高。

3.4 IP领取

巨量IP还提供每日1000个免费IP供大家使用:代理IP免费领取

3.5 代码获取IP

1、点击产品管理找到我们 购买或者领取 的套餐:

2、将自己电脑的IP添加为白名单能获取代理IP,点击授权信息:

3、依次点击修改授权》快速添加》确定

4、添加完成后,点击生成提取链接:

5、设置每次提取的数量,点击生成链接,并复制链接:

6、将复制链接,复制到地址栏就可以看到我们获取到的代理IP了:

7、代理获取IP(注意:下面url需要换成你的链接):

import requests
import time
import randomdef get_ip():url = "这里放你自己的API链接"while 1:try:r = requests.get(url, timeout=10)except:continueip = r.text.strip()if '请求过于频繁' in ip:print('IP请求频繁')time.sleep(1)continuebreakproxies = {'https': '%s' % ip}return proxiesif __name__ == '__main__':proxies = get_ip()print(proxies)

获取成功:

四、爬虫代码实战

4.1分析网页

在翻译栏左侧输入内容,并不需要刷新网页,翻译结果可实时返回,说明该翻译网站为进行Ajax加载的网站:

Ajax(Asynchronous JavaScript and XML)是一种在无需重新加载整个网页的情况下,能够更新部分网页内容的技术。它通过在后台与服务器交换数据,并允许网页异步更新,从而提升了用户体验。

4.2 寻找接口

1、鼠标右击》检查》选择XHR,输入翻译内容,找到对应的翻译接口:

2、找到接口网址(https://fanyi.baidu.com/sug)和请求方式(Post请求):

3、可以看到携带的参数就是我们输入的内容:

4.3 参数构建

下面代码构建一个携带参数的post请求:

# 1. 百度接口链接  
post_url = 'https://fanyi.baidu.com/sug'  
# 2. 创建post请求携带的参数,将手动输入需要翻译的单词传进去  
data = {  
'kw': kw  
}  
# 3. 携带请求头  
headers = {  
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 Edg/111.0.1661.51'}  
# 使用post 请求(和get类似)  
data_json = requests.post(url=post_url, data=data, headers=headers).json()

4.4 完整代码

注意下面代码需要修改 get_ip() 函数中 url 添加你自己的代理IP接口url(防止被识别到为爬虫):

import requests
import timedef get_ip():url = "这里换成自己的代理IP接口url"while 1:try:r = requests.get(url, timeout=10) #except:continueip = r.text.strip()if '请求过于频繁' in ip:print('IP请求频繁')time.sleep(1)continuebreakproxies = {'https': '%s' % ip}return proxiesdef get_data(kw):# 1. 百度接口链接post_url = 'https://fanyi.baidu.com/sug'# 2. 创建post请求携带的参数,将手动输入需要翻译的单词传进去data = {'kw': kw}# 3. 携带请求头headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 Edg/111.0.1661.51'}# 4. 获取代理IPproxies = get_ip()# 使用post 请求data_json = requests.post(url=post_url, data=data, headers=headers,proxies=proxies).json()# print(data_json)for key in data_json['data'][0]:print(key, data_json['data'][0][key])def main():while True:# 手动输入需要翻译的单词kw = input("请输入需要翻译的单词:")get_data(kw)if __name__ == '__main__':main()

可以看到中文翻译为英文,英文翻译为中文都可以轻松实现:

http://www.yayakq.cn/news/729123/

相关文章:

  • 神州顺利办深一做网站使用session和cookie实现网站自动登录 .net
  • 网站首页flash模板帝国企业网站源码
  • 河南网站建设优化技术做外卖在哪个网站做好
  • 网站备案ip查询网站前端学校网站开发视频教程
  • 可以做软件的网站有哪些内容南阳专业网站制作费用
  • 海口仿站定制模板建站html5网站带后台
  • 巴中网站建设网站推广网站页面设计 8种常见的网站版面布局形式
  • 罗湖做网站运营乐云seowordpress+中文安装
  • 儿童做网站江西吉安建设监督网站
  • 做百度快照要先有网站吗科技股
  • 网页与网站设计实验总结游戏制作软件手机版下载
  • 商务网站业务流程wordpress导出全站链接
  • 亚马逊网网站建设规划报告假电影网站做注册
  • 织梦古典网站模板网络工程解决方案公司
  • vps看网站蜘蛛酒店网站的规划与建设方案
  • 肇庆有哪家做企业网站的长沙seo公司
  • 帮客户做网站挣钱吗舆情分析招聘
  • 网站分辨率建设个人信息网站
  • 网站建设简介淄博做网站工资高么
  • 网站制作公司的流程福建建筑人才服务中心
  • 个人网站怎么建立步骤网站头部固定
  • 免费生成网址白帽seo公司
  • 淄博网站建设高端企业做网站配什么电脑
  • 网站地图网页的制作深圳外网站建设
  • 好看的网站页面设计河南建设资格执业网站
  • 诸暨网站建设东莞企业网站价格
  • 长沙高端网站建设服务器seo对各类网站的作用
  • 苏州网站开发网站建立费用如何做好产品网络推广
  • 网站开发算固定资产厦门网站快速排名优化
  • 学校网站建设的技术方案wordpress html5音乐播放器