当前位置: 首页 > news >正文

标准企业网站开发合同手机网站设计制作服务

标准企业网站开发合同,手机网站设计制作服务,gateface做网站,虚拟主机建设二个网站爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP # -*- coding: utf-8 -*- """…

爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)print(proxy_list)if __name__=='__main__':get_proxy(1)

这段代码是爬取第一页,仅仅做个示范,大家可以在下面写个for循环,多爬几页也是可以的,来看看输出结果:

接下来来看看刚才做的IP池能不能用,或者说效率怎么样。测试网站http://httpbin.org/ip,话不多说上代码:

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
import time
import random
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)return proxy_listdef proxy_read(proxy_list,i):proxy = proxy_list[i]print('当前IP为:{}'.format(proxy))sleep_time = random.randint(1,3)print('等待{}秒'.format(sleep_time))time.sleep(sleep_time)print('开始测试')proxy_jj = urllib.request.ProxyHandler({'http':proxy})opener = urllib.reequest.build_opener(proxy_jj,urllib.request.HTTPHandler)urllib.request.install_opener(opener)try:html = urllib.request.urlopen('http://httpbin.org/ip')rhtml = html.read()print(rhtml)except Exception as e:print(e)print('-------IP不能用------')if __name__=='__main__':proxy_list = get_proxy(1)print('开始测试')for i in range(100):proxy_read(proxy_list,i)

结果如上图,总得来说,代码很简单,好啦,end啦,下一篇文章‘用xpath打造免费IP池‘。敬请期待

http://www.yayakq.cn/news/54479/

相关文章:

  • 山东网站搭建有限公司wordpress用户登入界面
  • 网站开发方式邢台信息港欢迎您
  • 最便宜的网站建设百度关键词推广条件
  • 成都什么是网站建设从网上怎么做网站营销
  • 云南网站公司现代建设中国公司网站
  • 推广 广州网站建设公司中国互联网协会12321举报中心
  • 临汾建设局官方网站网络云网站
  • 专门做网站的软件广东网站搭建
  • 企业网站建设哪家好挣钱最快的小游戏
  • 自助建站网站建设设计公司搜狐酒业峰会
  • wordpress搭建电影网站免费空间备案
  • 弱电网站源码营销型网站盈利方案
  • 广州优俊网站制作公司电商网站春节放假通知
  • aso应用商店优化原因结构优化
  • 网站 空间 购买免费模板最多的视频制作软件
  • 泉州哪里有搭建网站的公司全球设计师
  • 专业网站建设公司首选网页无法访问 wordpress
  • 可信网站验证服务定制旅游网站建设成都
  • 高端网站建站公司能交易的网站多少钱
  • 烟台企业网站建设公司梦织系统好还是wordpress好
  • 能赚钱的网站怎么做国内logo设计网站
  • 广州增城区门户网站百度只更新快照不收录网站
  • 医院网站 功能东莞手机网站价格便宜
  • 手机域名注册网站科技节小发明小制作
  • 网站的开发环境论文做盗版小说网站犯法吗
  • 全面的网站建设做网站什么前端框架方便
  • 为什么要网站建设小程序搭建挣钱
  • 佛山英文网站建设网站建设-上寻模板
  • 建设网站的 成本无锡滨湖住房与城乡建设局网站
  • 青岛seo网站推广做网站用asp好吗