当前位置: 首页 > news >正文

广州技术支持 奇亿网站建设网站建设那家公司好

广州技术支持 奇亿网站建设,网站建设那家公司好,wordpress配置网页出现404错误,怎么建设宣传网站对于新手做Python爬虫来说是有点难处的,前期练习的时候可以直接套用模板,这样省时省力还很方便。 使用Python爬取某网站的相关数据,并保存到同目录下Excel。 直接上代码: import re import urllib.error import urllib.request…

对于新手做Python爬虫来说是有点难处的,前期练习的时候可以直接套用模板,这样省时省力还很方便。

使用Python爬取某网站的相关数据,并保存到同目录下Excel。

直接上代码:

import re
import urllib.error
import urllib.requestimport xlwt
from bs4 import BeautifulSoupdef main():baseurl ="http://jshk.com.cn"datelist = getDate(baseurl)savepath=".\jshk.xls"saveDate(datelist,savepath)# askURL("http://jshk.com.cn/")findlink = re.compile(r'<a href="(.*?)">')
findimg = re.compile(r'<img.*src="(.*?)"',re.S)
findtitle = re.compile(r'<span class="title">(.*)</span')
findrating = re.compile(r'<span class="rating_num" property="v:average">(.*)</span')
findjudge = re.compile(r'<span>(d*)人评价</span>')
findinq= re.compile(r'<span class="inq">(.*)</span>')def getDate(baseurl):datalist =[]for i in range(0,10):url=baseurl+str(i*25)html=askURL(url)soup = BeautifulSoup(html,"html.parser")for item in soup.find_all('div',class_="item"):data = []item = str(item)link = re.findall(findlink,item)[0]data.append(link)img=re.findall(findimg,item)[0]data.append(img)title=re.findall(findtitle,item)[0]rating=re.findall(findrating,item)[0]data.append(rating)judge=re.findall(findjudge,item)[0]data.append(judge)inq=re.findall(findinq,item)if len(inq)!=0:inq=inq[0].replace("。","")data.append(inq)else:data.append(" ")print(data)datalist.append(data)print(datalist)return datalistdef askURL(url):head = { "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36"}request=urllib.request.Request(url,headers=head)html=""try:response=urllib.request.urlopen(request)html=response.read().decode("utf-8")# print(html)except urllib.error.URLError as e:if hasattr(e,"code"):print(e.code)if hasattr(e,"reason"):print(e.reason)return htmldef saveDate(datalist,savepath):workbook = xlwt.Workbook(encoding='utf-8')worksheet = workbook.add_sheet('电影',cell_overwrite_ok=True)col =("电影详情","图片","影片","评分","评价数","概况")for i in range(0,5):worksheet.write(0,i,col[i])for i in range(0,250):print("第%d条" %(i+1))data=datalist[i]for j in range(0,5):worksheet.write(i+1,j,data[j])workbook.save(savepath)if __name__ == '__main__':main()print("爬取完毕")

直接复制粘贴就行。

若要更改爬取网站,则需要更改URL以及相应的html格式(代码中的“item”)。

http://www.yayakq.cn/news/672786/

相关文章:

  • 下载的网站模板怎么改福田网站建设课程考试
  • wordpress怎么添加目录公司网站手工优化怎么做
  • 网站建设培训心得学院网站建设 好处
  • 校园网站如何建立做网站用asp还是php
  • 网站的布局方式有哪些fullpage.js wordpress
  • 绍兴建设企业网站中铁建设门户网入口
  • 扁平设计网站如何做期货培训网站
  • 海外网站推广方法网络优化面试问题
  • 沈阳世纪兴网站建设安庆网页设计培训
  • 网站开发公司网站模板免费创建自己的网站
  • 网站程序授权码设计类专业前景
  • 潍坊网站搜索引擎优化h5网站显示的图标怎么做
  • 做网站要注意哪些方面移动端网站开发语言
  • 网站建设倒计时苏州做网站外包的公司有哪些
  • 东莞网站建设方案咨询我要做网店官网
  • 专业的聊城网站建设上海企业网站推广方法
  • 郑州做网站推广地国际域名注册费用
  • 网站建设实践报告心得临沂做公司网站
  • 毕设做网站可能遇到的问题网站搜索引擎优化建议
  • 湛江专业建站网站类型有
  • 专业网站制作哪家强公司网站制作要
  • 做网站外包创业网络营销有哪些推广方式
  • 网站建设人才做移动网站开发
  • php做的网站预览房地产市场调查问卷
  • 郑州做手机网站建设公司网站免费申请
  • 电子商务网站建设 臧良运 好不好网站流量数据
  • 开鲁网站seo免费版男女做那个什么的视频网站
  • 上海网站建设哪家强在工商局网站怎么做清算
  • 手机版网站打开速度慢做性视频网站有哪些
  • 做商品网站数据库有哪些网站建设 市场规模