当前位置: 首页 > news >正文

网站建设多少钱一个一个做网站的软件

网站建设多少钱一个,一个做网站的软件,html网站更新,广州seo优化排名推广豆瓣电影Top250 豆瓣榜单简介需求描述Python实现 豆瓣榜单简介 豆瓣电影 Top 250 榜单是豆瓣网站上列出的评分最高、受观众喜爱的电影作品。这个榜单包含了一系列优秀的影片,涵盖了各种类型、不同国家和时期的电影。 需求描述 使用python爬取top250电影&#xff…

豆瓣电影Top250

  • 豆瓣榜单简介
  • 需求描述
  • Python实现

豆瓣榜单简介

  • 豆瓣电影 Top 250 榜单是豆瓣网站上列出的评分最高、受观众喜爱的电影作品。这个榜单包含了一系列优秀的影片,涵盖了各种类型、不同国家和时期的电影。

需求描述

  • 使用python爬取top250电影,获取相应电影排名,电影名,星级, 打分和评论人数信息,将信息输出到Excel表格中。

Python实现

  • 获取爬取网页
def download_all_htmls(index = list(range(0, 250, 25))):htmls = []for idx in index:url = f"https://movie.douban.com/top250?start={idx}&filter="print("craw html:", url)# 豆瓣具有反爬虫机制,添加headersheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}r = requests.get(url, headers = headers)if r.status_code != 200:raise Exception("error")htmls.append(r.text)return htmls
  • 解析得到单个网页内容
def parse_single_heml(html):soup = BeautifulSoup(html, 'html.parser')article_items = soup.find('div', class_='article')\.find('ol', class_='grid_view')\.find_all('div', class_='item')datas = []for article_item in article_items:rank = article_item.find('div', class_='pic').find('em').get_text()info = article_item.find('div', class_='info')title = info.find('div', class_='hd').find('span', class_='title').get_text()stars = info.find('div', class_='bd').find('div', class_='star').find_all('span')rating_star = stars[0]["class"][0]rating_num = stars[1].get_text()comments = stars[3].get_text()datas.append({'rank': rank,'title': title,'rating_star': rating_star.replace("rating","").replace("-t",""),'rating_num': rating_num,'comments': comments.replace("人评价", "")})return datas
  • 爬取相关内容,并将结果写入Excel
import requests
from bs4 import BeautifulSoup
import pandas as pd
import pprint
import jsonhtmls = download_all_htmls()
all_datas = []
for html in htmls:all_datas.extend(parse_single_heml(html))
df = pd.DataFrame(all_datas)
df.to_excel("practice03_豆瓣电影top250.xlsx", index=False)
  • 结果展示
    在这里插入图片描述
http://www.yayakq.cn/news/343042/

相关文章:

  • 未来做哪些网站能致富青岛一地发布重要公告
  • 网站建立失败的原因是数字营销技术应用
  • 网站开发速成班宣传片拍摄手法
  • 电商网站建设模板wordpress留言插件
  • 生物学特色网站建设seo网站结构
  • c 网站开发案例大全网站开发注意的事项
  • 荆门做微信公众号的网站如何用手机制作手机app
  • 谷歌网站收录提交网页源码在线查看
  • 做单网站温州公司网站建设
  • 可口可乐网站建设的目的南宁建设集团招聘信息网站
  • 网站建设大赛海报建设网站主机免费的怎么下载
  • 北京网站建设哪家好天中小企业名录
  • wordpress 主题授权济宁网站建设 优化培训
  • 免费代理上网网站中山网站只设计
  • 三水网站制作合肥网站设计高端公司
  • 国内做的好看的网站微网站 html5
  • 怎么做网站广告苏州app制作
  • 东莞营销网站建设哪家好做第三方网站注意什么意思
  • 网站建设 连云港网站建设服务标准
  • 网站怎么做发送邮件的超链接网站空间续费一年多少钱
  • 西安 网站建设 培训班装修公司走心文案
  • 深圳网站推广哪家好有没有做推广的平台
  • 网站源码超市四川法制建设网站
  • 怎么做资源网站联合建设官方网站
  • 怎么建立一个网站推广重庆seo网站设计
  • 商城网站前端更新商品天天做吗wordpress 去掉发布者
  • 做时时的网站研发一个app费用
  • 桓台网站建设公司网站托管套餐
  • 电商应该怎么做如何从零做起潍坊网站的优化
  • 辽宁网站建设推广哪家便宜企业建设网站的比例