当前位置: 首页 > news >正文

做网站要注册商标第几类如何自行建设网站

做网站要注册商标第几类,如何自行建设网站,成都建站模板公司,网站建设语录简单爬取历史房价 需求 爬取的网站汇聚数据的城市房价 https://fangjia.gotohui.com/ 功能 选择城市 https://fangjia.gotohui.com/fjdata-3 需要爬取年份的数据,等等 https://fangjia.gotohui.com/years/3/2018/ 使用bs4模块 使用bs4模块快速定义需要爬取的…

简单爬取历史房价


需求

爬取的网站汇聚数据的城市房价
https://fangjia.gotohui.com/


功能

选择城市
https://fangjia.gotohui.com/fjdata-3
在这里插入图片描述

需要爬取年份的数据,等等
https://fangjia.gotohui.com/years/3/2018/
在这里插入图片描述

使用bs4模块

使用bs4模块快速定义需要爬取的表格

在这里插入图片描述

代码

from urllib.request import urlopenimport pandas as pd
from bs4 import BeautifulSoup
import urllib.request
import timeheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36 Edg/108.0.1462.54'}# 发送网络请求获取网页内容
def get_page_data(data_url, headers):req = urllib.request.Request(data_url, headers=headers)content = urllib.request.urlopen(req).read()  # .decode('GBK')content = content.decode('utf-8')  # python3page = BeautifulSoup(content, 'html.parser')return page# 按格式输出价格
def get_date(date, year):date_str = ''if date == '1月':date_str = year + '-' + '01'elif date == '2月':date_str = year + '-' + '02'elif date == '3月':date_str = year + '-' + '03'elif date == '4月':date_str = year + '-' + '04'elif date == '5月':date_str = year + '-' + '05'elif date == '6月':date_str = year + '-' + '06'elif date == '7月':date_str = year + '-' + '07'elif date == '8月':date_str = year + '-' + '08'elif date == '9月':date_str = year + '-' + '09'elif date == '10月':date_str = year + '-' + '10'elif date == '11月':date_str = year + '-' + '11'elif date == '12月':date_str = year + '-' + '12'return date_str# 使用bs4内网页内容进行提取
def analyse_data(page, year):table = page.find('table', attrs={'class': 'ntable table-striped'})trs = table.find_all('tr')[3:]df_data = pd.DataFrame(columns=['date', 'price'])time.sleep(1)count = 0for tr in trs:tds = tr.find_all('td')date = tds[0].textdate = get_date(date,year)new = tds[1].textnew = new[:6]df_data.loc[count] = [date, new]count += 1return df_dataif __name__ == '__main__':data_url = 'https://fangjia.gotohui.com/fjdata-3'year = ['2011', '2012', '2013', '2014', '2015', '2016', '2017', '2018', '2019', '2020', '2021', '2022', '2023']all_datas = []file_path = "data.txt"# 遍历多年的数据for i in year:url = 'https://fangjia.gotohui.com/years/3/' + i + '/'page = get_page_data(url, headers)df_data = analyse_data(page, i)print(df_data)# 将数据保存到txt文件文件中,(存在编码问题后续解决)df_data1 = str(df_data)with open(file_path, 'a',encoding='utf-8') as file:file.write(df_data1)

运行效果

在这里插入图片描述
保存到文件
在这里插入图片描述
在这里插入图片描述

http://www.yayakq.cn/news/836285/

相关文章:

  • 宠物网站开发清远seo站内优化
  • 电子商务网站建设(论文wordpress的登入页面
  • 上海市杨浦区建设小学网站沙元埔做网站的公司
  • 南京电商网站开发两学一做网站专栏怎么设置
  • 比较流行的sns营销网站高质量外链购买
  • 专业做高品质的代工网站小程序网站制作公司
  • 系统网站建设ppt一建 专业
  • asp.net制作的网站开发建设银行网站流水账单怎么打
  • 绵阳企业网站建设公司提交谷歌网站
  • 公司做网站一般要多少钱电子商务网站特点
  • php怎么做直播网站开封建设局网站
  • txt做网站如何加图片爱网站网站查询
  • 湖南省网站备案登记网页制作培训班哪个好
  • 网站建设公司中企动力推荐网站建设 宜昌
  • 怎吗做网站挣钱网站通栏图片代码
  • 做网站一定要自己搭建服务器吗自动的网站制作
  • 阿里巴巴网站建设改图片衡水专业做wap网站
  • 301 网站 怎么做苏州正规做网站公司
  • 网站横幅背景图上杭网站设计
  • 做SEO公司多给网站房地产政策最新消息2022
  • 什么网站可以做引文分析深圳wap网站建设公司
  • 泰州市建设局网站网站建设的安全可行性
  • 哪个网站可以做微信引导图环保主题静态网站模板下载
  • 广州金融网站建设淮安网站建设优化
  • 南县做网站江苏两学一做网站
  • 电子商务网站建设技术方案保定住房和城乡建设局网站
  • 如何规避电子政务门户网站建设用手机自创游戏
  • 如室设计网站wordpress模板教程视频
  • 深圳网站建设知名 乐云践新成都建设网站 scgckj
  • 苏州品牌网站设计定制如何在百度上推广自己