当前位置: 首页 > news >正文

广州网络建站唐山seo排名

广州网络建站,唐山seo排名,看到一个电商网站帮做淘宝,安居客房产网利用Python中的requests库进行地铁站点信息的获取,同时将数据保存在本机excel中 # 首先引入所需要的包 import requests from bs4 import BeautifulSoup import pandas as pd import json# 发送 GET 请求获取网页内容 url http://map.amap.com/subway/index.html response r…

利用Python中的requests库进行地铁站点信息的获取,同时将数据保存在本机excel中

# 首先引入所需要的包
import requests
from bs4 import BeautifulSoup
import pandas as pd
import json# 发送 GET 请求获取网页内容
url = 'http://map.amap.com/subway/index.html'
response = requests.get(url)
# 第一步:爬取两个 div 中的城市数据(包括 ID 和拼音),生成城市集合
if response.status_code == 200:# 解码response_content = response.content.decode('utf-8')# 使用 Beautiful Soup 解析网页内容soup = BeautifulSoup(response_content, 'html.parser')# 从这里开始,你可以使用 Beautiful Soup 对象(soup)来提取所需的信息# 例如,查找标题title = soup.title# 通过Beautiful Soup来找到城市信息元素,并提取这个元素的信息for soup_a in soup.find('div', class_='city-list fl').find_all('a'):city_name_py = soup_a['cityname']city_id = soup_a['id']city_name_ch = soup_a.get_text()city_info_list.append({'name_py': city_name_py, 'id': city_id, 'name_ch': city_name_ch})# 获取未显示出来的城市列表for soup_a in soup.find('div', class_='more-city-list').find_all('a'):city_name_py = soup_a['cityname']city_id = soup_a['id']city_name_ch = soup_a.get_text()city_info_list.append({'name_py': city_name_py, 'id': city_id, 'name_ch': city_name_ch})print(city_info_list)
else:print("无法获取网页内容")for city_info in city_info_list:city_id = city_info.get("id")city_name = city_info.get("name_py")city_name_ch = city_info.get("name_ch")print("开始爬取城市" + city_name_ch + "的数据")city_lines_list = []# 第二步:遍历城市集合,构造每一个城市的 url,并下载数据# 构造每个城市的urlurl = "http://map.amap.com/service/subway?_1717380520536&srhdata=" + city_id + '_drw_' + city_name + '.json'res = requests.get(url)content = res.content.decode('utf-8')# 将内容字符串转换成json对象content_json = json.loads(content)# 提取该城市的所有地铁线listline_info_list = content_json.get("l")# 第三步:开始处理每一个地铁线,提取内容到dataframe中for line_info in line_info_list:# 地铁线名字line_name = line_info["kn"]# 处理地铁线站点df_per_zd = pd.DataFrame(line_info["st"])df_per_zd = df_per_zd[['n', 'sl', 'poiid', 'sp', 't', 'su', 'sid']]df_per_zd['gd经度'] = df_per_zd['sl'].apply(lambda x: x.split(',')[0])df_per_zd['gd纬度'] = df_per_zd['sl'].apply(lambda x: x.split(',')[1])df_per_zd.drop('sl', axis=1, inplace=True)df_per_zd['路线名称'] = line_info['ln']df_per_zd['城市名称'] = city_name_chdf_per_zd.rename(columns={"n": "站点名称", "poiid": "POI编号", "sp": "拼音名称", "t": "换乘标志 1:换乘,0:不可换乘", "su": "su", "sid": "sid编号"}, inplace=True)# 先将这条地铁线处理过的dataframe存起来,我们后面给他放到一张表里city_lines_list.append(df_per_zd)# 这段代码就是将地铁线数据列表聚合到一张表里,形成每个城市的地铁站数据city_subway_data = pd.concat(city_lines_list, ignore_index=True)# 第四步:将处理好的文件保存为xlsxcity_subway_data.to_excel(city_name_ch + '.xlsx', sheet_name='Sheet1')

http://www.yayakq.cn/news/870162/

相关文章:

  • 郑州树标网站建设网站开发中定义路由的作用
  • 盐步网站制作智慧团建pc版官网
  • 番禺网站开发价格企业营销型网站建设哪家公司好
  • 滨州市住房和城乡建设局网站网络营销推广的目标与策略
  • 做网站的预算表网站建设服务费计入什么科目
  • 个人网站对主机有什么要求网站建设岗位内容
  • 富源县建设局网站龙华网站-建设深圳信科
  • 网站qq临时会话郑州货拉拉
  • 沈阳cms模板建站免费推广平台
  • 新建的网站怎么登录wordpress搭建子網站
  • 网站开发需要看什么书建网站是怎么造成的
  • 手机网站建设地址安徽省建设工程信息网怎么不能查询
  • 做韩国护的网站wordpress 用户量上限
  • 太原营销型网站wordpress虚拟资源下载源码
  • 做汤的网站有哪些网站上传发生一个ftp错误
  • 做高端网站的网络公司产品设计哪里好就业
  • 长沙医院网站建设高端网站如何建设
  • 厦门商城网站建设想做个网站推广
  • 郑州网站优化费用珠海网络营销外包收费情况
  • 网站域名信息查询wordpress安装主题提示服务器错误
  • 网站备案授权书范本专业管道疏通网站建设图片
  • 东昌网站建设公司重庆网络问政平台
  • 个人做同城网站赚钱吗西安网站优化排名推广
  • wordpress影视采集网站东莞市官网网站建设企业
  • 网站前端建设都需要什么问题泉州建设网站的公司
  • 哪个公司做网站比较好做网站排名seo
  • 中和华丰建设有限责任公司网站网站网络拓扑图
  • 强的网站建设如何在百度上发广告
  • 网站到期是否能换服务商国外网站大牛不懂英语可以做吗
  • 网站开发程序流程图在线制作网站