当前位置: 首页 > news >正文

商城网站建设找谁做东莞理工学院教务处

商城网站建设找谁做,东莞理工学院教务处,北京科技公司10强,网站类别选择前阵子接到一个实验室老师的需求,采集五年前(2024-52019)过年前后的北京微博签到数据。 前两年采集的深圳签到数据是 2022 年是当年的尚可,这次虽然时间跨度只有两个月,但是由于时间太过久远,但是颇费了一…

前阵子接到一个实验室老师的需求,采集五年前(2024-5=2019)过年前后的北京微博签到数据。

前两年采集的深圳签到数据是 2022 年是当年的尚可,这次虽然时间跨度只有两个月,但是由于时间太过久远,但是颇费了一番心力,还好最终老师只需要每个月 10000 条左右,我赶紧停止了集群的采集,一看代理池马上欠费了。

在这里插入图片描述

最终采集的数据字段包括经纬度、签到地点、微博链接、博主链接、内容、图片链接、发布时间、转评赞数等数十个字段,基本满足分析要求。

经纬度坐标应该不是 WGS84,验证应该是 GCJ-02 坐标系,GCJ-02 整体相对于 GPS 坐标系应该有非常小的非线性偏移。 GCJ-02 可以转化成 WGS84 坐标系(相关转化的算法网上有很多了,这里就不再赘述了,可自行搜索)。

这里插一句,如果要使用地理编码相关的 API,最好使用高德地图,因为其实微博(以前是)和高德地图都是阿里系的公司,高德地图偏爱 GCJ02,微博就使用的高德地图相关的。

微博签到数据的采集,时间越久越难采集,看到网上有很多分享 2014 年全国微博签到数据的,我看了下其实那个只是 poi 数据,而且绝大部分的 poi 被重置了,poi 链接打不开,查无此微博。

这里插播一句,借用了朋友的服务器集群,可以采集大量历史微博签到数据,时间段可以是 2016、2017、2018、2019、2020、2021、2022等,最好是 2018 年以后的,因为历史微博签到数据回溯采集非常困难,爬大量数据(对于 2018 2019 年左右,几千条每月就是大量了)需要大量账号和大量代理 ip,固定成本和时间都消耗不少,所以按需采集,可以采集最近 10 年北京、上海、广州、深圳、苏州、杭州等全国任意城市,或者新加坡、巴黎等海外任意城市的签到微博数据,或者任意景点(景点可能是一个或者多个 poi)的微博签到数据,如果有需求,可以带上具体任务+时间段来戳,有空(比较大的任务最好是假期)就做,非咸鱼非倒卖,一手实时采集,有一定成本,相互理解。

http://www.yayakq.cn/news/604217/

相关文章:

  • php网站开发课程福州搜索优化实力
  • 使用top域名做网站万盛网站建设公司
  • 如何做网页网站优化描述设置
  • 网站做百度竞价引流费用多少钱失业保险网站
  • 苏州高端网站建设设计公司哪家好项目网站
  • 一个网站如何做seo优化个人信息网站模板
  • 网站管理机制建设情况电商怎么做推广
  • 网站设计实验惠阳网络推广公司
  • 常德网站开发服务python网站开发详细步骤
  • 邢台专业做网站费用信息系统开发计划
  • 看外国网站怎么改dns成功的网站不仅仅是优化排
  • 傻瓜式网页制作网站高端互联网推广
  • 门户网站建设的公司电子商务网站建设的具体内容
  • 用app怎么样建网站宁波门户网站建设
  • 绵阳市建设厅官方网站购买腾讯云主机可以直接做网站
  • 外贸网站定制制作公司无锡阿凡达网站建设
  • 有没有做淘宝客网站的搭建wordpress网站
  • 精湛的中山网站建设在线电子印章制作生成免费
  • 网站首页布局自适应网站开发所需配置
  • 网站域名可以更改吗软件开发外包什么意思
  • 卖衣服的网站排名专业手机网站建设推荐
  • 网站开发毕业设计论文增城百度做网站多少钱
  • 天津住房和城乡建设部网站小程序软件定制开发
  • wp网站建设教程wdcp 网站打不开
  • 韩国优秀网站设计建筑工程分包平台
  • 高校网站群建设方案重庆市建设工程信息网 023dir
  • 现代网站开发技术个人可以做购物网站吗
  • 网站竞争对手如何做调研淄博企业网站排名优化
  • 公司网页网站建设 ppt模板电子商务网站建设实训心得体会
  • 1营销型网站建设校园微网站界面