当前位置: 首页 > news >正文

哪些网站可以做微课网站切图

哪些网站可以做微课,网站切图,网络推广外包搜索手机蛙软件,网站域名怎么注册晚上休息,想弄两部好看的电影看看, 找了半天没找到想看的, 想到之前有个人爬知乎的用户数据,突发奇想, 没事把BT天堂的电影信息爬下来,下次阔以直接查数据库。 只能说闲的蛋疼,哈哈&#xf…

晚上休息,想弄两部好看的电影看看,

找了半天没找到想看的睡觉

想到之前有个人爬知乎的用户数据,突发奇想大笑

没事把BT天堂的电影信息爬下来,下次阔以直接查数据库。安静闭嘴

只能说闲的蛋疼得意,哈哈,还能码下代码  ^_^


1.抓取网站html源码

<span style="font-size:24px;">$url = "www.bttiantang.cc";
$html = shell_exec("curl $url");</span>

2.获取总页数,电影总数(正则匹配)

<span style="font-size:24px;">preg_match("/<span class=\"pageinfo\">.*?<\/span>/", $html, $pageCount);
preg_match_all("/\d{1,10000}/",$pageCount[0],$pageCount);</span>


3.抓取电影信息(正则匹配信息)

<span style="font-size:24px;">preg_match("/\d{4}\/\d{2}\/\d{2}/" , $pageInfo[0][$i], $updateTime);preg_match("/<font color=\"#FF6600\">(.*?)<i>/" , $pageInfo[0][$i], $movieName);preg_match("/<strong>(\d{1})<\/strong>/" , $pageInfo[0][$i], $movieScore_int);preg_match("/<em class=\"fm\">(\d{1})<\/em>/" , $pageInfo[0][$i], $movieScore_decimal);preg_match("/href=\"(.*?)\"/" , $pageInfo[0][$i], $movieUrl);preg_match("/<p class=\"des\">(.*?)<\/p>/" , $pageInfo[0][$i], $actor);</span>

4.插入数据库,大功告成


总体来说,php抓取的速度还是蛮快的,4min不到,采集2w多条信息。

start:01:22:54

end:01:26:11






附数据库截图:




附源码:

<?php$url = "www.bttiantang.cc";
$html = shell_exec("curl $url");preg_match("/<span class=\"pageinfo\">.*?<\/span>/", $html, $pageCount);
preg_match_all("/\d{1,10000}/",$pageCount[0],$pageCount);$pageSize = intval($pageCount[0][0]);
$movieCount = $pageCount[0][1];$conn = mysql_connect('***','***','');
mysql_select_db('***',$conn);
mysql_query('set names utf8',$conn);for($j=1;$j<=$pageSize;$j++){$movieHtml = shell_exec("curl $url?PageNo=$j");preg_match_all("/<div class=\"item cl\">.*?<\/div>/s", $movieHtml, $pageInfo);for($i=0;$i<count($pageInfo[0]);$i++){preg_match("/\d{4}\/\d{2}\/\d{2}/" , $pageInfo[0][$i], $updateTime);/******clear ad*****/if(empty($updateTime))continue;/*******************/$updateTime = str_replace('/','-',$updateTime[0]);preg_match("/<font color=\"#FF6600\">(.*?)<i>/" , $pageInfo[0][$i], $movieName);/*****same conditions*****/if(empty($movieName))preg_match("/<b>(.*?)<i>/" , $pageInfo[0][$i], $movieName);if(empty($movieName))preg_match("/<b>(.*?)<\/b>/" , $pageInfo[0][$i], $movieName);/************************/$movieName = $movieName[1];preg_match("/<strong>(\d{1})<\/strong>/" , $pageInfo[0][$i], $movieScore_int);$movieScore_int = $movieScore_int[1];preg_match("/<em class=\"fm\">(\d{1})<\/em>/" , $pageInfo[0][$i], $movieScore_decimal);$movieScore_decimal = $movieScore_decimal[1];$movieScore = floatval($movieScore_int.'.'.$movieScore_decimal);preg_match("/href=\"(.*?)\"/" , $pageInfo[0][$i], $movieUrl);$movieUrl = $movieUrl[1];preg_match("/<p class=\"des\">(.*?)<\/p>/" , $pageInfo[0][$i], $actor);$movieActor = str_replace("<em>",'',str_replace("</em>",'',$actor[1]));mysql_unbuffered_query("insert into movie (name,actor,url,update_ts,score) values ('$movieName','$movieActor','$movieUrl',<span style="white-space:pre">	</span>'$updateTime','$movieScore')");}}?>


本电影信息属于从BT天堂抓取,并未涉及机密信息,因此本人不承担任何法律责任!

若有相关电影信息涉及您的版权或知识产权或其他利益,请告知,确认后会尽快删除。



http://www.yayakq.cn/news/542027/

相关文章:

  • 网站建站平台开发服务服务采购公告监控设备公司企业网站源码
  • 招一个程序员可以做网站吗手机端网站搭建
  • 芜湖企业网站制作陕西住房与城乡建设厅网站
  • 用vue.js做网站的好处永久免费自动建站系统
  • 网站优化推广 site天津网站建设哪家好
  • 建筑招聘网站有哪些免费建站建站
  • 建设银行怎么招聘网站免费qq空间访客网站
  • 应用公园app制作平台seo咨询推广
  • 音乐介绍网站怎么做的哪个网站可以做艺术字
  • 上海电子商务网站制作湖北省住房和城乡建设厅网站的公示公告
  • dede电影网站模版discuz 门户网站模板
  • wp做购物网站代理公司注册登记
  • 宝丰网站建设网站结构优化包括什么
  • seo技术中心福州seo公司网站
  • 哪些网站属于官网24小时最新在线视频免费观看
  • 建设一个网站思路建设工程安全信息网
  • 织梦网站程序5.7首页模板网站空间不够用怎么办
  • 深圳做网站排名哪家专业网站建设重要性
  • 广州网站建设多少钱手机网站建设要注意哪些问题
  • 网络班级网站建设西部中大建设集团有限公司网站
  • 个人做视频网站wordpress迁移所有页面空白
  • 六安网站建设优化公司网站可以免费建吗
  • 桂林网站制作网站专业建站服务建站网
  • 邯郸网站建设纵横seo关键词排名工具
  • 个人做搜索引擎网站违法吗那个网站开发三味
  • 燃烧学课程网站建设wordpress图片服务器配置
  • 犀牛做网站的公司上海设计网站方法
  • wordpress做下载型网站6免费手工活外发加工网站
  • 做直播网站前端学生自做网站优秀作品
  • 国内做的比较好的二手网站注册个人工作室流程及费用