当前位置: 首页 > news >正文

高档手表网站国家高新技术企业认定官网

高档手表网站,国家高新技术企业认定官网,浙江网站建设推广公司哪家好,在哪儿可以找到网站开发的需求对于爬虫,Java并不是最擅长的,但是也可以实现,此次主要用到的包有hutool和jsoup。 hutool是一个Java工具包,它简化了Java的各种API操作,包括文件操作、类型转换、HTTP、日期处理、JSON处理、加密解密等。它的目标是使…

对于爬虫,Java并不是最擅长的,但是也可以实现,此次主要用到的包有hutooljsoup

  • hutool是一个Java工具包,它简化了Java的各种API操作,包括文件操作、类型转换、HTTP、日期处理、JSON处理、加密解密等。它的目标是使Java的常见操作更简单,提供一个简洁易用的API,让开发者更高效地编写代码。
  • jsoup是一个用于处理HTML的Java库,它提供了非常方便的API来解析HTML文档,并进行文档操作。它可以用来提取HTML中的数据,进行HTML到XML的转换,清理不安全的HTML标签等。

代码实现

import cn.hutool.core.io.FileUtil;
import cn.hutool.http.HttpResponse;
import cn.hutool.http.HttpUtil;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;/*** @author BXB*/
public class DoubanFilm250 {public static void main(String[] args) {for (int i = 0; i < 226; i += 25) {String url = String.format("https://movie.douban.com/top250?start=%d&filter=", i);String request = request(url);select(request);}}public static String request(String url) {// 发送 GET 请求HttpResponse response = HttpUtil.createGet(url).timeout(5000)  // 设置超时时间.header("User-Agent", "Mozilla/5.0")  // 设置请求头.execute();return response.body();}public static void select(String body) {Document parse = Jsoup.parse(body);Element gridView = parse.getElementsByClass("grid_view").get(0);Elements children = gridView.children();try (BufferedWriter bufferedWriter = new BufferedWriter(new FileWriter("C:/path/to/save/movieTop250.md", true));  // 修改为自己的地址) {bufferedWriter.write("| 电影名称 | 详情页地址  | 评分+金句    |\n");bufferedWriter.write("|:--------:|:--------:|:--------:|");bufferedWriter.newLine();for (Element child : children) {// 获取电影名称String movieName = child.select("div.info div.hd span.title").text();System.out.println("电影名称: " + movieName + "写入成功");bufferedWriter.write("| " + movieName + " | ");// 获取海报链接String posterUrl = child.select("div.pic img").attr("src");saveImage(posterUrl, movieName);// 获取详情页链接String movieUrl = child.select("div.info a").attr("href");bufferedWriter.write(  movieUrl + " | ");
//// 评分 金句String text = child.select("div.bd span").text();bufferedWriter.write(text + " | ");bufferedWriter.newLine();}} catch (IOException e) {throw new RuntimeException(e);}}public static void saveImage (String imageUrl, String movieName) {String savePath = "C:/path/to/save/" + movieName.split("[/]")[0] + ".jpg"; // 修改为你要保存的路径和文件名byte[] imageBytes = HttpUtil.downloadBytes(imageUrl); // 下载图片字节数组FileUtil.writeBytes(imageBytes, savePath); // 将字节数组写入到本地文件}
}
http://www.yayakq.cn/news/841463/

相关文章:

  • 高校网站建设管理办法做直播网站要什么证吗
  • 静态网站系统手机网站 动态 页面 好 静态页面好
  • 制作html网站一般使用的分辨率的显示密度是多少
  • 自己做的网站怎么设置文件下载重庆网站建设快忻
  • 京东联盟怎么做网站网站运营与管理的含义
  • 制作企业网站的代码沙田镇网站仿做
  • 网站模板论坛百度如何推广网站
  • 扬中网站哪家做得好公众号怎么挣钱
  • 绩效管理网站开发asp.net开发的网站
  • 哈尔滨企业网站建设海外医疗兼职网站建设
  • 手机网站 英文网站设计 收费
  • 网站推广策划书模板wordpress添加版权信息
  • 母版页做网站例子网站与网页之间的区别是什么
  • 网站建设相关优化创客贴网站建设
  • 高端网站设计费用wordpress更改主题目录
  • 手机网站设计咨询网络营销的主要传播渠道是
  • windows10php网站建设网站侵权 做网站有责任吗
  • 烟台网站开发自已建设网站流程
  • 武宁网站ui专业设计想自己做网站需要会什么软件
  • 我的网站建设wordpress logged in
  • 有什么办法做自己的网站wordpress个人支付接口
  • 扁平化网站首页中医网站开发
  • 什么软件可以找做网站的湛江专业网站制作
  • 建设电子商务网站步骤网络销售怎么跟客户聊天
  • 廊坊网站建设服务wordpress回复后可见
  • 网站建设快照优化搜索引擎网站建设代码
  • 北京公司模板网站好在那做网站
  • 网站建设美词原创网络游戏设计是干什么的
  • 娄底网站建设设计成都关键词快速排名
  • 建站本装修报价器