当前位置: 首页 > news >正文

笑话网站html模板做网站需准备些什么软件

笑话网站html模板,做网站需准备些什么软件,iis建设网站教程,河南航天建设工程有限公司网站直觉上处理网页信息,很多人会先将网页保存成HTML,然后做文本分析。但这样做是不够的,因为网页可能内嵌图片,这些图片在HTML里就是一处链接,离线处理时无法还原,相当于丢失了图片信息。更好的做法是将整个网…

直觉上处理网页信息,很多人会先将网页保存成HTML,然后做文本分析。但这样做是不够的,因为网页可能内嵌图片,这些图片在HTML里就是一处链接,离线处理时无法还原,相当于丢失了图片信息。更好的做法是将整个网页一次性保存下来。

路径一:将网页保存成mhtml,然后保存成图片。没有现成的工具可以做到这点,mhtml可以通过直接将后缀改成doc以doc的方式打开。然后通过工具将doc转成图片。

路径二:将网页保存成mhtml,然后使用chromedriver保存成pdf,然后pdf再转图片。

路径三:使用chromedriver直接将网页保存成pdf,然后pdf再转图片。

import os
import csv
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service
import base64def get_url_list(csv_path):content_list = []with open(csv_path, "r", encoding="gbk") as fin:csv_reader = csv.reader(fin)for line in csv_reader:content_list.append(line)title_list, url_list = list(zip(*content_list))return title_list, url_listif __name__ == "__main__":url_file_path = "title_url.csv"driver_location = 'chromedriver.exe的绝对路径'service = Service(driver_location)# 创建Chrome选项options = Options()# 无头模式,无界面options.add_argument("--headless")options.add_argument("--disable-gpu")driver = webdriver.Chrome(options, service)# 设置 PDF 选项pdf_options = {# 'paperWidth': 33.1,  # 纸张宽度,单位是英寸# 'paperHeight': 46.8,  # 纸张高度,单位是英寸'printBackground': True,  # 是否打印背景'landscape': False  # 是否横向打印}title_list, url_list = get_url_list(url_file_path)for i, url_path in enumerate(url_list):driver.get(url_path) # 打开网页# 使用 Chrome DevTools 协议保存为 PDFpdf_data = driver.execute_cdp_cmd('Page.printToPDF', pdf_options)# 解码并保存 PDF 文件pdf_content = base64.b64decode(pdf_data['data'])cur_title = title_list[i]cur_title = cur_title.replace("/", "_").replace("\\", "_")output_path = "pdf_output/" + cur_title + ".pdf"print(output_path)try:with open(output_path, 'wb') as file:file.write(pdf_content)except:print("fail", output_path)# 关闭 WebDriverdriver.quit()

http://www.yayakq.cn/news/738907/

相关文章:

  • php网站开发实验报告龙岩网络三剑客
  • 网站建设制作方案建设网站多久
  • 网站建设方案如何写郑州小程序开发哪家好
  • 辽宁建设银行企业银行官方网站网站建设6135678
  • 虚拟主机网站被挂马网站举报官网
  • 建设部继续教育网站网站建设考试知识点
  • 网站开发无形资产新品推广计划与方案
  • 营销型网站的建设与推广辅导记录网站开发算法
  • 湖南做网站 搜搜磐石网络上住房和城乡建设部网站
  • 网站开发工作容易出现的失误wordpress批量增加文章
  • 高端网站建设公司联系电话拟定一个物流网站的建设方案
  • 东营市做网站中关村在线app
  • 在线网站优化wordpress主题修改图片
  • 示范高校建设网站网站免费制作
  • 单位网站建设框架网站建设运营培训总结
  • 网站建设维护有哪些内容网站开发语言学习C 吗
  • 网站建设设计师招募揭阳手机网站建设
  • 怎么找做网站的公司北京制作手机网站
  • 环保网站建设公司哪家好网站浏览历史记录恢复方法是什么
  • 英文网站 正文字体大小企业网站备案那么麻烦吗
  • 北京网站制作的现在都用什么软件搜索附近的人
  • 电脑有固定IP 做网站建筑师培训
  • 怎么做网站记者商品网站建设格式
  • 吴兴区建设局网站福建建设执业中心网站
  • 汕头站扩建后比哪个站大国产免费crm系统有哪些
  • 深圳网站建设软件开发公司排名山东住房与城乡建设部网站
  • 珠海企业网站建设报价小学网站建设情况说明
  • 高手做网站wordpress discussion settings
  • 帮别人做网站规划公司企业网站制作需要多少钱
  • 网站建设与维护百度百科搜索引擎优化不包括