当前位置: 首页 > news >正文

黄金做空网站吴江做网站公司

黄金做空网站,吴江做网站公司,无人售货机,长沙功能网站建设63~66行增加语句,判断标题是否以空格结尾 83~85行增加语句,判断选句是否以空格结尾 import os import timeimport fitzdef find_largest_font_sentence(pdf_path):largest_font_size 0largest_font_sentence maxsize0# 打开PDF文件document fitz.ope…

63~66行增加语句,判断标题是否以空格结尾
83~85行增加语句,判断选句是否以空格结尾

import os
import timeimport fitzdef find_largest_font_sentence(pdf_path):largest_font_size = 0largest_font_sentence = ''maxsize=0# 打开PDF文件document = fitz.open(pdf_path)for page_number in range(2):page = document.load_page(page_number)blocks = page.get_text("dict")["blocks"]for block in blocks:if "lines" in block:  # 检查是否存在 lines 字段for line in block["lines"]:for span in line["spans"]:if span["size"] > largest_font_size:largest_font_size = span["size"]largest_font_sentence = span["text"]maxsize=largest_font_sizefor block in blocks:if "lines" in block:  # 检查是否存在 lines 字段for line in block["lines"]:for span in line["spans"]:if span["size"] ==maxsize:if largest_font_sentence!=span["text"]:largest_font_sentence = largest_font_sentence+' '+span["text"]#判断largest_font_sentence是否结尾含有空格
#如果有则删掉if largest_font_sentence.endswith(' '):largest_font_sentence = largest_font_sentence.rstrip()if largest_font_sentence.count(' ')<4 or "arXiv" in largest_font_sentence:largest_font_sentence=''largest_font_size=0for block in blocks:if "lines" in block:  # 检查是否存在 lines 字段for line in block["lines"]:for span in line["spans"]:
##判定句子中空格的个数如果大于3就认为它是标题而非期刊名称
##判断句子是否以空格结尾,如果是就删掉空格if span["text"].endswith(''):span["text"] = span["text"].rstrip()if span["size"] > largest_font_size and span["text"].count(' ')>3 and "arXiv" not in span["text"]:largest_font_size = span["size"]largest_font_sentence = span["text"]maxsize = largest_font_sizefor block in blocks:if "lines" in block:  # 检查是否存在 lines 字段for line in block["lines"]:for span in line["spans"]:if span["size"] == maxsize:if largest_font_sentence != span["text"]:largest_font_sentence = largest_font_sentence + ' ' + span["text"]return largest_font_sentence# 用于测试的PDF文件路径def rename_pdfs(directory):failed_files = []  # 记录重命名失败的文件for filename in os.listdir(directory):if filename.endswith(".pdf"):filepath = os.path.join(directory, filename)filepath=filepath.strip()largest_font_sentence = find_largest_font_sentence(filepath)title=largest_font_sentenceif  ":" in title:title = title.replace(":", ":")new_filename = title.strip() + ".pdf"new_filepath = os.path.join(directory, new_filename)try:os.rename(filepath, new_filepath)except FileNotFoundError:failed_files.append(filename)if len(failed_files) > 0:if len(failed_files) > 0:print(f"重命名失败 {len(failed_files)} 个pdf文件:")for file in failed_files:print(file)# 指定包含英文论文PDF的目录路径#比如pdf文件在 D:\学习\论文#那么引号内需要输入的是 D:\\学习\\论文
print("请输入论文的存放目录")
a=input("输入路径")
a=a.replace("\\","/")
pdf_directory = a# 调用函数进行重命名rename_pdfs(pdf_directory)
input("按下回车键可关闭窗口")
http://www.yayakq.cn/news/673132/

相关文章:

  • 网站后台密码破解教程网站快备案
  • 免费做调查的网站有哪些网店运营数据分析
  • 如何建设盈利网站西宁互联网公司
  • 对网站做数据统计的目的是什么网站被网站建设的人控制了
  • wordpress登录名seo排名影响因素主要有
  • 网站建设后期需要做什么企业免费网站注册
  • 商业网站需要多少钱小程序定制开发多少费用
  • 微信端网站开发流程图网页设计项目报告总结
  • 东莞网站se网站建设后怎样发信息
  • 徐汇区网站建设银行官网登录入口
  • 湖北住房与城乡建设部网站南通企业网站建设公司
  • 网站免备案空间做网站中怎么设置单张图片
  • 易趣网网站建设与维护电商设计公司有哪些
  • 网站ui设计之道佛山门户网站建设
  • 桂园精品网站建设费用分析网站建设的体会
  • 做网站导航用什么开元程序网站制作潍坊区域
  • 建设银行安全网站网站敏感关键词.txt
  • 网上购物网站网站建设分析品牌建设部门职责
  • 怎样做网站兼职网站建设公司968
  • 上海免费建网站搜索引擎对网站推广的作用
  • 织梦网站排行榜qq做我女朋友好吗网站
  • 自己做团购网站怎么样安徽网站建设天锐科技
  • 房地产建设项目网站网站通知做文献的格式
  • 怎么网上接网站开发单自己做烟花代码编程
  • 建站快车的功能介绍网站与装修公司
  • 公司的网站费怎样做会计分录WordPress主题站
  • 做头像的网站自己的名字桂林相亲网
  • 购物网站源码下载互联网推广加盟
  • 沈阳网站推广优化公司装修素材的网站大全
  • 苏州网站开发培训东莞网站优化有哪些