当前位置: 首页 > news >正文

微网站 网页PHP网站建设视频免费

微网站 网页,PHP网站建设视频免费,做网站优化的公司的宣传海报,wordpress自动赚钱想将一份 pdf 论文中的所有参考文献都提取出来,去掉不必要的换行,放入一个 text 文件,方便复制。其引用是 ieee 格式的,形如: 想要只在引用序号(如 [3])前换行,其它换行都去掉&…

想将一份 pdf 论文中的所有参考文献都提取出来,去掉不必要的换行,放入一个 text 文件,方便复制。其引用是 ieee 格式的,形如:
ieee-ref
想要只在引用序号(如 [3])前换行,其它换行都去掉,即一行一条参考文献。

可用 pypdf[1],其主页有示例,加上 re 去除非序号前的换行(检测 [)。

Code

from pypdf import PdfReader
import re# 检测非 `[` 前的换行
pattern = r'\n(?!\[)'reader = PdfReader("paper.pdf")
n_pages = len(reader.pages)
print(n_pages)with open("ref.txt", "w", encoding="utf-8") as f:for i in range(23, 29): # 自己确定 reference 页码范围page = reader.pages[i]text = page.extract_text()text = re.sub(r'-\n', '', text) # hyphen 后换行:连 hyphen 一齐删text = re.sub(pattern, ' ', text) # 多余换行换成空格f.write(text)# + '\n')

References

  1. py-pdf/pypdf
http://www.yayakq.cn/news/448847/

相关文章:

  • 建设景区网站推文wordpress的数据库配置文件
  • 网站关键词几个最好朋友圈发布到wordpress
  • 门户网站建设推荐哈尔滨百度seo代理
  • 网站建设功能描述书徐东网站建设
  • 安徽网站建设科技wordpress做新闻cms
  • nat123做视频网站人工智能好就业吗
  • 使用flashfxp上传网站wordpress微博
  • 建设项目环保备案登记网站班服定制网站
  • 建设网站域名备案查询怎么做网站里导出没有水印的图
  • 淄博网站开发好口碑的关键词优化
  • 给网站做绝对路径手机版网站做一下多少钱
  • 项城网站设计公司名字大全20000个四个字
  • 简述网站开发的流程建网站哪个公司好
  • 网站建设 后期维护怎样做自己的vip解析网站
  • 帝国手机网站cms系统西安网站建设有限公司
  • 建网站英语怎么说个人博客搭建
  • 个人建站模板湖北省建设质量安全协会网站
  • 设计坞网站怎么样深圳做网站公司那家比较好
  • seo网站排名软件利用淘宝视频服务做视频网站
  • 创建网站目录应注意青岛网络科技公司排名
  • 专业网站建设搭建深圳市注册公司流程图
  • 在中国做国外网站如何看出网站是用wordpress搭建
  • 博客网站开发源代码北京建设网站公司
  • 临沂网站设计培训班wordpress storefront
  • 网站里的动效怎么做网站上的报名表链接是怎么做的
  • 柳州门户网站建设公司排名wordpress后台文章排序
  • 阳江网站门户网站如何制作
  • 制作网页时经常用的一种动态位图格式是做网站商城如何优化
  • 工作室网站制作网站美工做专题尺寸多少?
  • 宁波网站推广宣传公司排名公司logo是什么意思