当前位置: 首页 > news >正文

西安三网合一网站建设wordpress系统迁移

西安三网合一网站建设,wordpress系统迁移,专业的金融行业网站开发,五台网站建设基于MinerU的PDF解析API - MinerU的GPU镜像构建 - 基于FastAPI的PDF解析接口支持一键启动,已经打包到镜像中,自带模型权重,支持GPU推理加速,GPU速度相比CPU每页解析要快几十倍不等 主要功能 删除页眉、页脚、脚注、页码等元素&…

基于MinerU的PDF解析API

- MinerU的GPU镜像构建
- 基于FastAPI的PDF解析接口

支持一键启动,已经打包到镜像中,自带模型权重,支持GPU推理加速,GPU速度相比CPU每页解析要快几十倍不等

主要功能

  • 删除页眉、页脚、脚注、页码等元素,保持语义连贯
  • 对多栏输出符合人类阅读顺序的文本
  • 保留原文档的结构,包括标题、段落、列表等
  • 提取图像、图片标题、表格、表格标题
  • 自动识别文档中的公式并将公式转换成latex
  • 自动识别文档中的表格并将表格转换成latex
  • 乱码PDF自动检测并启用OCR
  • 支持CPU和GPU环境
  • 支持windows/linux/mac平台

具体原理

请见PDF-Extract-Kit:https://github.com/opendatalab/PDF-Extract-Kit/blob/main/README-zh_CN.md
PDF文档中包含大量知识信息,然而提取高质量的PDF内容并非易事。为此,我们将PDF内容提取工作进行拆解:

  • 布局检测:使用LayoutLMv3模型进行区域检测,如图像,表格,标题,文本等;
  • 公式检测:使用YOLOv8进行公式检测,包含行内公式和行间公式;
  • 公式识别:使用UniMERNet进行公式识别;
  • 表格识别:使用StructEqTable进行表格识别;
  • 光学字符识别:使用PaddleOCR进行文本识别;

镜像地址:

阿里云地址:docker pull registry.cn-beijing.aliyuncs.com/quincyqiang/mineru:0.2-models

dockerhub地址:docker pull quincyqiang/mineru:0.2-models

启动命令:

docker run -itd --name=mineru_server --gpus=all -p 8888:8000 quincyqiang/mineru:0.2-models

具体截图请见博客:https://blog.csdn.net/yanqianglifei/article/details/141979684

启动日志:

输入参数:

访问地址:

http://localhost:8888/docshttp://127.0.01:8888/docs

解析效果:

返回内容字段包括:dict_keys([‘layout’, ‘info’, ‘content’])
其中content是一个字典列表:

{'type': 'text', 'text': '现在我们知道:价值实体就是劳动;劳动量的尺度就是劳动持续时间。', 'page_idx': 5
}
http://www.yayakq.cn/news/782133/

相关文章:

  • wordpress 修改logoseo关键词推广方式
  • 营销型网站制作费用怎么将html变成为网址
  • 淘客客怎么做自己的网站如何在网上推广二维码
  • 杭州网站优化企业wordpress防站教程
  • 优秀的定制网站建设提供商如何做网
  • 用asp做旅游网站网站建设公司客户开发手册
  • 找人做网站要准备什么做网站没有学历的人会吗
  • 网站建设验收表搜索引擎优化方法有哪些
  • 贵阳网站建设公司排行买好域名后怎么做网站
  • php的网站宁波网站推广方式怎么样
  • 视频网站开发有哪些功能帝国建站教程
  • 做微商加入什么移动电商网站政务信息公开与网站建设报告
  • 备案网站名称修改wordpress自动外链缩略图
  • 永久免费自助建站推荐网站建设 上寻模板
  • 哪个网站做外贸零售比较好呢网站线框图怎样做
  • html做游戏网站下载网站 源码
  • 网站建设如何报价怎么做卡蜜网站
  • 网站开发公司内部数据字典如何去国外网站看内容
  • 如何做考试网站核桃编程怎么报名网课
  • 企业门户网站开发用h5做的网站
  • 德州鲁企动力网站优化中心深圳网络营销推广服务
  • dede cms 网站模板陕西省建设执业中心网站
  • 建设商务公司网站做白酒有没有必要做个网站
  • 网站开发人员上级主管新闻类网站建设
  • 网站菜单怎么做律师网站建站
  • wordpress oday安徽网站优化怎么做
  • 如何搭建静态网站景德镇网站维护
  • 创做网站如何在云服务器上搭建网站
  • 哪些网站可以接兼职做管理软件开发工程师
  • 5g创业网站建设绍兴seo全网营销