当前位置: 首页 > news >正文

做一年的网站维护价格做亚马逊有什么网站可以借鉴

做一年的网站维护价格,做亚马逊有什么网站可以借鉴,网络优化需要用到的工具,百度知道官网首页登录入口文章目录 六、PyMuPDF的OCR识别6.1 使用 Tesseract进行OCR6.2 使用MuPDF进行OCR6.3 使用 Python 包easyocr进行OCR识别6.4 使用 Python ocrmypdf包进行OCR识别6.5 将图像批量OCR并转换为PDF七、PDF附加、嵌入、批注等7.1 附加文件7.2 嵌入文件7.3 从文档中获取所有批注六、PyMu…

文章目录

  • 六、PyMuPDF的OCR识别
    • 6.1 使用 Tesseract进行OCR
    • 6.2 使用MuPDF进行OCR
    • 6.3 使用 Python 包easyocr进行OCR识别
    • 6.4 使用 Python ocrmypdf包进行OCR识别
    • 6.5 将图像批量OCR并转换为PDF
  • 七、PDF附加、嵌入、批注等
    • 7.1 附加文件
    • 7.2 嵌入文件
    • 7.3 从文档中获取所有批注

六、PyMuPDF的OCR识别

https://github.com/pymupdf/PyMuPDF-Utilities/tree/master/OCR
在这里插入图片描述

使用 PyMuPDF 和 OCR 的演示脚本
从 1.18.0 版本开始,MuPDF 支持动态调用 Tesseract OCR 来解释页面或图像上的文本。从其版本 1.19.0 开始,PyMuPDF 已开始支持此接口。

6.1 使用 Tesseract进行OCR

此演示脚本读取包含无法解释的字符的文档文本。这些字符被编码为 MuPDF。在每次遇到与此字符的文本跨度时,都会通过 Python 调用 Tesseract OCR 进行解释。脚本和 Tesseract 安装之间没有其他/直接连接。chr(65533)subprocess

脚本的方法是这样的

  • 将页面的文本解压缩到 via .dictget_text(“dict”, flags=0)[“blocks”]
  • 遍历字典并检查 span 文本是否包含 .chr(65533)
  • 在这种情况下,请创建跨度的 bbox 的像素图,并调用 Tesseract 来对此图像进行 OCR。
  • 打印新旧文本以进行视觉比较。

每个此类 OCR 操作的平均持续时间约为 0.65 秒(Windows 10,64 位,

http://www.yayakq.cn/news/787072/

相关文章:

  • 网站开发技能介绍百度权重2的网站
  • 小羚羊网站怎么建设拼多多如何无货源开店
  • 上海做网站比较有名的公司有哪些广州seo网站策划
  • 建设网站用什么代码写好呢物流网站
  • 北碚免费建站哪家做得好白品网站建设
  • 央视网商城网站建设潮安区住房和城乡建设局网站
  • 网站建设优化哪家专业徐州钢网架公司
  • 网站栏目怎么网站设计制作步骤
  • 做网站累吗长沙中企动力怎么样
  • 义乌购物网站建设多少钱网站建设有什么好的介绍
  • 用什么开发和建设网站最好品牌手机网站开发公司哪家好
  • 网站管理系统 手机九九建筑网官网登录
  • 海口网站建设方案优化企业家网站建设
  • 下载学校网站模板下载dw网站制作
  • 上海网站制作开发自学建百度首页网站
  • 网站更新维护新西兰网站建设
  • 贵阳设计网站外卖网站开发
  • win7 做服务器开网站网易企业邮箱怎么发送文件
  • 现在主流网站用什么做的宁波高端网站建设公司
  • 做网站的公司主要是干啥怎么给网站添加代码
  • 域名购买网站有哪些做思维导图的在线网站
  • 怎样做淘宝客网站不关站备案wordpress
  • 网站做备案WordPress的站内地图
  • 网站 关于我们 模板2022年楼市最新政策
  • 做教育app的网站有哪些内容金融互助平台网站制作
  • 佛山企业网站建设特色网站自己可以备案吗
  • 福州网站建设电话图片制作的软件有哪些
  • 网站短信验证怎么做的湖南铁军工程建设有限公司网站
  • 网站建设贵阳静态网站策划书
  • 安康做网站哪家好项目之家app