当前位置: 首页 > news >正文

记事本做网站怎么改字体颜色查企业免费

记事本做网站怎么改字体颜色,查企业免费,安卓开发培训机构,南通网站建设.目录 一、更新概述 二、环境安装 1.基础环境配置 2.模型参数下载 3.参数地址配置——settings.py 三、指令使用 1.命令指令运行 一、更新概述 surya项目Github地址:https://github.com/VikParuchuri/surya 号称今年最强OCR的surya近期迎来新的更新,Vik…

目录

一、更新概述

二、环境安装

        1.基础环境配置

        2.模型参数下载

        3.参数地址配置——settings.py

三、指令使用

      1.命令指令运行


一、更新概述

        surya项目Github地址:https://github.com/VikParuchuri/surya

        号称今年最强OCR的surya近期迎来新的更新,Vik大佬更新了表格检测的模型。

        最新surya——0.6.1版本的识别效果如下。现在还可以识别文章阅读的行文顺序,对表格内的数字信息也可以很好的提取。

二、环境安装

        1.基础环境配置

        在之前使用surya的0.3.0版本中使用的是torch1.12.1,更新后的surya的0.6.0版本需要更高的torch环境,因此需要重新创建虚拟环境,并安装高于2.3.0的Pytorch。

        此处python版本虽然官方文档说和0.3.0版本一样3.9+即可,但使用3.9会红字报错,因为一些代码使用和书写规范在3.9后发生改变,最好使用版本在3.10+以上,如果坚持使用3.9,按下面使用部分报错修改处,处理源码。

# 创建虚拟conda环境
conda create -n surya0.6 python=3.10
# 激活环境
conda activate surya0.6# 安装更高版本pytorch
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu118# 或者官网稳定版2.4.1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118## cpu版本
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cpu

        pytorch安装好了以后直接pip安装最新版surya即可。在编写此文时最新版的为0.6.1版本。

# 安装最新版本surya
pip install --upgrade surya-ocr

         最好将其最新的源码也下载下来,方便后续项目的查看和调试。

        Github地址Surya:https://github.com/VikParuchuri/surya

        2.模型参数下载

        和之前一样如果想直接使用surya需要有良好的“科学上网”配置,因为源码或安装库里面都不直接下载好的了模型参数,第一次使用会到huggingface下载对应模型参数。

        因此有两种解决办法,一是使用huggingface的国内镜像网站hf-mirror;或者提前下载好模型参数到项目目录,在设置中修改模型地址。本文选择后者。

        huggingface作者surya模型参数保存地址:https://huggingface.co/vikp

        (推荐)国内hugging-mirror镜像地址:https://hf-mirror.com/models?search=vikp 

        下载好的模型参数可以在surya源码下载处新建一个huggingmodel子文件夹,下存放各种模型参数。

        3.参数地址配置——settings.py

        推荐将模型下载到本地后,再在surya项目环境安装包源码处修改全局参数中关于模型加载地址部分,这样更不容易报错。

        首先打开在conda中安装的虚拟环境文件夹地址,在以下文件路径中。所有安装在虚拟环境中的库都在此路径下。

miniconda\envs\surya0.6\Lib\site-packages

        在所有安装库中找到surya名称的文件,再打开就可以看到settings.py文件了。

        根据之前源码拆解博文修改其中的模型配置参数。

        博文快速链接:https://blog.csdn.net/qq_58718853/article/details/137815688

三、指令使用

      1.命令指令运行

        有了上述环境准备后,可以直接使用指令快速使用。只需将实际本地图片地址替换下方Data_Path即可。

# ocr文本检测识别
surya_ocr Data_Path# detect文本行检测
surya_detect Data_Path# layout板式分析
surya_layout Data_PATH# table表格检测
surya_table Data_PATH# order文本阅读顺序
surya_order Data_PATH

        首先实验一下检测模型(只需要surya_det3)是否可以使用。结果会在项目项新建一个results文件夹。

         再来测试一下ocr模型。(需要surya_det3和surya_rec2模型)

        还有表格模型。(需要surya_rec2和surya_layout3和surya_tablerec模型)

        2.可视化结果

        只需在上述命令行指令后面加上“--images”即可完成可视化保存。

# 可视化保存
surya_detect DataPath --images

        本文随意截取了两张csdn界面的图像,使用surya进行识别检测测试。

        文本行检测模型可视化结果如下。其检测框似乎还不错,至少有95%以上的正确框。

        板式分析layout模型检测效果如下。

        表格检测模型效果如下。

http://www.yayakq.cn/news/52302/

相关文章:

  • 想学会网站建设要会什么唐山网站制作系统
  • 网站开发都是使用框架吗基础建设年
  • 一个专门做预告片的网站wordpress文本编辑插件
  • 青岛网站营销推广深圳较便宜的网站建设
  • wordpress index.txtseo搜索引擎优化实训总结
  • 网站服务器如何选择wordpress插件样式
  • 个人网站制作视频个人备案的网站可以做商城吗
  • 网站做查赚钱软件平台开发流程
  • 班级网站设计模板首页微网官方网站
  • 广州网站建设培训班响应式网站的费用
  • 建立企业网站的形式网业认证wifi入口
  • 网站建设和优化内容最重要性网站排名top排行榜
  • 酒店网站建设考虑的因素网站建设规划书河北
  • 企业网站好做吗吉首企业网站建设价格
  • 网页制作中网站名称怎么做龙江人社app二维码图片
  • 专业建设企业网站wordpress发表的文章点不开
  • 做商城网站一般用什么深圳市住房和建设局logo
  • 网站建设比较好公司滨州区建设局网站
  • 网站如何推广出去桂林北站官网
  • 做网站ps切图手机营销型网站建设
  • 网站建设工具哪家好wordpress 维文版
  • 网站建设和制作大连优化网站
  • 网站的特效代码网站建设优化推广杭州
  • 做网站要用什么编程语言pc端兼手机端网站模板
  • k歌里的相片是通过网站做的吗驻马店手机网站制作
  • 做网站应该注意什么网站建设二次开发
  • 南京市公共资源建设中心网站从事网站开发方向
  • 业务员自己掏钱做网站可以吗广告片宣传片拍摄
  • 张家港做网站优化排名cms和wordpress
  • 做网站怎么融资成都网站制作芜湖厂商