当前位置: 首页 > news >正文

郴州做网站免费发布招聘信息

郴州做网站,免费发布招聘信息,网页设计平面设计哪个好,平邑网站优化ahocorasick.Automaton 是 Python 中 pyahocorasick 库提供的一个类,用于实现 Aho-Corasick 自动机。Aho-Corasick 算法是一种用于精确或近似多模式字符串搜索的高效算法。 通过 pip install pyahocorasick 安装 pyahocorasick 库。 并且,该模块是用 C 编…

ahocorasick.Automaton 是 Python 中 pyahocorasick 库提供的一个类,用于实现 Aho-Corasick 自动机。Aho-Corasick 算法是一种用于精确或近似多模式字符串搜索的高效算法。

通过 pip install pyahocorasick 安装 pyahocorasick 库。
并且,该模块是用 C 编写的,安装时需要有 C 编译器来编译本机 Cpython 扩展。

使用 ahocorasick.Automaton 类的一般步骤如下:

  1. 导入 ahocorasick 库:import ahocorasick

  2. 创建 Automaton 对象:a = ahocorasick.Automaton()

  3. (可选)将字符串键及其关联值添加到自动机,可作为 trie 树使用。例如:

    for idx, key in enumerate('heherhersshe'.split()):a.add_word(key, (idx, key))
    
  4. 调用 make_automaton() 方法完成并创建 Aho-Corasick 自动机:a.make_automaton()

创建好自动机后,可以使用以下主要方法进行搜索操作:

  • iter(string, (start, (end))):使用提供的输入字符串执行 Aho-Corasick 搜索过程。它返回一个迭代器,为在字符串中找到的键返回元组 (end_index, value),其中 end_index 是匹配结束的索引位置,value 是与匹配的键相关联的值。

  • iter_long(string, (start, (end))):返回一个搜索最长、非重叠匹配的迭代器(automaton_search_iter_long 类的对象)。

以下是一个使用 ahocorasick.Automaton 进行多模式字符串搜索的示例代码:

import ahocorasick as aha = ah.automaton()with open('userdict.txt', 'r', encoding='utf-8') as f2:  # 加载文件keywords = (a.strip() for a in f2.readlines())  # 加载关键词# 利用 add_word 方法将关键词加入自动机!for x in range(len(keywords)):a.add_word(keywords[x], (x, keywords[x]))  # 第二个参数为自定义的返回值# 创建 aho-corasick 自动机
a.make_automaton()with open('jianjie.txt', 'r', encoding='utf-8') as f:  # 打开要检索文档jianjie = f.read()  # 读取正文(如果太多,可以分断加载,分段检索)# 开始查找,该方法匹配最长的字符串
for item in a.iter_long(jianjie):print(item)
print('-' * 20)# 开始查找,该方法匹配所有字符串
for item in a.iter(jianjie):print(item)

在上述示例中,首先创建了一个自动机对象 a,然后从文件中读取关键词,并使用 add_word 方法将关键词添加到自动机中。接着调用 make_automaton 方法创建 Aho-Corasick 自动机。最后,通过打开另一个文件读取要搜索的正文,并使用 iter_longiter 方法进行匹配查找,并打印出匹配的结果。

Aho-Corasick 自动机的优点包括能够在一次运行中找到给定集合所有字符串,适用于多模式字符串匹配的场景,例如网络内容过滤、版权检测、病毒扫描等,在自然语言处理中查找特定词汇或模式,以及生物信息学中在 DNA 或蛋白质序列分析中寻找特定的序列模式等方面都有应用。

http://www.yayakq.cn/news/825249/

相关文章:

  • 企业网站的基本内容有哪些环保类网站建设
  • 柯桥建设局网站首页昆明有网站的公司
  • 做内部优惠券网站赚钱吗网站建设的运作原理
  • 西安大型网站制作网站图标的制作h1优化代码
  • 大学网站模板html做网站域名大概多少钱
  • 网站搭建php源码山东省和住房建设厅网站
  • 网站建设小结1688会提供网站建设
  • 唐山市住房和城乡建设局网站返佣贵金属交易所网站建设
  • 织梦制作手机网站模板湖南省建设厅厅长
  • 什么软件可以攻击网站wordpress本站导航在哪里
  • 怎么在境外做网站宁波十大建设集团
  • 深圳做网站的公司的区域外贸cms 网站
  • 网站建设属于无形资产吗怎么做监控直播网站
  • 重庆长寿网站设计公司哪家专业网页制作与网站设计代码
  • ztouchs网站查询python编程软件手机版下载
  • 白云免费网站建设网站建设接外包流程图
  • 做视频导航网站做网站用什么开发工具好
  • 网站建设先进个人自荐小组网站建设方案书
  • 大连自助建站软件软文广告代理平台
  • 网站硬件建设晋州专业网站建设
  • 做网站要多自己弄网站需要多少钱
  • dw里面怎么做网站轮播图ktv网络推广方案
  • 河北婚庆网站建设定制服装品牌策划
  • 创新创业营销策略网站建设等wordpress需要ftp
  • 杭州制造业企业做网站商业空间设计案例ppt
  • 海口北京网站建设网站建设制作网络公司
  • 昆明网站词排名优化广告公司经营范围怎么写最好
  • 找网站建设客户工商网上核名系统
  • 免费网站正能量小说哈尔滨seo关键词排名
  • 小程序搭建需要多久辽源网站seo