当前位置: 首页 > news >正文

张北网站seo手机网站大全免费下载

张北网站seo,手机网站大全免费下载,长沙企业查询系统官网,茶文化网站建设规划书范文在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。 Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词&a…

在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。

  • Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词,中文语境中一个词条是分词后的一个词组。

    此处涉及到分词器,分词器的作用是将一段文字分解为若干个词组,不同的分词器使用的分词算法不同,得到的分词结果也不同。

  • Term Dictionary(词典):词典是词条的集合,顾名思义,词典中维护的是Term。词典一般是由文本集合中出现过的所有词条所组成的集合。

  • Term Index(词条索引):由于词典中维护着文本中所有的词条,为了在其中更快的找到某个词条,我们为词条建立索引。通过压缩算法,词条索引的大小只有所有词条的几十分之一,因此词条索引可以存储在内存中,因此可以提供更快的查找速度。

  • Posting List(倒排表):倒排表记录的是词条出现在哪些文档里,以及出现的位置和频率等信息。倒排表中的每条记录称为一个倒排项(posting)。

将以上概念类比到词典中,Term相当于词典中的词语,Term Dictionary相当于词典本身,Term Index相当于词典的目录。

举个栗子,假设现在我们输入系统多段文本,经过分词器分词后得到以下词条:

  • elastic
  • flink
  • hadoop
  • kafka
  • spark

ES倒排索引机制

我们使用ES进行全文搜索时,如图所示,系统首先会通过Term Index找到该Term在Term Dictionary中的位置,再通过倒排索引结构找到对应的Posting,从而定位到该词组在文本中的位置,完成一次搜索。

 

http://www.yayakq.cn/news/823413/

相关文章:

  • 济南网站建设成之运维大学生网站作业
  • 浙江省建设厅 网站是多少定制网站建设多少钱
  • 水果电商网站建设相关文献seo观察网
  • 开封网站建设wordpress主题 医疗
  • 支付宝 网站接口呼和浩特市网站建设公司
  • 合肥建设监理协会网站建湖网站定制
  • 做微网站 主机 域名唐山市住房城乡建设局网站
  • 盘锦做网站多少钱用户体验的重要性
  • 淄博seo网站推广wordpress实现伪静态
  • thinkphp旅游网站源码旅行社 网站系统
  • 哈尔滨网站建设流程电子展厅
  • 想做个网站推广网页设计心得300
  • 网站开发实训的心得买房的人都哭了吧
  • uniapp怎么做淘客网站个人能建电商网站吗
  • 沙田东莞网站建设代运营公司介绍
  • 做旅游网站的目标芜湖网络营销公司
  • 做直播的网站网站模板 扁平化
  • 免费建电子商务网站WordPress图床api
  • 网站后台上传图片做难吗推广计划名称怎么写
  • 邢台哪儿做网站便宜网站的橱窗怎么做
  • 网站建设利润建网站的公司排名
  • 怎么做淘宝店网站收录网站开发职业生涯规划范文
  • 网站建设报告实训步骤青岛开发区网站建设服务
  • 公司网站设计基础任务书seo快排软件
  • 干净的下载网站上海建站资讯
  • 福州手机建站模板电商网站产品设计优化技术主要是
  • 网站快速备案多少钱北京西城区建设局网站
  • 厦门区块链网站开发营销推广软件
  • 唐山展望网站建设空白的网站怎么建设
  • 移动网站建设是什么意思珠海市今天刚刚发生的新闻