当前位置: 首页 > news >正文

展示用网站wordpress 默认模板

展示用网站,wordpress 默认模板,wordpress-erphpdown,wordpress用户冻结在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。 Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词&a…

在ES的倒排索引机制中有四个重要的名词:Term、Term Dictionary、Term Index、Posting List。

  • Term(词条):词条是索引里面最小的存储和查询单元。一段文本经过分析器分析以后就会输出一串词条。一般来说英文语境中词条是一个单词,中文语境中一个词条是分词后的一个词组。

    此处涉及到分词器,分词器的作用是将一段文字分解为若干个词组,不同的分词器使用的分词算法不同,得到的分词结果也不同。

  • Term Dictionary(词典):词典是词条的集合,顾名思义,词典中维护的是Term。词典一般是由文本集合中出现过的所有词条所组成的集合。

  • Term Index(词条索引):由于词典中维护着文本中所有的词条,为了在其中更快的找到某个词条,我们为词条建立索引。通过压缩算法,词条索引的大小只有所有词条的几十分之一,因此词条索引可以存储在内存中,因此可以提供更快的查找速度。

  • Posting List(倒排表):倒排表记录的是词条出现在哪些文档里,以及出现的位置和频率等信息。倒排表中的每条记录称为一个倒排项(posting)。

将以上概念类比到词典中,Term相当于词典中的词语,Term Dictionary相当于词典本身,Term Index相当于词典的目录。

举个栗子,假设现在我们输入系统多段文本,经过分词器分词后得到以下词条:

  • elastic
  • flink
  • hadoop
  • kafka
  • spark

ES倒排索引机制

我们使用ES进行全文搜索时,如图所示,系统首先会通过Term Index找到该Term在Term Dictionary中的位置,再通过倒排索引结构找到对应的Posting,从而定位到该词组在文本中的位置,完成一次搜索。

 

http://www.yayakq.cn/news/59687/

相关文章:

  • 优化网站排名方法教程免费wordpress导购主题
  • 昆山网站公司哪家好深圳宝安网站推广
  • 0元试用网站开发网站详情页艺术字怎么做的
  • 网站建设优化广告流量wordpress筛选分类
  • 凡科网的网站建设好用吗如何做谷歌网站优化
  • 网站制作 网站建设 杭州云服务器有哪些
  • 上海弄网站的网站首页弹出图片
  • 做原创短视频网站网站建设需要那些人才
  • 网站不备案可以么十堰seo源头厂家
  • 如何将vs做的网站备份出来营销型网站建设就找山东艾乎建站
  • python网站开发优缺点后台网站如何建设
  • 营口建设工程信息网站深圳网站设计公司哪个
  • 旅行社网站建设方案wordpress注册模板
  • 自建网站需要什么手续顺义建站好的公司
  • 加盟商网站建设seo职位是什么意思
  • 租网站需要多少钱湖南省建筑信息网
  • 网站推广成本电脑网站设计页面
  • 深圳网站建设是哪个取消网站验证码
  • 百度站长平台推出网站移动化大赛做移动端网站设计
  • 免费注册的网站能备案吗四川上网用什么软件
  • seo网站推广收费深圳网站制作hi0755
  • wordpress手机版侧栏导航栏宁波seo服务推广
  • 网站建设安全在线照片处理工具
  • 电商网站网址群晖ds1817做网站
  • 福州网站设计企业建站湖南长沙装修公司
  • 墨西哥网站后缀重新wordpress默认
  • 怎样设置网站关键词上海黄浦区网站建设
  • 网站制作需要学什么语言网络运营商有哪些
  • 企业门户网站建设优势网站推广方式大全
  • Linux哪个版本做网站好郑州市网络科技有限公司