当前位置: 首页 > news >正文

建站之星官网登陆网站第一关键词怎么做

建站之星官网登陆,网站第一关键词怎么做,百度站长怎样添加网站,网站关键词优化互点前言:本篇博客将介绍Elasticsearch的数据底层原理,涉及数据写入的过程以及相关概念。我们将深入探讨buffer、translog、refresh、commit、flush和merge等核心概念,帮助您更好地理解Elasticsearch的数据存储机制。 写入数据的基本过程 Elast…

在这里插入图片描述

前言:本篇博客将介绍Elasticsearch的数据底层原理,涉及数据写入的过程以及相关概念。我们将深入探讨buffer、translog、refresh、commit、flush和merge等核心概念,帮助您更好地理解Elasticsearch的数据存储机制。
在这里插入图片描述

写入数据的基本过程

在这里插入图片描述

Elasticsearch是一个分布式搜索引擎,数据写入的基本过程如下:

  1. 数据首先被写入buffer,此时数据在buffer中是无法被搜索到的。同时,数据也会被写入translog日志文件,以实现数据的持久化。

  2. 当buffer快要写满或经过一定时间后,会执行refresh操作,将buffer中的数据刷新到一个新的segment文件中。这个刷新的过程实际上是将数据先写入操作系统缓存(os cache)中。每隔1秒钟,Elasticsearch将buffer中的数据写入一个新的segment文件,因此每秒钟会产生一个新的segment文件。如果buffer中没有数据,则不会执行refresh操作,仅会创建一个空的segment文件。只有当数据被刷新到os cache中,才能被搜索到。

  3. 一旦数据进入os cache,该segment文件中的数据就可以被搜索引擎提供给外部使用。

  4. 以上过程会不断重复进行,新的数据不断进入buffer和translog,并被写入一个又一个新的segment文件。每次refresh操作完成后,buffer会被清空,而translog保留。随着数据写入的推进,translog的大小会越来越大。当translog达到一定长度时,会触发commit操作。

  5. 在commit操作中,首先将buffer中的现有数据刷新到os cache中,然后清空buffer。

  6. 接下来,将一个commit point写入磁盘文件,其中包含了该commit point对应的所有segment文件。

  7. 最后,强制将os cache中的所有数据通过fsync操作刷写到磁盘文件中。
    在这里插入图片描述

Translog日志文件的作用

Translog日志文件的作用是在执行commit操作之前,将数据写入专门的日志文件。无论数据是停留在buffer还是os cache中,都是存储在内存中的。一旦机器宕机,内存中的数据将会丢失。

为了防止数据丢失,需要将数据对应的操作写入translog日志文件。在机器重启时,Elasticsearch会自动读取translog日志文件中的数据,并恢复到内存的buffer和os cache中。
在这里插入图片描述

Commit操作和Flush操作

Commit操作是指:

  1. 写入commit point,用于标识该commit point所对应的所有segment文件。
  2. 将os cache中的数据通过fsync操作强制刷写到磁盘文件。
  3. 清空translog日志文件。

Flush操作是对应commit操作的全过程。通过手动执行Flush操作,可以将os cache中的数据通过fsync操作强制刷写到磁盘文件中,并记录一个commit point,同时清空translog日志文件。
在这里插入图片描述

删除操作和更新操作

  • 删除操作:在执行commit操作时,会生成一个.del文件,其中标识某个文档为已删除状态。搜索时,根据.del文件可以知道该文档已被删除。
  • 更新操作:将原始文档标识为已删除状态,然后写入新的数据。
    在这里插入图片描述

Segment文件的管理与Merge操作

  • 每次refresh操作会产生一个新的segment文件,因此默认情况下,每秒钟会创建一个新的segment文件。随着时间推移,segment文件会越来越多。为了优化性能,Elasticsearch会定期执行merge操作。

  • Merge操作将多个segment文件合并为一个,并压缩数据以减少磁盘空间的使用。合并后的segment文件可以提高搜索性能,减少磁盘的随机访问。

  • Merge操作分为两个阶段:合并(Merge)和删除(Delete)。

    • 合并阶段:将多个segment文件合并为一个新的segment文件。在合并的过程中,相同文档ID的数据将会被合并为最新版本,删除标记将会被应用。合并操作会减少segment文件的数量,提高搜索性能。

    • 删除阶段:在合并后的segment文件中,已被标记为删除的数据将会被真正地删除,释放磁盘空间。

  • Merge操作是一个耗时的过程,会占用CPU和磁盘IO资源。为了避免对搜索性能产生负面影响,Elasticsearch会在后台异步执行Merge操作。

  • Merge操作的频率和合并策略可以通过配置进行调整,以满足不同场景的需求。

这就是Elasticsearch数据写入的底层原理。通过理解这些核心概念,您可以更好地管理和优化Elasticsearch集群的性能和存储空间使用。
在这里插入图片描述

http://www.yayakq.cn/news/354110/

相关文章:

  • 网站建设国内现状青岛做网站哪个最好
  • 代做宝网站株洲seo网络优化招聘网
  • 网站建设合同需要注意什么域名注册的网站有哪些
  • 火车站网站建设方案水果店推广营销方案
  • 成都网站建设推来客网站系统秒拍wordpress插件
  • 佛山中小企业网站制作网站推广的途径有哪些
  • 安全的网站建房价在2022年大跌
  • 商丘住房和城乡建设网站宁波营销型网站建设
  • 网站恶意刷注册网页需要多少钱
  • 网站排名和什么有关织梦做导航网站
  • 广州哪家网站建设最好杭州网站开发响应式
  • php企业网站源码wordpress 插件选项
  • 网站备案关闭网站备案时核验单
  • 开发网站公司都需要什么岗位人员qq钓鱼网站
  • 上虞网站建设北京网站定制制作
  • 企业互联网网站定位山西长治一企业
  • 把网站做app小程序开发兼职的小知识点
  • 楚雄建网站网站设计项目书
  • wordpress多城市子站网站建设相关的书籍
  • 做网站可以用思源字体吗网站建设开发维护
  • 郑州做网站公司中百度seo服务公司
  • 新手做站必看 手把手教你做网站建湖人才网最新招聘信息查询
  • 保定网站设计网站三乡网站开发
  • 校园超市网站开发背景宣传片制作合同范本
  • 杭州培训网站建设如何免费创建个人网站
  • 网站纯色背景图怎么做wordpress添加后台菜单
  • wordpress网站制作价格wordpress 添加关键词
  • 学校网站素材网站被收录后又被提出了
  • 培训网站开发哪个好东莞市seo网络推广品牌
  • 衡阳建设学校官方网站建设网站要什么资料