当前位置: 首页 > news >正文

购物网站建设新闻有了网站源码怎么建站

购物网站建设新闻,有了网站源码怎么建站,经典软文广告,wordpress 跳转函数文章目录 分词器以及ik中文分词器概念ik分词器的安装环境准备设置jdk环境变量下载maven安装包并解压设置path验证maven是否安装成功 下载IK分词器并安装 使用IK分词器查询文档term词条查询match全文查询 分词器以及ik中文分词器 概念 ik分词器的安装 因为es自带的分词器对英文…

文章目录

  • 分词器以及ik中文分词器
    • 概念
    • ik分词器的安装
      • 环境准备
        • 设置jdk环境变量
        • 下载maven安装包并解压
        • 设置path
        • 验证maven是否安装成功
      • 下载IK分词器并安装
    • 使用IK分词器
    • 查询文档
      • term词条查询
      • match全文查询

分词器以及ik中文分词器

概念

在这里插入图片描述

在这里插入图片描述

ik分词器的安装

因为es自带的分词器对英文非常友好,但是对中文很不友好,所以我们需要安装一个ik分词器。

特点

​ IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包;

​ 是一个基于Maven构建的项目;

​ 具有60万字/秒的告诉处理能力;

​ 支持用户词典扩展定义;

环境准备

Elasticsearch需要使用ik,就要先构建ik的jar包,这里要用到maven包管理工具,而maven需要java环境,而Elasticsearch内置了jdk,所以可以将JAVA_HOME设置为Elasticsearch内置的jdk。

设置jdk环境变量
vim /etc/profile
#在文件末尾添加jdk的环境变量
export JAVA_HOME=/opt/elasticsearch-7.16.2/jdk
export PATH=$PATH:${JAVA_HOME}/bin#保存退出后,重新加载profile
source /etc/profile
下载maven安装包并解压

在这里插入图片描述

设置path

打开文件

vim /etc/profile.d/maven.sh

将下面的内容复制到文件,保存

export MAVEN_HOME=/opt/apache-maven-3.8.4
export PATH=${MAVEN_HOME}/bin:${PATH}

设置好Maven的路径之后,需要运行下面的命令使其生效

source /etc/profile.d/maven.sh
验证maven是否安装成功
mvn -v

在这里插入图片描述

下载IK分词器并安装

下载地址:https://github.com/medcl/elasticsearch-analysis-ik

在这里插入图片描述

然后把zip包安装到elasticsearch/plugins目录下新建的目录analysis-ik,并解压,如下图:

在这里插入图片描述

然后解压ik分词器,因为ik分词器是zip包,所以需要使用unzip命令解压,如下图:

在这里插入图片描述

解压之后需要把ik的config目录中的所有内容复制到elasticsearch-7.16.2的config配置文件中,如下图:

在这里插入图片描述

最后记得一定要重启Elasticsearch服务!!!

使用IK分词器

IK分词器有两种分词模式:ik_max_word和ik_smart模式。

1.ik_max_word

会将文本做最细颗粒度的拆分,如下图:

在这里插入图片描述

2.ik_smart

这个分词模式的颗粒度比较粗,如下图:

在这里插入图片描述

查询文档

词条查询:term

​ 词条查询不会分析查询条件,只有当词条和查询字符串完全匹配时才匹配搜索。

全文查询:match

​ 全文查询会分析查询条件,先将查询条件进行分词,然后查询,求并集。

term词条查询

term词条查询的例子如下图:

在这里插入图片描述

在这里插入图片描述

为什么什么结果都没有查出来呢?主要是因为ES默认使用的是standar分词器,会把中文一个字一个字的分,所以查不到,如果我们查询的是"北"就能成功查询出来数据了,如下图:

在这里插入图片描述

因此我们在创建索引的时候,就要手动的添加索引为ik分词器,要不然ES使用的一直是默认的standar分词器。

在这里插入图片描述

然后添加三条文档,如下图:

在这里插入图片描述

查询一下结果,如下图:

在这里插入图片描述

重新搜索“北京”关键词,如下图:

在这里插入图片描述

但是如果我现在搜索的词条是"北京昌平",因为我们的文档中没有address字段为"北京昌平"的分词,所以结果什么也查不到,如下图:

在这里插入图片描述

这就是term词条查询,它的搜索关键字会被当做一个整体,不会继续分词,然后拿这个整体去分词库中查询。但是下面的match全文查询不是这样的,它会先把搜索关键字分词,然后拿所有的分词结果去分词库中查询,最后再把查询结果拼接在一起。

match全文查询

在这里插入图片描述

上面是查询结果的并集,不是查询结果的交集。

http://www.yayakq.cn/news/356193/

相关文章:

  • 群晖 做网站华能电子商务平台
  • 代码网站建设建筑有限公司
  • 视频网站怎么做统计什么网站可以做网站
  • 科技部做财务决算的网站是什么成都网站建设司
  • 便宜网站建设公司哪家好wordpress_子网站重命名
  • 公司注册网站官网做网站排名seo
  • 富阳网站建设服务红酒手机网站模板
  • 做网站的开源代码深圳SEO网站建设优化
  • 电子商务网站建设教学大纲企业网站下载
  • 宁夏电力建设工程公司外部网站建一个优化网站多少钱
  • 某鲜花网站的数据库建设四川住房建设厅官方网站
  • 武安网站设计公司杭州网站建设公司慕枫
  • 网站建设需要多长时间农产品的网站建设方案书范文
  • 龙泉驿区建设局网站深圳企业排行
  • 做外汇查哪个网站用ps做网站方法
  • 矿产网站建设价格网站建设石家庄
  • 锐速做网站红色ppt模板免费下载
  • 上海中学门户网站做图表好看的网站
  • 网站建设公司年终总结网站如何提高排名
  • 建设外贸产品展示网站html背景图片代码
  • 建设网站商城需要多少费用吗北京推广网站
  • 园林景观设计案例网站建设网站空间合同
  • 做新闻源网站采集站赚钱c 网站开发案例
  • 百度推广 网站吸引力营销策略ppt
  • 推广引流网站海报设计平台
  • 论坛网站平台建设方案广州seo怎么做
  • 南昌优秀网站建设哈尔滨住房和城乡建设厅网站
  • 金华职院优质校建设网站做明星网站打广告
  • 网站建设与管理课程的目标提供免费空间的网站
  • 建设网站方法有哪些内容做企业网站还有钱挣吗