Elasticsearch 8.X 分词插件版本更新不及时解决方案

这篇具有很好参考价值的文章主要介绍了Elasticsearch 8.X 分词插件版本更新不及时解决方案。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、关于 Elasticsearch 8.X IK 分词插件相关问题

球友在 ElasticSearch 版本选型问题中提及:如果要使用ik插件,是不是就使用目前最新的IK对应elasticsearch的版本“8.8.2”?

https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v8.8.2

如果要使用最新es版本,而IK没有对应的,老师有推荐的其他类似插件吗?谢谢!——问题来源:https://t.zsxq.com/13YX8fFQy

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

2、  说一下  Elasticsearch 中文分词插件

  • IK Analyzer

描述:基于词典的中文分词插件。

资源链接:https://github.com/medcl/elasticsearch-analysis-ik

目前业界使用相对广泛,尤其中小型企业。

  • HanLP

描述:基于NLP技术,提供了一系列中文处理能力的分词插件。

资源链接:https://github.com/KennFalcon/elasticsearch-analysis-hanlp
  • Jieba

描述:结巴分词的Elasticsearch插件版本。

资源链接:https://github.com/sing1ee/elasticsearch-jieba-plugin
  • Ansj

描述:速度快,能够识别新词的中文分词插件。

资源链接:https://github.com/NLPchina/elasticsearch-analysis-ansj
  • SmartCN

描述:Elasticsearch自带的基于Lucene的中文分词插件。

资源链接:Elasticsearch官方文档
  • MMSEG

描述:基于词典的复杂切分算法中文分词插件。5.X版本后未再更新

资源链接:https://github.com/medcl/elasticsearch-analysis-mmseg

根据具体的应用场景和需求,可以选择合适的中文分词插件。

另外,需要注意的是,当使用插件时要确保其版本与Elasticsearch版本相匹配,以避免可能出现的兼容性问题。

3、IK 分词插件如何使用最新版本?

开篇提及问题本质:Elasticsearch 更新版本快, 而 IK 更新较慢的问题。举例:如下图所示,当前是 2023年10月20日,Elasticsearch 最新版本为:8.10.4,而 IK 插件的版本为:8.9.0。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

两者类型不匹配,安装的时候会报错。

怎么办?这其实就是开篇问题所在。

咱们可以分析一下 IK 插件的代码,插件源码近1年+几乎没有任何更新。

也就是说:是不是只手动改一下配置文件,自己手动下载部署可不可以呢?

其实是可以的,咱们归拢一下步骤。

步骤1:下载当前最新的 IK 插件。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

步骤2:解压源码

这里的外层文件名是我手动由 8.9.0 改成 8.10.2 的,我的虚拟机集群是 8.10.2 版本。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

修改配置:

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

如上内容由原来的版本号 8.9.0,改成 8.10.2 就可以了!

完成后新版本打包,如下所示,打包为:elasticsearch-analysis-ik-8.10.2.zip文件。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

步骤3:安装 Elasticsearch IK插件。

如下图所示,参考IK的文档,我们采取方式1。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

第一步:解压elasticsearch-analysis-ik-8.10.2.zip到如下的 plugins 下的 ik 文件夹下。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

ik 文件需要我们提前手动创建。

解压后效果:

第二步:重启 Elasticsearch。

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

步骤4:验证 IK 插件是否成功。

这个创建个索引,指定映射中的某个字段为 ik_max_word 或者  ik_smart 就可以了。

PUT test_index_001
{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

4、小结

改动非常小,只为版本适配问题。更多类似问题,欢迎留言交流。

  • 推荐阅读

  • 全网首发!从 0 到 1 Elasticsearch 8.X 通关视频

  • 重磅 | 死磕 Elasticsearch 8.X 方法论认知清单

  • 如何系统的学习 Elasticsearch ?

  • 那些 ChatGPT4 也搞不定的 Elasticsearch 问题,请抛给我们!

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

更短时间更快习得更多干货!

中国50%+Elastic认证专家出自于此!

Elasticsearch 8.X 分词插件版本更新不及时解决方案,elasticsearch,jenkins,大数据,搜索引擎,全文检索

比同事抢先一步学习进阶干货!文章来源地址https://www.toymoban.com/news/detail-734303.html

到了这里,关于Elasticsearch 8.X 分词插件版本更新不及时解决方案的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Microsoft Edge】版本 109.0.1518.55 (正式版本) (64 位) 更新失败解决方案

    109.0.1518.55(正式版本)(64位) 检查更新时出错: 无法创建该组件(错误代码 3: 0x80040154 – system level) 之前电脑日常硬盘百分百(删文件和移动文件都慢得像乌龟一样),想着还是得有个固态好一些,叫了专业人员一看,哦豁主板报废,直接换了台机器,并且给机器加了个固态

    2024年01月17日
    浏览(13)
  • Elasticsearch并发写入版本冲突解决方案

    搜索公众号, AmCoder 干货及时送达👇  众所周知,es经常被用于存储日志数据,其中在某些场景下,日志产生的时机不同,并且需要将多类具备关联关系的日志写入同一个document,就会带来同一个文档可能会被其它文档覆盖,或者missing等问题。 大家都知道es是不支持事务的,

    2023年04月19日
    浏览(22)
  • Elasticsearch深入理解 并发写入导致版本冲突解决方案【实战】

         数据同步中,在使用阿里云Elasticsearch7.10.0版本的集群作为目标数据源时,在连续写入同一文档(document)出现版本冲突问题。 注意:以下所述均以阿里云7.10.0版本的Elasticsearch集群为前提(不同版本可能会稍有不同)       以生产环境的错误日志信息为例: ElasticsearchSta

    2023年04月18日
    浏览(13)
  • vue项目版本打包更新后文件及浏览器存在缓存问题解决方案

    在vue.config.js中配置output,打包后的文件会带时间戳 在public/static目录下新建version.json文件  在src中新建 utils文件夹 文件夹中新建versionUpdate.js文件  在src文件夹下创建addVersion.js  写法二 修改package.json中scripts中的打包命令 版本号自加使用fs修改文件来实现 具体思路是:在执行

    2024年02月11日
    浏览(12)
  • Elasticsearch 分词器详解(热更新词库)

    text类型数据存入ES经过的步骤: 查看分词效果: java 核心代码: 部署java: 修改es配置文件: 重启ES: 测试:

    2024年02月16日
    浏览(14)
  • es elasticsearch 十 中文分词器ik分词器 Mysql 热更新词库

    目录 中文分词器ik分词器 介绍 安装 使用分词器 Ik分词器配置文件 Mysql 热更新词库 介绍 中文分词器按照中文进行分词,中文应用最广泛的是ik分词器 安装 官网下载对应版本zip 下载  放到  plugins 目录 新建 ik文件夹 考入解析zip 重启 es //分成小单词 使用分词器 ik_max_word分成

    2024年02月07日
    浏览(20)
  • 成功解决 Nginx更新静态资源无效 ,Nginx静态资源更新不及时,Nginx清除缓存

    使用 nginx做动静分离,在将服务器中的静态资源修改后,访问页面,发现页面没有及时更新。 我这里是清除了浏览器缓存。 有关nginx禁止走缓存、直接走服务器请参考以下文章。 资料参考:Nginx更新静态资源不生效 我更新了静态资源下的一个文件。然后正常情况应该是在点

    2024年02月16日
    浏览(12)
  • Elasticsearch安装分词插件[ES系列] - 第499篇

    历史文章( 文章 累计490+) 《 国内最全的Spring Boot系列之一 》 《 国内最全的Spring Boot系列之二 》 《 国内最全的Spring Boot系列之三 》 《 国内最全的Spring Boot系列之四 》 《 国内最全的Spring Boot系列之 五 》 《 国内最全的Spring Boot系列之六 》 ElasticSearch应用场景以及技术

    2024年02月02日
    浏览(13)
  • Elasticsearch7.X集成jieba分词插件

    jieba 分词是中文里面比较好的分词器,而当前 Elasticsearch 官方没有直接集成 jieba 分词,需要我们通过配置 plugins 的方式使用jieba分词器作为es的analyzer。 centOS7 elasticsearch 7.9.0 elasticsearch-jieba-plugin-7.4.2 (简单的修改,即可适配不同版本的ES) jieba分词插件github地址 本次下载的是

    2023年04月09日
    浏览(37)
  • Docker部署elasticsearch及安装IK分词器插件

    1、拉取启动es镜像 docker run -d --name elasticsearch -p 9200:9200 -p 9300:9300 -e \\\"discovery.type=single-node\\\" elasticsearch:7.6.2 以上方法为正常安装,但是es是重量级框架,内存耗用多。据实际硬件情况,可参考如下安装方式限制es的内存为64M-512M之间,若需要配置设置网络可自行创建网络并用--n

    2024年04月12日
    浏览(14)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包