草庐IT

IK分词器

全部标签

Elasticsearch 全文搜索引擎 ---- IK分词器

        原理:分词的原理:二叉树             首先讲一下为什么要出这个文章,前面我们讲过分词方法:中文分词搜索pscws(感兴趣的同学可以去爬楼看一下),那为什么要讲IK分词?最主要的原因是:pscws分词颗粒度不如IK分词的颗粒度高,现在的需求要求颗粒度细一点,以便提高搜索进度,所以我们今天讲一下IK分词    第一步:安转Elasticsearch,这个在博主原来的文章里面有,所以不在讲述,安装完成后运行结果:访问地址:http://localhost:9200        第二步:安转IK扩展(现在下载扩展包):需要选择和自己的Elasticsearch对应的版本,

Linux下安装ElasticSearch-analysis-ik中文分词器插件,以及可能出现的异常处理

一、安装    注意:安装可以采用在线方式、离线方式,但是不建议在线安装,速度超级慢,本文只介绍离线安装方式    第一步:下载ElasticSearch-analysis-ik压缩包            下载地址:https://github.com/medcl/elasticsearch-analysis-ik        切记选择版本需要跟ElasticSearch保持一致,否则可能会出现一些未知的异常导致无法启动,版本不宜过高,根据自己安装的JDK来选择版本,jdk1.8以上版本建议安装elasticsearch8以下的版本,elasticsearch8以上版本需要jdk17版本以

ES-Docker部署的ES中安装IK分词器

前言之前写了Docker部署Elasticsearch和Kinbana,但Elasticsearch毕竟是国外的,对分词方面明显跟不上我们的需求,所以在很多时候,我们都会安装分词器插件,如IK分词器、JieBa分词器等,这篇就是经过自己实践安装的IK分词器安装步骤准备IK分词器的安装文件,可以从官方GitHub仓库或者MavenCentral等渠道获取相应版本的IK分词器。浏览器中输入以下地址即可下载,记得更换自己的版本号,IK分词器版本跟ES版本保持一致https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v

Elasticsearch 8.X 分词插件版本更新不及时解决方案

1、关于Elasticsearch8.XIK分词插件相关问题球友在ElasticSearch版本选型问题中提及:如果要使用ik插件,是不是就使用目前最新的IK对应elasticsearch的版本“8.8.2”?https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v8.8.2如果要使用最新es版本,而IK没有对应的,老师有推荐的其他类似插件吗?谢谢!——问题来源:https://t.zsxq.com/13YX8fFQy2、 说一下 Elasticsearch中文分词插件IKAnalyzer描述:基于词典的中文分词插件。资

Docker安装部署Elasticsearch+Kibana+IK分词器

Docker安装部署Elasticsearch+Kibana+IK分词器Docker安装部署elasticsearch拉取镜像创建数据卷创建网络elasticsearch容器,启动!Docker安装部署Kibana拉取镜像Kibana容器,启动!安装IK分词器安装方式一:直接从github上下载安装方式二词典扩展与停用Docker安装部署elasticsearch目前elastic官网推荐使用的两个版本分别是:8.10.27.17.13我尝试安装8.x版本的,不过似乎由于虚拟机内存大小的原因集群状态总是转为RED无法重置elastic账户的密码,因此我最终选择使用7.x版本的elasticse

elasticsearch学习(六):IK分词器

1、IK分词器简介        IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。IK分词器3.0的特性如下:1)采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。2)采用了多子处理器分析模式,支持:英文字母(IP地址、Email、URL)、数字

ES搜索框架--设置IK分词器

ES的默认中文分词效果太差了,稍微长一点的词句就完全匹配不到,于是选择使用安装IK中文分词器来实现索引的分词。参考:https://blog.csdn.net/w1014074794/article/details/119762827https://www.bbsmax.com/A/6pdDqDaXzw/一、安装官网教程:https://github.com/medcl/elasticsearch-analysis-ik,注意版本对应的问题1.下载从此处下载预构建包:https://github.com/medcl/elasticsearch-analysis-ik/releases根据版本匹

【Unity反向动力学IK】让人物的四肢听你安排!利用IK实现各种动画效果

效果: 一:了解IK1.反向动力学IK(Inversekinematics)可以依据某些子关节的最终位置、角度来反推节点链上其他节点的合理位置,Unity中设置了Avatar的人形角色都支持IK功能。2.使用IK功能需要在Animator视窗对应的层里勾选IKPass,勾选后每帧会调用脚本中的OnAnimationIK()。有五个节点进行设置:左手、右手、左脚、右脚、头部。  注意:人物骨架Rig中AnimationType的设置:Humanoid3.本文涉及API设置Positon及其Weight(权重)Animator.SetLookAtWeigh(floatweight);Animato

windows环境基于Elasticsearch8.4.0的IK中文分词器的安装、部署、使用

目录问题现象:解决方法:1、下载IK中文分词器2、部署3、使用问题现象:前言(选看)   最近在重温Elasticsearch,看来一下官网,都出到8.4.3版本了。想当初学的时候用的还是5.6.8,版本更新了很多意味着有大变动。         windows环境基于Elasticsearch8.4.0的IK中文分词器的安装、部署、使用!解决方法:1、下载IK中文分词器     注意IK的版本号要和Elasticsearch的版本号对应,这里我下载的是8.4.0的IK分词器:     Releases·medcl/elasticsearch-analysis-ik·GitHub     点击

elasticsearch实现入库分词,查询不分词,实现like关键字%

        因为在工作中遇到一个需求,需要对请求内容实现类似于mysql的like"关键字%" 模糊匹配功能,同时要保证效率大数据量效率问题,因此不能使用wildcard在网上看了很多也不太好使,自己琢磨了一下成功了,该功能仅对非中文存储的字段有效果,使用termquery去匹配自己也可以尝试别的方法,特此记录一下,项目使用spring-data-elasticsearch4.0.9(对应elasticsearch版本7.6.2)我本地装的7.9.3也兼容、spring-boot-starter-data-elasticsearch2.3.12一、主要思路:使用edge_ngram实现对数