【ElasticSearch系列-01】初识以及安装elasticSearch

huisheng_qaq 2023-04-20 原文

elasticSearch入门和安装

一，elasticSearch入门

官网地址如下：https://www.elastic.co/cn/

1，什么是elasticSearch

用官网的话说就是：Elasticsearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎，它能很方便的使大量数据具有搜索、分析和探索的能力。

2，elasticSearch的底层优点

2.1，全文检索

如在对一个输入框输入东西进行搜索的时候，在使用关系型数据库存储时，那么就需要使用到模糊查询，其sql语句如下。如果是直接使用SQL的模糊查询对数据进行检索，那么下面这条sql语句，在数据量大的时候，会非常的慢，并且最重要的是，根据B+树的底层数据结构，下面这条SQL不走索引，因此在海量数据检索时，一般不会考虑使用这个SQL

select * from product where name like '%衣服%'

针对上述的问题，就可以引入这个为什么使用elasticSearch了。其底层就是会通过一个程序扫描文本的每一个单词，针对单字或者单词建立索引，并保存该单词在文本中的位置、以及出现的次数。然后在用户查询时，就会通过之前建立好的索引来查询，将索引中单词对应的文本位置、出现的次数返回给用户，因为有了具体的文本位置，所以就可以将具体的内容读取出来了。这样速度就非常的高效，并且底层也使用到了索引，即倒排索引。

2.2，倒排索引

2.2.1，正排索引

首先先说一下什么是正排索引，就是底层不会提前建立好索引，而是在查找时，会去判断数据中是否存在这个关键字，如果存在，那么就会记录这个关键字的位置以及出现的次数，这样又有点类似于这个使用sql了。那就以mysql为例子作为这个正排索引，假设有海量数据中包含着以下的数据: java多线程和高并发，那么如果用户直接在搜索框输入java高并发 关键字进行一个模糊查询，那么mysql是肯定不能查询出这条数据的，并且使用like直接不能走索引，还有涉及到回表的问题等等，因此查询效率低，查询的数据不完整。

select * from data like '%java高并发%'

2.2.2，倒排索引

由于正排索引效率并不高，并且查询出来的数据并不完整，因此es底层就参考这个正排索引，设计出了这个倒排索引，主要由id，关键字和这个索引下表index组成。如下有一下数据，都是英文组成，因此关键字就是以一个空格为一个关键字，因此可以对这个倒排索引进行如下的总结：

1，就是会将这些数据进行一个关键字的分词，然后将每一个词建立一个index的下标索引；

2，建立索引之后，就会进行一个去重的操作，根据关键字进行去重，然后再合并，并且将index存放在一起；

3，然后会根据关键字进行一个排序，由于这使用的是英文，所以直接根据首字母进行排序

2.2.3，倒排索引解决的问题

再来分析一下上面的那个用户java高并发关键字的问题，根据倒排索引的原则，首先会对数据进行一个分词，具体怎么分词由分词器决定，具体怎么分词要看使用什么样的分词器。那么就会对这条 java多线程和高并发 数据进行一个分词，如下，这个是数据的分词

id	word	index
1	java	1
2	多线程	1
3	和	1
4	高并发	1

那么在查询时，也会对要查询的数据再做一个分词，如将 java高并发 拆分成java和高并发两个关键字，然后再去和关键字进行一个匹配，然后再获取到下标，即数据对应的位置，由于这里只有一行数据，那么对应的数据就在index所示位置，第一行，这样即让关键字走了索引，也将全部需要的数据检索出来。

2.2.4，正排和倒排总结

正排索引就是根据这个关键字去进行一个全文检索的定位，最后再获取到那一条数据的id，然后根据id获取到那一条数据。倒排就是先将关键词进行一个拆分，然后根据拆分的关键词进行一个数据的定位，定位之后再获取到数据的index索引值，这个值对应的就是数据的id，然后根据id去定位那一条数据。

最大的区别就是：正排是后获取id，然后根据id获取整条数据；倒排是先获取id，就是通过关键字单位获取到的index索引值，然后根据这个id获取到文档中的全部数据 ，简单理解就是正向索引是key找value，反向索引就是通过value找key，这个vaue就是对应的id，数据库中被称为id，es中被称为index。

二，下载安装

如果用原生的方式通过linux安装这些玩意，那么肯定是比较复杂的，因此我这边选择使用docker进行一个安装，本人使用的是腾讯云服务器，内存大小为2核4g的，基本是够用了。

1，elasticsearch安装

1，先设置max_map_count的值

sysctl -w vm.max_map_count=262144

2，这里选择7.x的版本，并且这里安装7.7.0的版本

docker pull elasticsearch:7.7.0

3，接下来运行这个容器，各个参数就先不说了，可以直接去查看官网或者百度。然后输入docker ps命令，也可以发现这个容器已经在运行了

docker run --name elasticsearch -d -e ES_JAVA_OPTS="-Xms512m -Xmx512m" -e "discovery.type=single-node" -p 9200:9200 -p 9300:9300 elasticsearch:7.7.0

4，然后以交互式进入容器

docker exec -it elasticsearch /bin/bash

5，切换到这个config的目录下面

cd config

6，然后编辑里面的这个elasticsearch.yml文件。

vim elasticsearch.yml

要是出现这个没有vim的情况，直接安装这个vim即可，或者也可以使用vi

yum install vim 
//或者上面的直接使用
vi elasticsearch.yml

7，编辑这个elasticsearch.yml的内容如下。编辑完成之后，exit退出

cluster.name: "docker-cluster"
network.host: 0.0.0.0
#设置跨域问题
http.cors.enabled: true 
http.cors.allow-origin: "*"
#设置端口号
http.port: 9200

8，这样es就安装成功了，接下来服务器里面测试一下这个容器是否安装成功

curl 0.0.0.0:9200

9，浏览器输入这个ip + 9200，就可以查看是否安装成功了。如果curl有显示东西而这个浏览器里面访问不了，那么查看一下是不是这个防火墙的问题，或者是服务器端口号没开。有了一下界面，说明es安装成功了。

服务器ip + 9200

2，安装elasticsearch-head

1，安装head头部

docker pull mobz/elasticsearch-head:5

2，查看全部的镜像，查看一下这个mobz/elasticsearch-head:5是否拉取成功

docker images

3，运行这个head，后面可以直接使用这个imageId运行，可以在docker images里面查看这个head的image Id，这个imageID就是上图种的哪个IMAGE ID

docker run -d --name="es-head" -p 9100:9100 imageId

4，服务器里面测试一下这个容器是否安装成功。正常来讲就是安装成功的

curl 0.0.0.0:9100

5，浏览器输入这个ip + 9100，就可以查看是否安装成功了。如果curl有显示东西而这个浏览器里面访问不了，那么查看一下是不是这个防火墙的问题，或者是服务器端口号没开

服务器ip + 9100

6，访问一下，测试一下这个head能否连接成功这个ElasticSearch，如果用的是服务器记得改成服务器的ip + 9200。不然里面默认是localhost:9200，是一直等不到结果的，这样这个head就安装成功了

3，安装kibana

1，拉取kibana镜像，这个版本要和ElasticSearch的版本一致

docker pull kibana:7.7.0

2，创建一个文件夹

mkdir -p /data/elk7/kibana/config/
vi /data/elk7/kibana/config/kibana.yml

这个配置文件文件的内容如下

server.name: kibana
server.host: "0"
elasticsearch.hosts: [ "http://服务器ip:9200" ]
xpack.monitoring.ui.container.elasticsearch.enabled: true

3，运行这个容器

docker run -d --name=kibana --restart=always -p 5601:5601 -v /data/elk7/kibana/config/kibana.yml:/usr/share/kibana/config/kibana.yml kibana:7.7.0

4，最后查看一下kibana的日志，如果有日志出现，那么这个kibana就安装成功了

docker logs -f kibana

最后通过这个 ip + 5601在浏览器访问一下，就可以得到一下的界面，那么这个kibana就算安装好了。

这样安装这一块，基本就没啥问题了。最后查看一下这个全部的镜像，可以发现这些全部都安装好了，看大小占用了2.6个G，还没有配分词器那些，所以如果服务器安装的话，最低选择2核4g的服务器。

有关【ElasticSearch系列-01】初识以及安装elasticSearch的更多相关文章

python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声？ - 2
关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题？更新问题，以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点？我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等)，但我确实想创建一个输出文件。
ruby - 在 64 位 Snow Leopard 上使用 rvm、postgres 9.0、ruby 1.9.2-p136 安装 pg gem 时出现问题 - 2
我想为Heroku构建一个Rails3应用程序。他们使用Postgres作为他们的数据库，所以我通过MacPorts安装了postgres9.0。现在我需要一个postgresgem并且共识是出于性能原因你想要pggem。但是我对我得到的错误感到非常困惑当我尝试在rvm下通过geminstall安装pg时。我已经非常明确地指定了所有postgres目录的位置可以找到但仍然无法完成安装:$envARCHFLAGS='-archx86_64'geminstallpg--\--with-pg-config=/opt/local/var/db/postgresql90/defaultdb/po
ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 完全离线安装RVM - 2
我打算为ruby脚本创建一个安装程序，但我希望能够确保机器安装了RVM。有没有一种方法可以完全离线安装RVM并且不引人注目(通过不引人注目，就像创建一个可以做所有事情的脚本而不是要求用户向他们的bash_profile或bashrc添加一些东西)我不是要脚本本身，只是一个关于如何走这条路的快速指针(如果可能的话)。我们还研究了这个很有帮助的问题:RVM-isthereawayforsimpleofflineinstall?但有点误导，因为答案只向我们展示了如何离线在RVM中安装ruby。我们需要能够离线安装RVM本身，并查看脚本https://raw.github.com/wayn
ruby-on-rails - rails 目前在重启后没有安装 - 2
我有一个奇怪的问题:我在rvm上安装了rubyonrails。一切正常，我可以创建项目。但是在我输入“railsnew”时重新启动后，我有“程序'rails'当前未安装。”。SystemUbuntu12.04ruby-v"1.9.3p194"gemlistactionmailer(3.2.5)actionpack(3.2.5)activemodel(3.2.5)activerecord(3.2.5)activeresource(3.2.5)activesupport(3.2.5)arel(3.0.2)builder(3.0.0)bundler(1.1.4)coffee-rails(
ruby - 如何为 emacs 安装 ruby-mode - 2
我刚刚为fedora安装了emacs。我想用emacs编写ruby。为ruby提供代码提示、代码完成类型功能所需的工具、扩展是什么？最佳答案 ruby-mode已经包含在Emacs23之后的版本中。不过，它也可以通过ELPA获得。您可能感兴趣的其他一些事情是集成RVM、feature-mode(Cucumber)、rspec-mode、ruby-electric、inf-ruby、rinari(用于Rails)等。这是我当前用于Ruby开发的Emacs配置:https://github.com/citizen428/emacs
ruby-on-rails - 无法在centos上安装therubyracer(V8和GCC出错) - 2
我正在尝试在我的centos服务器上安装therubyracer，但遇到了麻烦。$geminstalltherubyracerBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingtherubyracer:ERROR:Failedtobuildgemnativeextension./usr/local/rvm/rubies/ruby-1.9.3-p125/bin/rubyextconf.rbcheckingformain()in-lpthread...yescheckingforv8.h...no***e
ruby-on-rails - 使用一系列等级计算字母等级 - 2
这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间，其中100是最大分数。计算平均分并将字母等级作为字符串返回，即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join，
ruby - 通过 RVM (OSX Mountain Lion) 安装 Ruby 2.0.0-p247 时遇到问题 - 2
我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止，这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search
ruby - 如何在 Lion 上安装 Xcode 4.6，需要用 RVM 升级 ruby - 2
我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby，并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121