草庐IT

01-Elasticsearch概念和相关软件的安装

OnlyOnYourself-lzw 2023-03-28 原文

一、ElasticSearch的倒排索引

1.1、数据库存在的问题

  • 问题1: 查询title中包含"手机"的信息

    • SELECT * FROM goods WHERE title LIKE '%手机%'
      
    • 使用模糊搜索,左边有通配符,不会走索引,会全表扫描,性能低

  • 问题2:查询title中包含"我要买一部华为手机"的信息

    • SELECT * FROM goods WHERE title LIKE '%我要买一部华为手机%'
      
    • 关系型数据库提供的查询,功能太弱

1.2、倒排索引

了解倒排索引的存储原理

  • 使用新华字典查找汉字,先找到汉字的偏旁部首,再根据偏旁部首对应的目录(索引)找到目标汉字

  • ES样例

    • 文档0(编号0):we like java java java
    • 文档1(编号1):we like lucene lucene lucene
  • 建立倒排索引的流程

    • 首先对所有数据的内容进行拆分(分词),拆分成唯一的一个词语(词条Term)

    • 然后建立词条和每条数据的对应关系(词条在文档出现的位置下标,出现频率),如下所示

    • (Term 词条) (Doc ID,Freq 频率) (Pos 位置)
      we (0,1) (1,1) (0,0)(1,0)
      like (0,1) (1,1) (0,1)(1,1)
      java (0,3) (2,3,4)
      lucene (1,3) (2,3,4)
  • 小结

    • 倒排索引:将每条数据中的内容进行分词,形成词条。然后记录词条和数据的唯一标识(id)的对应关系,形成的产物

二、ElasticSearch存储和搜索原理

理解ElasticSearch存储和搜索原理

  • 假设数据存在以下几条数据
  • ES中存储以及搜索原理图如下所示
    • 说明
      • ES的数据库我们称其为 index (索引库),每条数据我们称之为 document (文档),ES在存储文档的时候,会对它需要分词的字段内容进行切分,切分成一个个词条,再建立每个词条与文档唯一标识(id)的对应关系,即倒排索引
  • 我们再回过头看之间数据库存在的两个问题,通过ES是否能够解决
    • 问题1
      • 性能低:使用模糊查询,左边有通配符,不会走索引,会全表扫描,性能低
      • ES解决方案:如果使用"手机"作为关键字查询,ES生成的倒排索引中,词条会排序,形成一颗树形结构,提升词条的查询速度
    • 问题2
      • 功能弱:如果以"华为手机" 作为条件,查询不出来数据
      • ES解决方案:如果使用"华为手机"作为关键字查询,ES也可以对搜索的关键字进行分词,比如将华为手机拆分成"华为"、"手机",然后根据两个词分词去倒排索引中进行查询,然后取结果的并集

三、ElasticSearch相关概念

理解ElasticSearch和关系型数据库的区别以及分工

3.1、介绍

  • ElasticSearch是Java语言开发的,并作为Apache许可条款下的开放源码发布,基于Lucene实现,是一款分布式、高扩展、近实时的搜索服务,可以基于RESTful web接口进行操作
  • 官网:https://www.elastic.co/
  • 基于Lucene的产品
    • Slor:实时性偏弱,在高并发地写入数据时,Slor需要频繁地构建索引库,而索引库构建影响到查询性能
    • Elasticsearch:实时性非常强(近实时),ES在频繁地构建索引库的同时,不太影响查询的性能

3.2、应用场景

  • 海量数据的查询(京东,淘宝商品搜素)
  • 日志数据分析(ELK ElasticSearch + Logstach + Kibana 搭建日志监控平台)
  • 实时数据分析

3.3、ElasticSearch和MySQL的区别

  • 我们可以把传统关系型数据库MySQL和ElasticSearch进行一下对比

    • MySQL Elasticsearch 说明
      Database Index 索引(index),就是文档的集合,类似数据库(Database)
      Table Type 类型(Type),就是文档的类型,相当于数据库中的表(Table)
      Row Document 文档(Document),就是一条条的数据,类似数据库中的行(Row),文档都是JSON格式
      Column Field 字段(Field),就是JSON文档中的字段,类似数据库中的列(Column)
      Schema Mapping Mapping(映射)是索引中文档的约束,例如字段类型约束。类似数据库的表结构(Schema)
      index Everything is indexed es对存储的所有数据都进行分词建立索引
      SQL DSL(Domain Specification Lanuage)
  • 不难发现,两者均有其优势

    • MySQL:擅长事务类型操作,可以确保数据的安全和一致性,进行复杂的多表查询
    • ElasticSearch:擅长海量数据的搜索、分析、计算
  • 因此在企业中,往往是两者结合使用

    • 对安全性要求较高的写操作,关系复杂的表需求,使用MySQL实现
    • 对查询性能要求较高的搜索需求,使用Elasticsearch实现
    • 两者再基于某种方式,实现数据的同步,保证数据一致性

3.4、小结

  • 数据库查询存在的问题
    • 性能低
    • 功能较弱
  • 倒排索引
    • 将文档中字段的内容进行分词,形成词条和每条数据id的对应关系
  • Elasticsearch概念以及作用
    • 搜索服务器
    • 高性能、功能强大
    • 不是替换MySQL,es做搜索,MySQL做数据存储
    • 索引库(index)= 数据库
    • 类型(type)= 表
    • 映射(mapping)= 表结构
    • 文档(document)= 一行数据
    • 映射参数(field)= 表字段

四、ElasticSearch的安装

4.1、下载镜像

  • 命令
    • docker pull elasticsearch:7.4.1
  • 如下所示
  • Windows下载很简单,去官网下载,解压后启动即可使用

4.2、启动容器

  • 命令

    • docker run -di --name=elasticsearch -p 9200:9200 -v /root/elasticsearch/plugins:/usr/share/elasticsearch/plugins -e "discovery.type=single-node" elasticsearch:7.4.1
      
    • 端口映射:9200

    • 文件夹映射:/usr/share/elasticsearch/plugins

    • 添加环境变量,名为discovery.type=single-node

    • PS:可以暂时不用理解为什么映射这个文件夹,以及后面的"discovery.type=single-node"

  • 如下所示

4.3、浏览器访问

五、Kibana的安装

kibana是elasticsearch的页面可视化工具,类似MySQL的SQLyog等可视化工具

5.1、拉取镜像

  • 命令
    • docker pull kibana:7.4.1
  • 如下所示

5.2、创建容器

  • 命令

    • docker run -id -p 5601:5601 --link elasticsearch --name=kibana -e "ELASTICSEARCH_URL=http://你的自己的ip地址:9200" kibana:7.4.0
      
  • 如下所示

5.3、浏览器访问

有关01-Elasticsearch概念和相关软件的安装的更多相关文章

  1. ruby - 在 64 位 Snow Leopard 上使用 rvm、postgres 9.0、ruby 1.9.2-p136 安装 pg gem 时出现问题 - 2

    我想为Heroku构建一个Rails3应用程序。他们使用Postgres作为他们的数据库,所以我通过MacPorts安装了postgres9.0。现在我需要一个postgresgem并且共识是出于性能原因你想要pggem。但是我对我得到的错误感到非常困惑当我尝试在rvm下通过geminstall安装pg时。我已经非常明确地指定了所有postgres目录的位置可以找到但仍然无法完成安装:$envARCHFLAGS='-archx86_64'geminstallpg--\--with-pg-config=/opt/local/var/db/postgresql90/defaultdb/po

  2. ruby - 完全离线安装RVM - 2

    我打算为ruby​​脚本创建一个安装程序,但我希望能够确保机器安装了RVM。有没有一种方法可以完全离线安装RVM并且不引人注目(通过不引人注目,就像创建一个可以做所有事情的脚本而不是要求用户向他们的bash_profile或bashrc添加一些东西)我不是要脚本本身,只是一个关于如何走这条路的快速指针(如果可能的话)。我们还研究了这个很有帮助的问题:RVM-isthereawayforsimpleofflineinstall?但有点误导,因为答案只向我们展示了如何离线在RVM中安装ruby。我们需要能够离线安装RVM本身,并查看脚本https://raw.github.com/wayn

  3. ruby-on-rails - rails 目前在重启后没有安装 - 2

    我有一个奇怪的问题:我在rvm上安装了ruby​​onrails。一切正常,我可以创建项目。但是在我输入“railsnew”时重新启动后,我有“程序'rails'当前未安装。”。SystemUbuntu12.04ruby-v"1.9.3p194"gemlistactionmailer(3.2.5)actionpack(3.2.5)activemodel(3.2.5)activerecord(3.2.5)activeresource(3.2.5)activesupport(3.2.5)arel(3.0.2)builder(3.0.0)bundler(1.1.4)coffee-rails(

  4. ruby - 如何为 emacs 安装 ruby​​-mode - 2

    我刚刚为fedora安装了emacs。我想用emacs编写ruby。为ruby​​提供代码提示、代码完成类型功能所需的工具、扩展是什么? 最佳答案 ruby-mode已经包含在Emacs23之后的版本中。不过,它也可以通过ELPA获得。您可能感兴趣的其他一些事情是集成RVM、feature-mode(Cucumber)、rspec-mode、ruby-electric、inf-ruby、rinari(用于Rails)等。这是我当前用于Ruby开发的Emacs配置:https://github.com/citizen428/emacs

  5. ruby-on-rails - 无法在centos上安装therubyracer(V8和GCC出错) - 2

    我正在尝试在我的centos服务器上安装therubyracer,但遇到了麻烦。$geminstalltherubyracerBuildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingtherubyracer:ERROR:Failedtobuildgemnativeextension./usr/local/rvm/rubies/ruby-1.9.3-p125/bin/rubyextconf.rbcheckingformain()in-lpthread...yescheckingforv8.h...no***e

  6. ruby - 通过 RVM (OSX Mountain Lion) 安装 Ruby 2.0.0-p247 时遇到问题 - 2

    我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止,这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search

  7. ruby - 如何在 Lion 上安装 Xcode 4.6,需要用 RVM 升级 ruby - 2

    我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby,并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121

  8. ruby - Fast-stemmer 安装问题 - 2

    由于fast-stemmer的问题,我很难安装我想要的任何ruby​​gem。我把我得到的错误放在下面。Buildingnativeextensions.Thiscouldtakeawhile...ERROR:Errorinstallingfast-stemmer:ERROR:Failedtobuildgemnativeextension./System/Library/Frameworks/Ruby.framework/Versions/2.0/usr/bin/rubyextconf.rbcreatingMakefilemake"DESTDIR="cleanmake"DESTDIR=

  9. ruby-on-rails - 相关表上的范围为 "WHERE ... LIKE" - 2

    我正在尝试从Postgresql表(table1)中获取数据,该表由另一个相关表(property)的字段(table2)过滤。在纯SQL中,我会这样编写查询:SELECT*FROMtable1JOINtable2USING(table2_id)WHEREtable2.propertyLIKE'query%'这工作正常:scope:my_scope,->(query){includes(:table2).where("table2.property":query)}但我真正需要的是使用LIKE运算符进行过滤,而不是严格相等。然而,这是行不通的:scope:my_scope,->(que

  10. ruby - 安装 Ruby 时遇到问题(无法下载资源 "readline--patch") - 2

    当我尝试安装Ruby时遇到此错误。我试过查看this和this但无济于事➜~brewinstallrubyWarning:YouareusingOSX10.12.Wedonotprovidesupportforthispre-releaseversion.Youmayencounterbuildfailuresorotherbreakages.Pleasecreatepull-requestsinsteadoffilingissues.==>Installingdependenciesforruby:readline,libyaml,makedepend==>Installingrub

随机推荐