草庐IT

java - Elasticsearch 中的索引是什么

coder 2023-08-27 原文

Elasticsearch 中的索引是什么?一个应用程序有多个索引还是只有一个?

假设您为某家汽车制造商构建了一个系统。它涉及人、汽车、备件等。您是否有一个名为制造商的索引,或者您是否有一个索引用于人,一个用于汽车,第三个用于备件?有人可以解释一下吗?

最佳答案

问得好,答案比人们预期的要微妙得多。您可以将索引用于多种不同目的。

关系指数

最简单和最熟悉的布局克隆了您对关系数据库的期望。您可以(非常粗略地)将索引想象成数据库。

  • MySQL => 数据库 => 表 => 行/列
  • ElasticSearch => 索引 => 类型 => 具有属性的文档

一个 ElasticSearch 集群可以包含多个 Indices(数据库),后者又包含多个 Types(表)。这些类型包含多个 Documents(行),每个文档都有 Properties(列)。

所以在您的汽车制造场景中,您可能有一个 SubaruFactory 索引。在此索引中,您有三种不同的类型:

  • 汽车
  • Spare_Parts

然后每个类型都包含对应于该类型的文档(例如,Subaru Imprezza 文档位于 Cars 类型中。该文档包含有关该特定汽车的所有详细信息)。

搜索和查询采用以下格式:http://localhost:9200/[index]/[type]/[operation]

所以要检索 Subaru 文档,我可以这样做:

  $ curl -XGET localhost:9200/SubaruFactory/Cars/SubaruImprezza

.

日志索引

现在,事实是索引/类型比我们在 RDBM 中习惯的数据库/表抽象要灵活得多。它们可以被认为是方便的数据组织机制,根据您设置数据的方式具有额外的性能优势。

为了展示一种截然不同的方法,许多人使用 ElasticSearch 进行日志记录。标准格式是为每一天分配一个新索引。您的索引列表可能如下所示:

  • logs-2013-02-22
  • logs-2013-02-21
  • logs-2013-02-20

ElasticSearch 允许您同时查询多个索引,所以这样做不是问题:

  $ curl -XGET localhost:9200/logs-2013-02-22,logs-2013-02-21/Errors/_search=q:"Error Message"

同时搜索最近两天的日志。由于日志的性质,这种格式具有优势 - 大多数日志从未被查看过,并且它们以线性时间流组织。为每个日志创建索引更合乎逻辑,并提供更好的搜索性能。

.

用户索引

另一种完全不同的方法是为每个用户创建一个索引。想象一下你有一些社交网站,每个用户都有大量的随机数据。您可以为每个用户创建一个索引。您的结构可能如下所示:

  • Zach 的索引
    • 爱好类型
    • friend 类型
    • 图片类型
  • 弗雷德指数
    • 爱好类型
    • friend 类型
    • 图片类型

请注意如何以传统的 RDBM 方式轻松完成此设置(例如,“用户”索引,将爱好/ friend /图片作为类型)。然后,所有用户都将被放入一个巨大的索引中。

相反,出于数据组织和性能原因,有时将数据分开是有意义的。在这种情况下,我们假设每个用户都有很多 数据,并且我们希望将它们分开。 ElasticSearch 可以让我们为每个用户创建一个索引。

关于java - Elasticsearch 中的索引是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15025876/

有关java - Elasticsearch 中的索引是什么的更多相关文章

  1. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  2. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  3. ruby - 其他文件中的 Rake 任务 - 2

    我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

  4. ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2

    作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代

  5. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  6. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

    我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

  7. ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby​​ 中生成它们? - 2

    我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%

  8. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  9. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  10. ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996?但是 4.2%2==0.2 - 2

    为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返

随机推荐