java - Elasticsearch 中的索引是什么

coder 2023-08-27 原文

Elasticsearch 中的索引是什么？一个应用程序有多个索引还是只有一个？

假设您为某家汽车制造商构建了一个系统。它涉及人、汽车、备件等。您是否有一个名为制造商的索引，或者您是否有一个索引用于人，一个用于汽车，第三个用于备件？有人可以解释一下吗？

最佳答案

问得好，答案比人们预期的要微妙得多。您可以将索引用于多种不同目的。

关系指数

最简单和最熟悉的布局克隆了您对关系数据库的期望。您可以(非常粗略地)将索引想象成数据库。

MySQL => 数据库 => 表 => 行/列
ElasticSearch => 索引 => 类型 => 具有属性的文档

一个 ElasticSearch 集群可以包含多个 Indices(数据库)，后者又包含多个 Types(表)。这些类型包含多个 Documents(行)，每个文档都有 Properties(列)。

所以在您的汽车制造场景中，您可能有一个 SubaruFactory 索引。在此索引中，您有三种不同的类型:

人
汽车
Spare_Parts

然后每个类型都包含对应于该类型的文档(例如，Subaru Imprezza 文档位于 Cars 类型中。该文档包含有关该特定汽车的所有详细信息)。

搜索和查询采用以下格式:http://localhost:9200/[index]/[type]/[operation]

所以要检索 Subaru 文档，我可以这样做:

  $ curl -XGET localhost:9200/SubaruFactory/Cars/SubaruImprezza

日志索引

现在，事实是索引/类型比我们在 RDBM 中习惯的数据库/表抽象要灵活得多。它们可以被认为是方便的数据组织机制，根据您设置数据的方式具有额外的性能优势。

为了展示一种截然不同的方法，许多人使用 ElasticSearch 进行日志记录。标准格式是为每一天分配一个新索引。您的索引列表可能如下所示:

logs-2013-02-22
logs-2013-02-21
logs-2013-02-20

ElasticSearch 允许您同时查询多个索引，所以这样做不是问题:

  $ curl -XGET localhost:9200/logs-2013-02-22,logs-2013-02-21/Errors/_search=q:"Error Message"

同时搜索最近两天的日志。由于日志的性质，这种格式具有优势 - 大多数日志从未被查看过，并且它们以线性时间流组织。为每个日志创建索引更合乎逻辑，并提供更好的搜索性能。

用户索引

另一种完全不同的方法是为每个用户创建一个索引。想象一下你有一些社交网站，每个用户都有大量的随机数据。您可以为每个用户创建一个索引。您的结构可能如下所示:

Zach 的索引
- 爱好类型
- friend 类型
- 图片类型
弗雷德指数
- 爱好类型
- friend 类型
- 图片类型

请注意如何以传统的 RDBM 方式轻松完成此设置(例如，“用户”索引，将爱好/ friend /图片作为类型)。然后，所有用户都将被放入一个巨大的索引中。

相反，出于数据组织和性能原因，有时将数据分开是有意义的。在这种情况下，我们假设每个用户都有很多数据，并且我们希望将它们分开。 ElasticSearch 可以让我们为每个用户创建一个索引。

关于java - Elasticsearch 中的索引是什么，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15025876/

Elasticsearch java code li section ruby full-text-search

有关java - Elasticsearch 中的索引是什么的更多相关文章

ruby - 如何从 ruby 中的字符串运行任意对象方法？ - 2
总的来说，我对ruby还比较陌生，我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础，我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法？ - 2
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
ruby - 其他文件中的 Rake 任务 - 2
我试图在一个项目中使用rake，如果我把所有东西都放到Rakefile中，它会很大并且很难读取/找到东西，所以我试着将每个命名空间放在lib/rake中它自己的文件中，我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题，但没有任务。我现在只有一个.rake文件作为测试，名为“servers.rake”，它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时
ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2
作为我的Rails应用程序的一部分，我编写了一个小导入程序，它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是，与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存，我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关，因为当我删除对LDAP内容的调用时，内存使用情况会很好地稳定下来。此外，不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray，它们都是LDAP库的一部分。当我运行导入时，内存使用量最终达到超过1GB的峰值。如果问题存在，我需要找到一些方法来更正我的代
ruby-on-rails - Rails 3 中的多个路由文件 - 2
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情？最佳答案在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中，使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件，我们在StackOverflow上找到一个类似的问题
ruby-on-rails - Rails - 子类化模型的设计模式是什么？ - 2
我有一个模型:classItem项目有一个属性“商店”基于存储的值，我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式？如果方法中没有大的if-else语句，这是如何干净利落地完成的？最佳答案通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.co
ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby 中生成它们？ - 2
我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%
ruby - 解析 RDFa、微数据等的最佳方式是什么，使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2
我主要使用Ruby来执行此操作，但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式，例如使用这个yaml文件，它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i
ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996？但是 4.2%2==0.2 - 2
为什么4.1%2返回0.0999999999999996？但是4.2%2==0.2。最佳答案参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意，这不是与Ruby相关的问题，而是与所有编程语言相关的问题，因为它来自计算机表示实数的方式。关于ruby-为什么4.1%2使用Ruby返

java - Elasticsearch 中的索引是什么

关系指数

日志索引

用户索引

有关java - Elasticsearch 中的索引是什么的更多相关文章

随机推荐