草庐IT

mongodb - 用于过滤多个索引/字段的最佳 NoSQL

coder 2023-10-28 原文

由于需要查询的数据的大小以及在多个节点上根据需要扩展的能力,我正在考虑使用某种类型的 NoSQL 数据库。 我一直在研究大量的 NoSQL 产品,但还不能决定什么是可以为我们的数据结构提供最佳性能、可扩展性和特性的最佳选择。

数据结构模型属于产品目录,其中每个文档/集合都包含该单个产品的某些属性和描述。属性会因产品而异,这就是无模式产品最有效的原因。

示例结构如下

[
 {"name": "item name",
  "cost": 563.34,
  "category": "computer",
  "manufacturer: "sony",
.
.
.
 }
]

所以要求是我需要能够过滤/查询记录集中的许多不同的数据集字段/索引,我可以在同一个查询中过滤和排除多个索引/字段。查询主要是读取,不需要任何连接或关系类型的链接。

我研究过:Elastic Search、mongodb、OrientDB、Couchbase 和 Aerospike。

  • Elastic Search 似乎是一个显而易见的选择,但我想知道它的性能和稳定性?
  • Aerospike 似乎真的很快,因为它主要在内存中完成所有操作,但它的过滤和搜索功能似乎并不那么强大

您认为我的用例的最佳选择是什么?或者是否还有其他我应该研究的推荐数据库。

我知道最好的方法是使用真实的实际用例来测试性能,但我希望先缩小范围。

谢谢

最佳答案

这是流行问题“什么是最好的产品”的变体:)

一如既往:这取决于您的具体用例和目标。数据库产品(与所有产品一样)始终是权衡取舍的结果。因此,不存在提供最佳性能、可扩展性和功能 的单一产品。然而,有许多非常好的产品适合您的用例。

因为您的问题是关于产品数据的,而我在产品数据方面的工作已超过 15 年,因此它会尝试回答您的问题。

  • 文档模型非常适合产品数据。因此,对于除简单查找之外的所有用例,我会推荐文档存储
  • 如果您的用例涉及单个应用程序并且您正在使用 Java 平台。我建议使用嵌入式数据库。这使事情变得更简单,并且具有很大性能优势
  • 如果您需要分面搜索或其他高级产品搜索,我建议您使用 SOLR 或 Elastic Search
  • 如果您需要分布式系统,我推荐使用 Elastic Search 而不是 SOLR
  • 如果您需要基于评论或其他面向图形的算法的产品推荐,我建议使用 OrientDB 或 ArangoDB(或 Neo4J,但在这种情况下,这是我的第二选择)

我们在生产中使用或针对您描述的用例进行深入评估的产品是

  • SOLR 和 ES。两款设计精良的产品。两者(也是ES)成熟稳定的产品
  • Neo4J。最成熟的图数据库。 IMO 的一大优势是很棒 query language他们使用。集成 Lucene 引擎。非常成熟且设计精良的产品。缺点是它不是文档图而是属性(键值)图。它也可能很昂贵
  • MongoDB。我们对文档存储的第一次体验。很好的产品。最大优势:出色的文档,(到目前为止)最流行的 NoSQL 数据库
  • OrientDB 和 ArangoDB。两者都支持图形/文档范式。这是鲜为人知的产品,但功能非常强大。因为我们是一家基于 Java 的商店,所以我们更喜欢 OrientDB。 OrientDB 集成了 Lucene 引擎(虽然实现起来很简单)。另一方面,ArangoDB 有很好的文档和非常智能和高效的存储格式,最后 AQL 也非常好!
  • 性能:(使用 11.43 mio 文章和 2.3 mio 产品进行测试)。所有产品都非常快,尤其是在这个用例中的 SOLR 和 ES。 嵌入式 OrientDB 在导入和简单查询方面也非常快速。对于分面搜索,只有搜索服务器才能提供真正快速的性能!
  • 底线:我会选择图形/文档存储和/或搜索服务器(SOLR 或 ES)。因为您提到了“过滤”(我假设是分面搜索)。搜索服务器是显而易见的首选

关于mongodb - 用于过滤多个索引/字段的最佳 NoSQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28327022/

有关mongodb - 用于过滤多个索引/字段的最佳 NoSQL的更多相关文章

  1. ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2

    很好奇,就使用ruby​​onrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提

  2. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  3. ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2

    我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代

  4. ruby-on-rails - Rails 常用字符串(用于通知和错误信息等) - 2

    大约一年前,我决定确保每个包含非唯一文本的Flash通知都将从模块中的方法中获取文本。我这样做的最初原因是为了避免一遍又一遍地输入相同的字符串。如果我想更改措辞,我可以在一个地方轻松完成,而且一遍又一遍地重复同一件事而出现拼写错误的可能性也会降低。我最终得到的是这样的:moduleMessagesdefformat_error_messages(errors)errors.map{|attribute,message|"Error:#{attribute.to_s.titleize}#{message}."}enddeferror_message_could_not_find(obje

  5. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  6. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  7. ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2

    我有一个表单,其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在?solve_problem_pathdo|f|%>... 最佳答案 创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss

  8. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

    我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

  9. ruby - 多个属性的 update_column 方法 - 2

    我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法,但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案 您可以使用update_columns(attr1:val1,attr2:val2

  10. ruby-on-rails - 在 ruby​​ .gemspec 文件中,如何指定依赖项的多个版本? - 2

    我正在尝试修改当前依赖于定义为activeresource的gem:s.add_dependency"activeresource","~>3.0"为了让gem与Rails4一起工作,我需要扩展依赖关系以与activeresource的版本3或4一起工作。我不想简单地添加以下内容,因为它可能会在以后引起问题:s.add_dependency"activeresource",">=3.0"有没有办法指定可接受版本的列表?~>3.0还是~>4.0? 最佳答案 根据thedocumentation,如果你想要3到4之间的所有版本,你可以这

随机推荐