草庐IT

CASSANDRA

全部标签

mongodb - 为什么 MongoDB Consistent 不可用而 Cassandra Available 不一致?

蒙戈从这里resource我理解为什么mongo不是A(HighlyAvailable)基于以下声明MongoDBsupportsa“singlemaster”model.Thismeansyouhaveamasternodeandanumberofslavenodes.Incasethemastergoesdown,oneoftheslavesiselectedasmaster.Thisprocesshappensautomaticallybutittakestime,usually10-40seconds.Duringthistimeofnewleaderelection,your

mongodb - 有没有可以有效检测重复项的NoSQL数据库?

我希望实现一个系统,该系统在保存新条目之前搜索重复条目,主要是通过IP地址。由于NoSQL数据库具有最终一致性,这似乎不是一个自然的用例。有没有办法让它发挥作用? 最佳答案 CouchDB在文档的_id字段中强制执行唯一性。这是http://guide.couchdb.org的摘录在CouchDB数据库中,每个文档都必须有一个唯一的_id字段。如果您需要数据库中的唯一值,只需将它们分配给文档的_id字段,CouchDB将为您强制执行唯一性。但有一个警告:在分布式情况下,当您运行多个接受写入请求的CouchDB节点时,只能保证每个节点

sql - 从 sql server 迁移到 cassandra

我有一个数据密集型项目,我最近为其编写了代码,数据和sp位于MSSQL数据库中。我的初步估计是数据库将增长到50TB,然后它将变得相当稳定。最终的应用程序将执行大量的行级查找和读取,并且数据库回写的百分比非常小。考虑到上述情况,有人建议我应该考虑NoSQL选项,以便扩展到大量数据和事务,经过一些研究,道路通向Cassandra(同时考虑MongoDB作为第二种选择)非常感谢您对以下一组初始问题的指导:-Cassandra是否支持存储过程的概念?-我能否在单个节点(单个WindowsServer)上安装和运行50TB数据库?-Cassandra是否支持/在单个服务器中利用多个CPU(例如

mongodb - 使用 Apache Sqoop 将数据从 Mongo/Cassandra 导出到 HDFS

我有一个问题,我必须通过Hive从多个数据源读取数据,即RDBMS(MYSQL、Oracle)和NOSQL(MongoDb、Cassandra)到HDFS。(增量)ApacheSqoop完美适用于RDBMS但不适用于NOSQL,至少我无法成功使用它,(我尝试使用Mongo的JDBC驱动程序......它能够连接到Mongo但无法推送到HDFS)如果有人做过与此相关的工作并可以分享,那将非常有帮助 最佳答案 我使用了一个来自网络的示例,并且能够将文件从Mongo传输到HDFS,反之亦然。我现在无法收集到确切的网页。但该程序如下所示。你

mongodb - 用于博客/内容管理系统的 NoSQL 数据库? (MongoDB/ Cassandra )

我的公司已经使用Oracle很长时间了,但我们希望寻找NoSQL数据库来替代更快的查询和灵活的模式设计。我曾尝试使用MongoDB,它是当今最流行的NoSQL数据库。我将它连接到SpringData来做一些简单的查询,这很容易设置和编码。由于我们正在使用SpringMVC进行Web开发,因此SpringData似乎非常适合集成。不过,我听说Cassandra在写入和读取方面会有更好的性能,尤其是在大型系统中。我不确定是否值得迁移到Cassandra,也不确定如何衡量MongoDB和Cassandra之间的性能。以下是我的系统的一些要求:专注于文章获取为文章打标签,方便用户搜索自己喜欢的

Cassandra 的 Mongodb 聚合框架替代品

由于外部原因,我们考虑从MongoDB切换到Cassandra。Cassandra规模大,写得快,读得好。但我们真正陷入困境的是查询功能。我们积极使用MongoDB查询功能,我们也非常积极地使用mongo的聚合功能。那么,能否请您指出替代技术,它可以补偿monodb丰富的查询和聚合框架?可以是Hadoop还是Spark? 最佳答案 ApacheSpark是最强大的cassandra补充。使用Spark,您可以进行分组、加入、排序、过滤以及您想象的任何操作。有一些项目在Cassandra之上的Spark中构建了一个抽象层,并让您应用此

mongodb - EC2 中 MongoDB 的 EBS 或实例存储?

Cassandra建议为EC2部署使用实例本地存储而不是EBS我正在EC2中部署MongoDB...我是否也应该使用实例本地存储而不是EBSPIOPS? 最佳答案 这是一张关于在EC2上使用MongoDB的混合(实例存储和PIOPSEBS)的幻灯片。http://www.slideshare.net/mongodb/world-high-performance-mongo-db-on-ec2-20140620相关主题:实例存储super快-https://gist.github.com/ktheory/3c3616fca42a371

mongodb - 将来是否可以在整个应用程序中使用基于文档的数据库而不是 RDBMS?

我阅读/使用非sql数据库的次数越多,我就越喜欢它。OOP世界是如此,而且易于使用,就像RailsforFrameworks。我知道缺点。主要问题似乎是无事务和无并发部分。我说得对吗?是否只有这些特性让开发人员难以选择完全使用非SQL数据库,即使是用于事务?如果这些特性是固定的,是否只对应用程序使用基于文档的数据库会更好?因为现在看来您仍然必须使用RDBMS来处理客户账单数据,而您的内容可能位于基于文档的数据库中,例如MongoDB/CouchDB/Cassandra。有人可以阐明这一点。 最佳答案 当然可以,您可以在非关系数据模型

甲骨文 (RAC) 与 NoSQL

我很好奇是否有人针对NoSQL数据库与Oracle(特别是我在谈论OracleRAC)中的数据访问进行了基准测试?该项目需要处理至少10mil+的记录,在其中搜索(但不一定非要实时),read对速度非常重要,保证HA和可靠性(不能丢失记录!!!)我可以亲眼看到Cassandra/MongoDB可能更适合(因为当你处理超过1000万条记录时,键值存储将提供比SQL更快的读取),但我发现很难很好地表达所有这些。任何链接?建议?要点?谢谢! 最佳答案 1000万条记录。假设每条记录250字节。那是大约2.5Gb的数据,完全在基本台式机/笔

mongodb - nosql:MongoDB、Cassandra 或数据仓库的替代方案

我在具体决定是使用MongoDB还是Cassandra来满足我的数据库需求之间犹豫不决,我希望输入有关我的用例的信息来指导我的决定。要求:数据来源X个数据中心包含Y个服务器。每个服务器有N个网络和M个统计信息。例如目前(3个数据中心,总共50个服务器,19个网络和10个统计数据)。这些数字会随着时间的推移而增加。数据获取:每小时为每台服务器解析一个xml页面(~20kb/页)。(~25mb/天)数据存储:有组织的(每小时、每天、每月)结构,使用聚合找到更高的值(小时->天)注意:我们需要能够:动态添加/删除值(数据中心/服务器/网络/统计数据)和可扩展性是一个关键问题,因此我们正在从S