草庐IT

CASSANDRA

全部标签

mongodb - 那里有什么好的大数据演示/示例应用程序吗?

关闭。这个问题是off-topic.它目前不接受答案。想改进这个问题吗?Updatethequestion所以它是on-topic用于堆栈溢出。关闭10年前。Improvethisquestion我正在寻找一个多服务器大数据示例应用程序,它可用于(a)试验安装和配置大数据应用程序,以及(b)作为开发此类应用程序的示例起点-编辑代码,进行一些更改等...在大多数技术(例如JavaEE)中,此类应用程序非常普遍,并且作为起点非常有用。如果它可以用于基准测试,那就更好了。如果它使用Hadoop、Cassandra、HBase、MongoDB、Hive、Redis中的一个(或多个),那就太好了

cassandra - 如何存储唯一的 "Likes"或 "Views"或按比例设置?

我想深入了解各种公司如何解决计算/增加“喜欢”/“观看”/“转推”或类似规模的数量的问题。在超过5000万月活跃用户的用户群中,我看到Redis和Cassandra都用于存储用户ID集以快速检索设置的基数(例如,观众人数)。这些解决方案有一些缺点,但效果很好,可以而且正在被扩展。不过,我很好奇其他商店在这种情况下使用什么。具体解决办法:使用集合或其他数据结构,还是只是简单的键值对?准确或近似计数,?仅在内存中还是混合?开源解决方案,还是自行开发?是否有人构建了一个轻量级的仅集合存储系统,并在其之上进行了hyperloglog估计? 最佳答案

cassandra - 如何存储唯一的 "Likes"或 "Views"或按比例设置?

我想深入了解各种公司如何解决计算/增加“喜欢”/“观看”/“转推”或类似规模的数量的问题。在超过5000万月活跃用户的用户群中,我看到Redis和Cassandra都用于存储用户ID集以快速检索设置的基数(例如,观众人数)。这些解决方案有一些缺点,但效果很好,可以而且正在被扩展。不过,我很好奇其他商店在这种情况下使用什么。具体解决办法:使用集合或其他数据结构,还是只是简单的键值对?准确或近似计数,?仅在内存中还是混合?开源解决方案,还是自行开发?是否有人构建了一个轻量级的仅集合存储系统,并在其之上进行了hyperloglog估计? 最佳答案

vector - 用于在向量空间中搜索的 NoSQL DB

我对NoSQLDBS(如Cassandra、Mongo、Redis等)完全陌生,我想创建这种类型的结构:{"item_id":"ABC1","x1":0.55,"x2":-0.29,..."x100":0.17}基本上,我有数百万个项目和100个与每个项目关联的float。我的主要任务是搜索靠近给定float向量(在100维向量空间中)的项目,并获取例如前k个项目或距离小于d的所有项目。是否有特别适合此类任务的NoSQL数据库?感谢您的任何提示,帕特里克 最佳答案 据我所知,目前还没有数据库对非(2|3)D空间索引提供开箱即用的支持

vector - 用于在向量空间中搜索的 NoSQL DB

我对NoSQLDBS(如Cassandra、Mongo、Redis等)完全陌生,我想创建这种类型的结构:{"item_id":"ABC1","x1":0.55,"x2":-0.29,..."x100":0.17}基本上,我有数百万个项目和100个与每个项目关联的float。我的主要任务是搜索靠近给定float向量(在100维向量空间中)的项目,并获取例如前k个项目或距离小于d的所有项目。是否有特别适合此类任务的NoSQL数据库?感谢您的任何提示,帕特里克 最佳答案 据我所知,目前还没有数据库对非(2|3)D空间索引提供开箱即用的支持

mongodb - 对于广泛的读写操作 MongoDB vs Cassandra

我使用过MongoDB,但对Cassandra还很陌生。我曾研究过使用MongoDB的应用程序,这些应用程序不是非常大的应用程序。读取和写入操作不是很密集。在那种情况下,MongoDB对我来说效果很好。现在我正在构建一个新的应用程序(具有一些功能,如StackOverflow[投票、总View、建议、评论等]),其中包含对同一项目的大量并发写入操作(将来!)。所以根据网上的资料,MongoDB不是最好的选择(但Cassandra是)。但是问题我是finding在Cassandra中选择正确的数据模型。ConstructModelsaroundyourqueries.Notaroundr

mongodb - 对于广泛的读写操作 MongoDB vs Cassandra

我使用过MongoDB,但对Cassandra还很陌生。我曾研究过使用MongoDB的应用程序,这些应用程序不是非常大的应用程序。读取和写入操作不是很密集。在那种情况下,MongoDB对我来说效果很好。现在我正在构建一个新的应用程序(具有一些功能,如StackOverflow[投票、总View、建议、评论等]),其中包含对同一项目的大量并发写入操作(将来!)。所以根据网上的资料,MongoDB不是最好的选择(但Cassandra是)。但是问题我是finding在Cassandra中选择正确的数据模型。ConstructModelsaroundyourqueries.Notaroundr

node.js - Cassandra 行缓存与 Redis 缓存

我打算使用一些缓存来避免频繁的读取操作(相同的数据)。应用程序是使用Node.js构建的。我正在使用ApacheCassandra数据库。我应该使用Cassandra行缓存还是使用Redis缓存?我已经在使用Redis服务器来缓存PHPsession、GEO空间搜索和缓存PHP应用程序的其他数据。哪个对性能更好?Cassandra行缓存还是Redis缓存? 最佳答案 既然你已经在使用redis服务器,我会倾向于Redis。Redis是一种纯内存解决方案,可与Oracle一致性等竞争。你需要做很多转换,因为列族需要映射到redis的键

node.js - Cassandra 行缓存与 Redis 缓存

我打算使用一些缓存来避免频繁的读取操作(相同的数据)。应用程序是使用Node.js构建的。我正在使用ApacheCassandra数据库。我应该使用Cassandra行缓存还是使用Redis缓存?我已经在使用Redis服务器来缓存PHPsession、GEO空间搜索和缓存PHP应用程序的其他数据。哪个对性能更好?Cassandra行缓存还是Redis缓存? 最佳答案 既然你已经在使用redis服务器,我会倾向于Redis。Redis是一种纯内存解决方案,可与Oracle一致性等竞争。你需要做很多转换,因为列族需要映射到redis的键

Python-Redis : Best practice serializing objects for storage in Redis

我正在考虑使用python和Cassandra序列化大量数据库记录以在Redis中进行缓存。我必须序列化每条记录并在redis中保存一个字符串,或者为每条记录创建一个字典并将其作为字典列表保存在redis中。哪种方式更快?腌制每条记录?或者为每条记录创建一个字典?其次:是否有任何方法可以从数据库中获取dic列表?(而不是模型对象的列表) 最佳答案 您可以将每个字典存储为RedisHASH,而不是将您的字典序列化为字符串并将它们存储在RedisLIST中(这听起来像是您提议的)。如果您的字典是相对简单的键/值对,这应该能很好地工作。创