在 http://www.rethinkdb.com/docs/data-modeling/ , 状态:
Because of the previous limitation, it's best to keep the size of the posts array to no more than a few hundred documents.
如果我打算保留 90 天(3 个月)的统计数据,那么很可能每个日期都有一个包含大约 10 个区域的嵌入式数组。也就是说90*10=900。 900 不完全是几百。
然而,一个相关问题在 MongoDB relationships: embed or reference?建议 MongoDB 有 16mb 的限制,这意味着能够将 3000 万条推文或大约 250,000 个典型的 Stackoverflow 问题作为嵌入式文档进行托管。太多了!
但是,那是 MongoDB。 RethinkDB 对每个文档有 10mb 的限制。这应该仍然相当高。 RethinkDB 的文档可能存在缺陷。或者还有另一个特定原因(未解释),为什么 Rethinkdb 建议只将其减少到几百个嵌入式阵列,即使 10mb 显然可以容纳更多。
我所指的架构的粗略概念:
DailyStat::Campaign
[
{
id: '32141241dkfjhjksdlf',
days_remaining: 26,
status: 'running',
dates: [
{
date: 20130926,
delivered: 1,
failed: 1,
clicked: 1,
top_regions: [
{ region_name: 'Asia', views: 10 },
{ region_name: 'America', views: 10 },
{ region_name: 'Europe', views: 10 },
{ region_name: 'Africa', views: 10 },
{ region_name: 'South East Asia', views: 10 },
{ region_name: 'South America', views: 10 },
{ region_name: 'Northern Europe', views: 10 },
{ region_name: 'Middle East', views: 10 }
]
},
{
date: 20130927,
delivered: 1,
failed: 1,
clicked: 1,
top_regions: [
{ region_name: 'Asia', views: 10 },
{ region_name: 'America', views: 10 },
{ region_name: 'Europe', views: 10 },
{ region_name: 'Africa', views: 10 },
{ region_name: 'South East Asia', views: 10 },
{ region_name: 'South America', views: 10 },
{ region_name: 'Northern Europe', views: 10 },
{ region_name: 'Middle East', views: 10 }
]
},
...
]
}
]
最佳答案
简答:
该帖子指的是每个嵌入式数组的大小,而不是它们大小的总和。所以在你的情况下,大小只有 10,这肯定没问题。
更长的答案:
在文档中使用大型嵌套数组(实际上只是一个大型文档,数组没有什么特别之处)的问题在于,如果您需要更新它,它会变慢。 RethinkDB 现在不做部分更新,所以任何时候你想更新文档,它都需要读取磁盘的整个内容并将整个内容写入磁盘。同样,如果您经常阅读文档但只关心其中的一小部分,这可能会成为一个问题。例如,如果您在文档中有一个非常大的数组,但也有一个小字段,您每次尝试读取小字段时都需要经常从中读取,您将付出读取大数组的代价。
关于mongodb - RethinkDB 能否容纳超过几百个嵌入式数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19031597/
导读语言模型给我们的生产生活带来了极大便利,但同时不少人也利用他们从事作弊工作。如何规避这些难辨真伪的文字所产生的负面影响也成为一大难题。在3月9日智源Live第33期活动「DetectGPT:判断文本是否为机器生成的工具」中,主讲人Eric为我们讲解了DetectGPT工作背后的思路——一种基于概率曲率检测的用于检测模型生成文本的工具,它可以帮助我们更好地分辨文章的来源和可信度,对保护信息真实、防止欺诈等方面具有重要意义。本次报告主要围绕其功能,实现和效果等展开。(文末点击“阅读原文”,查看活动回放。)Ericmitchell斯坦福大学计算机系四年级博士生,由ChelseaFinn和Chri
我正在使用:ruby1.9.2每当0.7.2Capistrano2.9.0capistrano-ext1.2.1我在部署时与Capistrano结合使用来管理我的crontab文件。我注意到它每次都会完全重写我的crontab文件。我希望能够在cron中设置环境变量来控制PATH和MAILTO设置,它们是常规的cron环境变量。有没有办法让whenever不覆盖整个crontab文件,以便我可以将自定义添加到我的crontab文件并确保它们会持续存在? 最佳答案 是的,你可以做到这一点。您只需要为写入crontab的任务分配一个标识
我需要将嵌入式文档转换成它自己的集合,以便它可以从另一个集合中引用。假设我有一个Parent嵌入了许多Child。我在想一些事情:Parent.all.eachdo|p|p.childs.all.eachdo|c|c.raw_attributes['parent_id']=p.idendp.save!#willsaveparentandcascadepersistallchildsontotheirowncollend这是一个选项吗?理想情况下,我会在控制台中运行它,我只会将mongoid映射从embed_*更改为has_*,因此我不需要更改其余代码或使用另一个集合作为暂存。
我刚刚发现MacRuby/HotCocoa,非常喜欢他们正在做的事情的声音。我基本上不考虑自己制作CocoaGUI应用程序的前景,因为我厌恶花时间和精力学习另一种基于C的语言Objective-C。我并不是说它不好,只是不适合我。现在或在可能的future,是否可以完全忽略Objective-C而仅使用MacRuby/HotCocoa来制作具有实质性和一流性质的CocoaGUI应用程序?(编辑:桌面Mac,而非iPhone) 最佳答案 "ItisthegoalofMacRubytoenablethecreationoffull-fl
我正在尝试在对服务器的单个请求中执行多个RQL命令,但我可能会添加但没有成功。我试过r.union,但它只适用于序列。我真正想要的是:[r.db(..).table(..).get(id1).delete(),r.db(..).table(..).get(id2).delete(),r.db(..).table(..).insert(...)].run_all_at_once有什么办法吗?谢谢! 最佳答案 您还可以使用dor.do(r.table('test').insert({value1:"Hey"}),r.table('tes
我可以在一个Rails应用程序中同时使用MongoDB和PostgreSQL吗?具体来说,我最终会想要使用像MongoHQ这样的东西。到目前为止,我未能在实验中进行这项工作。令我担心的是,MongoDB文档特别指出我必须禁用ActiveRecord。任何建议将不胜感激。 最佳答案 您无需禁用ActiveRecord即可使用MongoDB。查看Mongoid只需将gem加上任何模型与您现有的任何ActiveRecord模型一起添加。您应该注意到MongoHQ只是MongoDB的托管服务,可以与任何对象文档映射器(ODM)一起使用。更多
我必须在mongoid模型中添加几个字段,我知道MongoDB没有迁移,但如果我继续而不删除数据库,使rails完全“重新生成”数据库,它不会显示或使用新的领域!去这里最好的方法是什么?有比删除/重新打开mongodb更软的东西吗?提前致谢卢卡 最佳答案 一般来说,应该可以在运行时用新字段更新旧文档。MongoDB中不需要迁移。您可能想编写rake任务以使用新字段和默认值更新旧文档。您可以通过检查那些默认值为nil的新字段来找到这些文档。更新简单风格:如果您使用默认值定义一个新字段,只要您设置了一个新值,就应该始终使用该值:应用程序
我如何从Ruby代码连接到mongodb? 最佳答案 首先,您必须安装MongoDbgem:geminstallmongo然后运行代码:require'rubygems'#notnecessaryforRuby1.9require'mongo'db=Mongo::Connection.new.db("mydb")#ORdb=Mongo::Connection.new("localhost").db("mydb")#ORdb=Mongo::Connection.new("localhost",27017).db("mydb")
我正在尝试使用聚合框架(使用ruby)并像这样投影日期:db['requests'].aggregate([{"$project"=>{_id:0,method:'$method',user:'$user',year:{'$year'=>'$timestamp'}}}])文档是这样的:{_id:ObjectId("5177d7d7df26358289da7dfd"),timestamp:ISODate("2013-04-12T03:58:05+00:00"),method:"POST",status:"200",inputsize:"874",outputsize:"4981",u
我试图通过在Ruby中进行的查询从MongoDB获取字段的子集,但它似乎不起作用。它不返回任何结果这是ruby代码:coll.find("title"=>'Halo',:fields=>["title","isrc"])#thisdoesn'twork如果我删除字段散列,它会工作,返回包含所有字段的结果coll.find("title"=>'Halo')#thisworks查看mongodb控制台,第一个查询在mongodb服务器上结束,如下所示:{title:"Halo",fields:["title","isrc"]}如果我尝试从mongo客户端控制台进行查询,它会工作,我会得到结