就像许多其他人一样,我正在考虑在 Mongo 中对我的收藏进行分片的正确方法。主要问题是 - 自动分片是如何工作的?
官方文档说——“MongoDB 通过自动分片(分区)架构水平扩展”和“为了对集合进行分区,我们指定了一个分片键模式。”附注“为集合选择正确的分片键很重要”:)。
http://www.mongodb.org/display/DOCS/Sharding+Introduction#ShardingIntroduction-ShardKeys
http://www.mongodb.org/display/DOCS/Choosing+a+Shard+Key
现在的问题是 - “这是正确的 key ”(按 ObjectID 分片)?
db.runCommand({ shardcollection : "test", key : { _id : 1 }})
Mongo 内部发生了什么?在这种情况下,Mongo 如何将数据拆分为 block ?假设我最初有 1000 万条记录和 2 个分片服务器 - 当我想在收集达到 2000 万条记录时再添加 2 个分片服务器时,Mongo 端会发生什么?我在 Mongo 相关资源的任何地方都找不到该级别的详细信息。
考虑到自动生成的_id的随机性及其结构,
... http://www.mongodb.org/display/DOCS/Object+IDs ...
我将按最低有效字节(rtl 顺序)分片, block 按 2-3 个字节的值拆分 - 这将提供一种简单的方法来分片 2^N 个分片服务器 - 2、4、8、..、 256 个分片服务器,每个分片上的负载或多或少均匀,所需配置最少。据我了解,Mongo 仅支持通过明确定义的范围进行分片/分 block ,并且我的想法行不通。是真的吗?
最佳答案
使用默认对象 id 作为分片键通常不是一个好主意,因为它具有嵌入的时间戳并且随时间单调增加。如果您进行大量更新以使其以均匀分布的方式接触新旧文档,这可能会很好。但是,如果您的应用程序的插入量很大,这确实是个坏消息,因为您的大部分写入都将转到单个分片。这是因为写入将转到拥有 [nearCurrentTimestamp -> infinity] block 的分片。
每个 mongos 监控写入分片的流量,并使用非常简单的启发式方法来确定 block 是否变得太大并需要拆分(阈值大小可通过 chunkSize 配置)。
当您向集群添加新分片时,平衡器 (http://www.mongodb.org/display/DOCS/Sharding+Administration#ShardingAdministration-Balancing) 将发现 block 不平衡,并将开始将 block 迁移到新分片。
Mongo 支持基于范围的分片,但是,这并不意味着范围是固定的,因为 block 可以分成更小的范围并随着时间的推移在集群中移动。
关于mongodb - 按 ObjectID 分片,是正确的方法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9164356/
我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div
总的来说,我对ruby还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用
类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc
我正在尝试设置一个puppet节点,但rubygems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter,它工作正常,但如果我通过由rubygems(/usr/bin/facter)安装的二进制文件,它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby
我想了解Ruby方法methods()是如何工作的。我尝试使用“ruby方法”在Google上搜索,但这不是我需要的。我也看过ruby-doc.org,但我没有找到这种方法。你能详细解释一下它是如何工作的或者给我一个链接吗?更新我用methods()方法做了实验,得到了这样的结果:'labrat'代码classFirstdeffirst_instance_mymethodenddefself.first_class_mymethodendendclassSecond使用类#returnsavailablemethodslistforclassandancestorsputsSeco
我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer
设置:狂欢ruby1.9.2高线(1.6.13)描述:我已经相当习惯在其他一些项目中使用highline,但已经有几个月没有使用它了。现在,在Ruby1.9.2上全新安装时,它似乎不允许在同一行回答提示。所以以前我会看到类似的东西:require"highline/import"ask"Whatisyourfavoritecolor?"并得到:Whatisyourfavoritecolor?|现在我看到类似的东西:Whatisyourfavoritecolor?|竖线(|)符号是我的终端光标。知道为什么会发生这种变化吗? 最佳答案
我正在查看instance_variable_set的文档并看到给出的示例代码是这样做的:obj.instance_variable_set(:@instnc_var,"valuefortheinstancevariable")然后允许您在类的任何实例方法中以@instnc_var的形式访问该变量。我想知道为什么在@instnc_var之前需要一个冒号:。冒号有什么作用? 最佳答案 我的第一直觉是告诉你不要使用instance_variable_set除非你真的知道你用它做什么。它本质上是一种元编程工具或绕过实例变量可见性的黑客攻击
我已经从我的命令行中获得了一切,所以我可以运行rubymyfile并且它可以正常工作。但是当我尝试从sublime中运行它时,我得到了undefinedmethod`require_relative'formain:Object有人知道我的sublime设置中缺少什么吗?我正在使用OSX并安装了rvm。 最佳答案 或者,您可以只使用“require”,它应该可以正常工作。我认为“require_relative”仅适用于ruby1.9+ 关于ruby-主要:Objectwhenrun
我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法,但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案 您可以使用update_columns(attr1:val1,attr2:val2