首先,我知道这个问题:
Auto compact the deleted space in mongodb?
我的问题不是关于缩小数据库文件大小,而是更多关于重用已删除空间的问题。假设我在一个集合中有 100K 文档,然后我删除了其中的 50K。 Mongo 会重复使用已删除文档释放的数据文件中的空间吗?还是只是将它们“标记”为已删除?
我不太关心磁盘上文件的实际大小,更关心的是“它是否会不断增长”。
最佳答案
更新(2015 年 3 月):截至 3.0 版本,有多个 storage engines在 MongoDB 中可用。这个答案适用于 MMAP 存储引擎(在 MongoDB 3.0 中仍然是默认的),其他引擎(例如 WiredTiger)的答案是完全不同的,很可能是可调和可调的。因此,如果您使用其他引擎,请阅读该存储引擎的相关文档以确定您的空间重用默认值和选项。
使用 MMAP 存储引擎,当文档被删除时,留下的空间会被放入空闲列表中。但是,要使用该空间,稍后需要插入类似大小的文档,并且 MongoDB 需要在特定时间范围内为该文档找到合适的空间(一旦查看列表超时,它将只是追加)否则空间再利用不会经常发生。此删除是在数据文件中完成的,因此这里不会发生磁盘空间回收 - 所有这些都是在现有数据文件内部完成的。
如果您随后执行 repair , 或 resync a secondary从头开始,数据文件被重写并且磁盘上的空间将被回收(文档上的任何填充也被删除)。这是您将在磁盘上看到实际空间回收的地方。对于任何其他操作(包括 compact),磁盘使用率不会改变,甚至可能会增加。
使用 2.2+ 您现在可以使用 collMod command和 usePowersOf2Sizes使删除空间更有可能重复使用的选项(注意这是default in 2.6 +)。这意味着文档的初始空间分配效率稍低(例如 400 字节文档为 512 字节),但意味着当插入新文档时,它更有可能重新使用该空间。如果您要删除(或增长并因此移动)大量文档,那么从长远来看,这将更有效率。
对于任何感兴趣的人,其中一位编写了大量存储代码 (Mathias Stearn) 的人对存储内部结构进行了很好的介绍,可以是 found here
关于mongodb - MongoDB 是否重用已删除的空间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13390160/
给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru
我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为
查看Ruby的CSV库的文档,我非常确定这是可能且简单的。我只需要使用Ruby删除CSV文件的前三列,但我没有成功运行它。 最佳答案 csv_table=CSV.read(file_path_in,:headers=>true)csv_table.delete("header_name")csv_table.to_csv#=>ThenewCSVinstringformat检查CSV::Table文档:http://ruby-doc.org/stdlib-1.9.2/libdoc/csv/rdoc/CSV/Table.html
这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife
我发现ActiveRecord::Base.transaction在复杂方法中非常有效。我想知道是否可以在如下事务中从AWSS3上传/删除文件:S3Object.transactiondo#writeintofiles#raiseanexceptionend引发异常后,每个操作都应在S3上回滚。S3Object这可能吗?? 最佳答案 虽然S3API具有批量删除功能,但它不支持事务,因为每个删除操作都可以独立于其他操作成功/失败。该API不提供任何批量上传功能(通过PUT或POST),因此每个上传操作都是通过一个独立的API调用完成的
我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案
我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查
我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/
这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下
我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI