草庐IT

mongodb - 根据条件从mongodb中删除记录

coder 2023-11-06 原文

嗨,我是 mongodb 的新手,我不知道如何有效地实现以下目标,因为我们收集了大量数据

我想删除那些超过 6 个月的文件 但同时我想为每个 al_object_id 保留最新的 5 条记录,即使已经超过 6 个月。

+--------+---------------------+--------------+
| al_id  |       al_date       | al_object_id |
+--------+---------------------+--------------+
| 224917 | 2012-01-01 00:00:00 |            1 |
| 224918 | 2012-01-02 00:00:00 |            1 |
| 224919 | 2012-01-03 00:00:00 |            1 |
| 224920 | 2012-01-04 00:00:00 |            1 |
| 224921 | 2012-01-05 00:00:00 |            1 |
| 224922 | 2012-01-06 00:00:00 |            1 |
| 224923 | 2012-01-07 00:00:00 |            1 |
| 224925 | 2016-01-01 00:00:00 |          222 |
| 224926 | 2016-01-02 00:00:00 |          222 |
| 224927 | 2016-01-03 00:00:00 |          222 |
| 224928 | 2016-01-04 00:00:00 |          222 |
| 224929 | 2016-01-05 00:00:00 |          222 |
| 224930 | 2016-01-06 00:00:00 |          222 |
| 224931 | 2016-01-07 00:00:00 |          222 |
| 224932 | 2016-01-08 00:00:00 |          222 |
| 224933 | 2016-01-09 00:00:00 |          222 |
| 224934 | 2016-01-10 00:00:00 |          222 |
| 224935 | 2012-01-11 00:00:00 |          222 |
| 224936 | 2012-01-12 00:00:00 |          222 |
| 224937 | 2012-01-13 00:00:00 |          222 |
| 224938 | 2012-01-14 00:00:00 |          222 |
| 224939 | 2012-01-15 00:00:00 |          222 |
| 224940 | 2012-01-16 00:00:00 |          222 |
+--------+---------------------+--------------+

如果对象 al_object_id = 1 的记录在过去 6 个月内没有新更新,所以我想保留最新的 5 个更新并删除其他更新 至于 al_object_id = 222,过去 6 个月有更新,所以我想删除超过 6 个月的记录。所以预期的输出将如下所示

+--------+---------------------+--------------+
| al_id  |       al_date       | al_object_id |
+--------+---------------------+--------------+
| 224923 | 2012-01-07 00:00:00 |            1 |
| 224922 | 2012-01-06 00:00:00 |            1 |
| 224921 | 2012-01-05 00:00:00 |            1 |
| 224920 | 2012-01-04 00:00:00 |            1 |
| 224919 | 2012-01-03 00:00:00 |            1 |
| 224934 | 2016-01-10 00:00:00 |          222 |
| 224933 | 2016-01-09 00:00:00 |          222 |
| 224932 | 2016-01-08 00:00:00 |          222 |
| 224931 | 2016-01-07 00:00:00 |          222 |
| 224930 | 2016-01-06 00:00:00 |          222 |
| 224929 | 2016-01-05 00:00:00 |          222 |
| 224928 | 2016-01-04 00:00:00 |          222 |
| 224927 | 2016-01-03 00:00:00 |          222 |
| 224926 | 2016-01-02 00:00:00 |          222 |
| 224925 | 2016-01-01 00:00:00 |          222 |
+--------+---------------------+--------------+

最佳答案

一种方法是使用 aggregatefindAndModify

您可以执行以下操作:

  1. 按日期降序排列。这可以在 aggregate 方法的 $sort 阶段完成。
  2. 在相同的 aggregate 方法中使用 $group 阶段按 al_object_id 分组。在此阶段,使用 $push 运算符为特定 al_object_id 形成日期数组。这应该为您提供一组 al_object_id 以及每个的日期。
  3. 在上面的结果中使用另一个 $group 阶段以相同的 aggregate 方法找到第五个 al_date 使用 $slice 运算符。
  4. 现在你知道,从上面的聚合方法的输出,日期,(比如 dateThresh),应该删除之前的元素,你可以使用 findAndModify 方法来删​​除那些通过遍历 aggregate 结果来生成文档。另外,不要忘记处理这个:

    if dateThresh < dateSixMonthsAgo:
      remove_all_elements_before_dateThresh
    else:
      remove_all_elements_before_dateSixMonthsAgo
    

关于mongodb - 根据条件从mongodb中删除记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35506392/

有关mongodb - 根据条件从mongodb中删除记录的更多相关文章

  1. ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2

    我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为

  2. ruby - 我可以使用 Ruby 从 CSV 中删除列吗? - 2

    查看Ruby的CSV库的文档,我非常确定这是可能且简单的。我只需要使用Ruby删除CSV文件的前三列,但我没有成功运行它。 最佳答案 csv_table=CSV.read(file_path_in,:headers=>true)csv_table.delete("header_name")csv_table.to_csv#=>ThenewCSVinstringformat检查CSV::Table文档:http://ruby-doc.org/stdlib-1.9.2/libdoc/csv/rdoc/CSV/Table.html

  3. ruby - 我可以使用 aws-sdk-ruby 在 AWS S3 上使用事务性文件删除/上传吗? - 2

    我发现ActiveRecord::Base.transaction在复杂方法中非常有效。我想知道是否可以在如下事务中从AWSS3上传/删除文件:S3Object.transactiondo#writeintofiles#raiseanexceptionend引发异常后,每个操作都应在S3上回滚。S3Object这可能吗?? 最佳答案 虽然S3API具有批量删除功能,但它不支持事务,因为每个删除操作都可以独立于其他操作成功/失败。该API不提供任何批量上传功能(通过PUT或POST),因此每个上传操作都是通过一个独立的API调用完成的

  4. ruby - Sinatra:运行 rspec 测试时记录噪音 - 2

    Sinatra新手;我正在运行一些rspec测试,但在日志中收到了一堆不需要的噪音。如何消除日志中过多的噪音?我仔细检查了环境是否设置为:test,这意味着记录器级别应设置为WARN而不是DEBUG。spec_helper:require"./app"require"sinatra"require"rspec"require"rack/test"require"database_cleaner"require"factory_girl"set:environment,:testFactoryGirl.definition_file_paths=%w{./factories./test/

  5. ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2

    我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征,我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现,但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden

  6. ruby - 在 Ruby 中有条件地定义函数 - 2

    我有一些代码在几个不同的位置之一运行:作为具有调试输出的命令行工具,作为不接受任何输出的更大程序的一部分,以及在Rails环境中。有时我需要根据代码的位置对代码进行细微的更改,我意识到以下样式似乎可行:print"Testingnestedfunctionsdefined\n"CLI=trueifCLIdeftest_printprint"CommandLineVersion\n"endelsedeftest_printprint"ReleaseVersion\n"endendtest_print()这导致:TestingnestedfunctionsdefinedCommandLin

  7. ruby - 定义方法参数的条件 - 2

    我有一个只接受一个参数的方法:defmy_method(number)end如果使用number调用方法,我该如何引发错误??通常,我如何定义方法参数的条件?比如我想在调用的时候报错:my_method(1) 最佳答案 您可以添加guard在函数的开头,如果参数无效则引发异常。例如:defmy_method(number)failArgumentError,"Inputshouldbegreaterthanorequalto2"ifnumbereputse.messageend#=>Inputshouldbegreaterthano

  8. ruby-on-rails - Rails 5 Active Record 记录无效错误 - 2

    我有两个Rails模型,即Invoice和Invoice_details。一个Invoice_details属于Invoice,一个Invoice有多个Invoice_details。我无法使用accepts_nested_attributes_forinInvoice通过Invoice模型保存Invoice_details。我收到以下错误:(0.2ms)BEGIN(0.2ms)ROLLBACKCompleted422UnprocessableEntityin25ms(ActiveRecord:4.0ms)ActiveRecord::RecordInvalid(Validationfa

  9. ruby - 如何安全地删除文件? - 2

    在Ruby中是否有Gem或安全删除文件的方法?我想避免系统上可能不存在的外部程序。“安全删除”指的是覆盖文件内容。 最佳答案 如果您使用的是*nix,一个很好的方法是使用exec/open3/open4调用shred:`shred-fxuz#{filename}`http://www.gnu.org/s/coreutils/manual/html_node/shred-invocation.html检查这个类似的帖子:Writingafileshredderinpythonorruby?

  10. ruby-on-rails - 标准化文件名的字符串,删除重音和特殊字符 - 2

    我正在尝试找到一种方法来规范化字符串以将其作为文件名传递。到目前为止我有这个:my_string.mb_chars.normalize(:kd).gsub(/[^\x00-\x7F]/n,'').downcase.gsub(/[^a-z]/,'_')但第一个问题:-字符。我猜这个方法还有更多问题。我不控制名称,名称字符串可以有重音符、空格和特殊字符。我想删除所有这些,用相应的字母('é'=>'e')替换重音符号,并将其余的替换为'_'字符。名字是这样的:“Prélèvements-常规”“健康证”...我希望它们像一个没有空格/特殊字符的文件名:“prelevements_routin

随机推荐