草庐IT

mongodb - 执行聚合时有没有办法对来自多个文档的结果进行分组

coder 2023-11-05 原文

我是 mongo 的新手,正在尝试执行聚合查询来计算给定文档的时间戳的最小值/最大值。

示例文档如下 -

{
"_id" : ObjectId("5c9cd93adddca9ebb2b3fcba"),
"frequency" : 5,
"s_id" : "30081993",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),

"values" : {
    "1547439900000" : {
        "number_of_values" : 3,
        "min_value" : 32.13,
        "max_value" : 81.42
    },
    "1547440200000" : {
        "number_of_values" : 3,
        "min_value" : 48.08,
        "max_value" : 84.52
    },
    "1547440500000" : {
        "number_of_values" : 2,
        "min_value" : 27.39,
        "max_value" : 94.64
    }
  }
}

{
"_id" : ObjectId("5c9cd851dddca9ebb2b3f2ac"),
"frequency" : 5,
"s_id" : "27061995",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),

"values" : {
    "1547539900000" : {
        "number_of_values" : 31,
        "min_value" : 322.13,
        "max_value" : 831.42
    },
    "1547540200000" : {
        "number_of_values" : 3,
        "min_value" : 418.08,
        "max_value" : 8114.52
    },
    "1547740500000" : {
        "number_of_values" : 2,
        "min_value" : 207.39,
        "max_value" : 940.64
    }
  }
}

我提出了以下适用于单个文档的查询。

    db.testdb.aggregate([
      {
        $match: {
          "s_id": "30081993",
          "frequency": 5,

        }
      },
      {
        $project: {
          _id: 1,
          valuesarray: {
            $objectToArray: "$values"
          }
        }
      },
      {
        $unwind: "$valuesarray"
      },
      {
        $group: {
          "_id": "",
          "min_timestamp": {
            $min: "$valuesarray.k"
          },
          "max_timestamp": {
            $max: "$valuesarray.k"
          }
        }
      }
    ]);

输出如下

{
    "_id" : "",
    "min_timestamp" : "1547439900000",
    "max_timestamp" : "1547440500000"
}

我想要一个聚合查询,它可以计算时间戳的最大/最小值,但对于多个文档,即我想在 $match 阶段使用 $in 运算符,并且获取所有 s_id 的最小值/最大值。这可能吗?

预期:

{
    "_id" : "30081993",
    "min_timestamp" : "1547439900000",
    "max_timestamp" : "1547440500000"
}


{
    "_id" : "27061995",
    "min_timestamp" : "1547539900000",
    "max_timestamp" : "1547740500000"
}

最佳答案

是的,只需要很小的改动就可以使它适用于多个文档。

$match 阶段,指定您的$in 查询:

$match: {
    "s_id": { $in : [ "30081993", "27061995" ] }, 
    "frequency": 5,
}

$project阶段,将s_id重命名为_id,确保我们保持s_id与每个项目相关联文档:

$project: {
    _id: "$s_id",
    valuesarray: {
        $objectToArray: "$values"
    }
}

$group阶段,按_id(最初是s_id)分组,以确保我们在计算之前正确地将时间戳分组在一起$min/$max:

$group: {
    "_id": "$_id",
    "min_timestamp": {
        $min: "$valuesarray.k"
    },
    "max_timestamp": {
        $max: "$valuesarray.k"
    }
}

整个管道:

db.testdb.aggregate([
  {
    $match: {
      "s_id": { $in : [ "30081993", "27061995" ] }, 
      "frequency": 5,
    }
  },
  {
    $project: {
      _id: "$s_id",
      valuesarray: {
        $objectToArray: "$values"
      }
    }
  },
  {
    $unwind: "$valuesarray"
  },
  {
    $group: {
      "_id": "$_id",
      "min_timestamp": {
        $min: "$valuesarray.k"
      },
      "max_timestamp": {
        $max: "$valuesarray.k"
      }
    }
  }
]);

关于mongodb - 执行聚合时有没有办法对来自多个文档的结果进行分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55420636/

有关mongodb - 执行聚合时有没有办法对来自多个文档的结果进行分组的更多相关文章

  1. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  2. ruby-openid:执行发现时未设置@socket - 2

    我在使用omniauth/openid时遇到了一些麻烦。在尝试进行身份验证时,我在日志中发现了这一点:OpenID::FetchingError:Errorfetchinghttps://www.google.com/accounts/o8/.well-known/host-meta?hd=profiles.google.com%2Fmy_username:undefinedmethod`io'fornil:NilClass重要的是undefinedmethodio'fornil:NilClass来自openid/fetchers.rb,在下面的代码片段中:moduleNetclass

  3. ruby-on-rails - 按天对 Mongoid 对象进行分组 - 2

    在控制台中反复尝试之后,我想到了这种方法,可以按发生日期对类似activerecord的(Mongoid)对象进行分组。我不确定这是完成此任务的最佳方法,但它确实有效。有没有人有更好的建议,或者这是一个很好的方法?#eventsisanarrayofactiverecord-likeobjectsthatincludeatimeattributeevents.map{|event|#converteventsarrayintoanarrayofhasheswiththedayofthemonthandtheevent{:number=>event.time.day,:event=>ev

  4. ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2

    我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代

  5. ruby - 难道Lua没有和Ruby的method_missing相媲美的东西吗? - 2

    我好像记得Lua有类似Ruby的method_missing的东西。还是我记错了? 最佳答案 表的metatable的__index和__newindex可以用于与Ruby的method_missing相同的效果。 关于ruby-难道Lua没有和Ruby的method_missing相媲美的东西吗?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/7732154/

  6. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  7. ruby-on-rails - rails 目前在重启后没有安装 - 2

    我有一个奇怪的问题:我在rvm上安装了ruby​​onrails。一切正常,我可以创建项目。但是在我输入“railsnew”时重新启动后,我有“程序'rails'当前未安装。”。SystemUbuntu12.04ruby-v"1.9.3p194"gemlistactionmailer(3.2.5)actionpack(3.2.5)activemodel(3.2.5)activerecord(3.2.5)activeresource(3.2.5)activesupport(3.2.5)arel(3.0.2)builder(3.0.0)bundler(1.1.4)coffee-rails(

  8. ruby - 在没有 sass 引擎的情况下使用 sass 颜色函数 - 2

    我想在一个没有Sass引擎的类中使用Sass颜色函数。我已经在项目中使用了sassgem,所以我认为搭载会像以下一样简单:classRectangleincludeSass::Script::FunctionsdefcolorSass::Script::Color.new([0x82,0x39,0x06])enddefrender#hamlengineexecutedwithcontextofself#sothatwithintemlateicouldcall#%stop{offset:'0%',stop:{color:lighten(color)}}endend更新:参见上面的#re

  9. ruby - 多个属性的 update_column 方法 - 2

    我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法,但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案 您可以使用update_columns(attr1:val1,attr2:val2

  10. ruby - Chef 执行非顺序配方 - 2

    我遵循了教程http://gettingstartedwithchef.com/,第1章。我的运行list是"run_list":["recipe[apt]","recipe[phpap]"]我的phpapRecipe默认Recipeinclude_recipe"apache2"include_recipe"build-essential"include_recipe"openssl"include_recipe"mysql::client"include_recipe"mysql::server"include_recipe"php"include_recipe"php::modul

随机推荐