草庐IT

具有条件总和的 MongoDB 聚合

coder 2023-10-28 原文

我必须做一个特殊的 mongoDB 查询。

我有一个包含这些文档的集合:

{
    "_id" : ObjectId("53c7fd86d624b06abc76e8f6"),
    "works" : [ 
        {
            "code" : "A001",
            "name" : "Cambiar bombilla",
            "orderId" : "53c7fd86d624b06abc76e8f6",
            "price" : 1400,
            "ID" : 1,
            "lazyLoaded" : true,
            "status" : 0,
            "Date" : ISODate("2014-07-21T10:31:55.063Z"),
            "TechnicianId" : "538efd918163b19307c59e8e",
            "_id" : ObjectId("53ccec1bf2bf4d5952b2f205")
        }, 
        {
            "code" : "A005",
            "name" : "Cambiar bombilla 5",
            "price" : 1050,
            "type" : "Bombillas",
            "TechnicianId" : "5383577a994be8b9a9e3f01e",
            "_id" : ObjectId("53ccfdbdf2bf4d5952b2f206")
        }, 
        {
            "code" : "A004",
            "name" : "Cambiar bombilla 4",
            "price" : 1010,
            "type" : "Bombillas",
            "TechnicianId" : "5383577a994be8b9a9e3f01e",
            "date" : "2014-07-21T11:50:52.702Z",
            "orderId" : "53c7fd86d624b06abc76e8f6",
            "_id" : ObjectId("53ccfe9c109c100000ad688a")
        }, 
        {
            "code" : "A002",
            "name" : "Cambiar bombilla 2",
            "price" : 1030,
            "type" : "Bombillas",
            "TechnicianId" : "5383577a994be8b9a9e3f01e",
            "date" : "2014-07-21T11:57:37.065Z",
            "orderId" : "53c7fd86d624b06abc76e8f6",
            "_id" : ObjectId("53cd0036109c100000ad688b")
        }, 
        {
            "code" : "A003",
            "name" : "Cambiar bombilla 3",
            "price" : 1050,
            "type" : "Bombillas",
            "TechnicianId" : "5383577a994be8b9a9e3f01e",
            "date" : "2014-07-21T11:59:35.586Z",
            "orderId" : "53c7fd86d624b06abc76e8f6",
            "_id" : ObjectId("53cd00a7109c100000ad688c")
        }
    ],
    "Items" : [ 
        {
            "_id" : "534ba71f394835a7e51dd938",
            "total":50
            "qty" : 2
        }, 
        {
            "_id" : "534664b081362062015d1b77",
            "qty" : 2,
            "total":30
        }
    ]}

现在,我想查询 TechnicianId=5383577a994be8b9a9e3f01e 的作品,这些作品的“价格”之和减去项目之和。总计,这些文件的总作品数量减去总和项目总数。

对于这个例子,我想要这样的东西:

{
    "result" : [ 
        {
            "_id" : ObjectId("53c7fd86d624b06abc76e8f6"),
            "works.totalsumfortech" : 1050+1010+1030+1050 - (50+30),//Sum of works of this technicianId deducting the items.total qty
            "works.total":1400+1050+1010+1030+1050-(50+30)//Summ of all works of document deducting the items.total qty
        }
    ],
    "ok" : 1
}

这是我当前的查询,但我没有得到预期的结果..

db.orders.aggregate([
        { "$match": {
            "$and": [
                {"OrderState": {$in:['Review','Archived']}},
                {'works.TechnicianId':'5383577a994be8b9a9e3f01e'}
            ]
        }},
        {$group: {
         _id: "$_id",
         'total': {$subtract:[{$sum: { $cond: [ { $eq: [ "$works.TechnicianId", "5383577a994be8b9a9e3f01e" ] } , 2, 1 ]},{$sum: '$Items.total'}]
         'total': {$subtract:[{$sum: '$works.price'},{$sum: '$Items.total'}]
         }
         }]);

最佳答案

现代

对于现代版本的 MongoDB,这实际上要容易得多。在特定情况下,没有跨文档的实际“聚合”,尽管返回的数据和要应用的“文档内聚合”显着减少。

现代对此的看法允许从数组中的数据中进行这种 reshape 和选择,而无需诉诸 $unwind$group为了处理:

db.getCollection('orders').aggregate([
  { "$match": {
    //"OrderState": { "$in":["Review","Archived"]},
    "works.TechnicianId":"5383577a994be8b9a9e3f01e"
  }},
  { "$project": {
    "works": {
      "$let": {
        "vars": {
          "techTotal": {
            "$sum": {
              "$map": {
                "input": { 
                  "$filter": {
                    "input": "$works",
                    "cond": {
                      "$eq": [
                        "$$this.TechnicianId",
                        "5383577a994be8b9a9e3f01e"
                      ]
                    }
                  }
                },
                "in": "$$this.price"
              }    
            }
          },
          "items_total": { "$sum": "$Items.total" },
          "worksTotal": { "$sum": "$works.price" }
        },
        "in": {
          "totalSumForTech": {
            "$subtract": [ "$$techTotal", "$$items_total" ]
          },
          "total": {
            "$subtract": [ "$$worksTotal", "$$items_total" ]
          }
        }
      }
    }
  }}
])

自最初询问以来的变化是 $sum$project 中使用时接受“数组”作为输入或类似的舞台环境,除了作为蓄能器的传统角色。因此,与其“展开”数组,不如执行 { "$sum": "$Items.total"} 之类的操作,它通过内部符号从指定属性重新调整值数组,然后通过 $sum “减少”这些值.这本身就是一个很大的改进。

其他改进是 $map$filter .应用后者是为了仅将数组的匹配条目返回到给定条件,而对于前者,则允许“ reshape ”数组内容。两者都是其他编程语言中处理数组的常用方法,在这里功能基本相同。

这意味着您可以根据需要从 "works" 数组中提取与技术人员匹配的 "price" 值,然后使用 $sum 合计这些值以与前面所述相同的方式作为“值数组”。

另外一个是$let ,它允许使用“变量”声明 block 以供在该 block 内使用。在这种情况下,我们可以从数组中计算出这些“总数”,然后应用 $subtract计算值以得出最终结果。

与早期版本相比的优势在于您可以在不分离聚合管道阶段的情况下执行此操作。当然,这里可以使用 $$items_total 来代替重复完整的语句来计算。此外,计算的一般分离使最终输出 block 更容易阅读。所以它实际上只是“使用变量”,就像您在常规编程中所做的一样。

这里的最大收获是这变得简单 $match$project ,而不是为了从每个文档获得最终计算结果的整个流水线阶段链。


原创

如前所述,您需要使用$unwind在 MongoDB 聚合中使用数组时。除非您这样做,否则聚合操作不适用于每个数组元素。

这里的其他问题是在 $group 内流水线阶段的所有“顶层”操作都需要 group aggregation operators .不像$subtract的东西不允许,因此您需要在 $sum 之类的范围内执行这些操作在可能的情况下或在另一个管道阶段:

db.orders.aggregate([

    // Match documents "and" is implied in MongoDB. Not required unless
    // against the same field
    { "$match": {
        "OrderState": { "$in":["Review","Archived"]},
        "works.TechnicianId":"5383577a994be8b9a9e3f01e"
    }},

    // Unwind Items first
    { "$unwind": "$Items" },

    // Group to get that total
    { "$group": {
        "_id": "$_id",
        "works": { "$first": "$works" },
        "items_total": { "$sum": "$Items.total" }
    }},

    // Unwind works to "de-normalize"
    { "$unwind": "$works" },

    // Group conditionally on "TechnicianId" and the full total
    { "$group": {
        "_id": "$_id",
        "techTotal": {
            "$sum": {
                "$cond": [ 
                    { "$eq": [ 
                        "$works.TechnicianId", 
                        "5383577a994be8b9a9e3f01e"
                    ]},
                    "$works.price",
                    0 
                ]
            }
        },
        "worksTotal": { "$sum": "$works.price" },
        "items_total": { "$first": "$items_total" }
    }},

    // Project to do math and other re-shaping
    { "$project": {
        "works": {
            "totalSumForTech": {
                "$subtract": [ "$techTotal", "$items_total" ]
            },
            "total": {
                "$subtract": [ "$worksTotal", "$items_total" ]
            }
        }
    }}
])

在示例文档中(虽然我需要删除 $match 因为该数据不存在于您的示例中)结果是:

{
    "_id" : ObjectId("53c7fd86d624b06abc76e8f6"),
    "works" : {
            "totalSumForTech" : 4060,
            "total" : 5460
    }
}

关于具有条件总和的 MongoDB 聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24907631/

有关具有条件总和的 MongoDB 聚合的更多相关文章

  1. ruby - 具有身份验证的私有(private) Ruby Gem 服务器 - 2

    我想安装一个带有一些身份验证的私有(private)Rubygem服务器。我希望能够使用公共(public)Ubuntu服务器托管内部gem。我读到了http://docs.rubygems.org/read/chapter/18.但是那个没有身份验证-如我所见。然后我读到了https://github.com/cwninja/geminabox.但是当我使用基本身份验证(他们在他们的Wiki中有)时,它会提示从我的服务器获取源。所以。如何制作带有身份验证的私有(private)Rubygem服务器?这是不可能的吗?谢谢。编辑:Geminabox问题。我尝试“捆绑”以安装新的gem..

  2. ruby - 如何根据特征实现 FactoryGirl 的条件行为 - 2

    我有一个用户工厂。我希望默认情况下确认用户。但是鉴于unconfirmed特征,我不希望它们被确认。虽然我有一个基于实现细节而不是抽象的工作实现,但我想知道如何正确地做到这一点。factory:userdoafter(:create)do|user,evaluator|#unwantedimplementationdetailshereunlessFactoryGirl.factories[:user].defined_traits.map(&:name).include?(:unconfirmed)user.confirm!endendtrait:unconfirmeddoenden

  3. ruby - 在 Ruby 中有条件地定义函数 - 2

    我有一些代码在几个不同的位置之一运行:作为具有调试输出的命令行工具,作为不接受任何输出的更大程序的一部分,以及在Rails环境中。有时我需要根据代码的位置对代码进行细微的更改,我意识到以下样式似乎可行:print"Testingnestedfunctionsdefined\n"CLI=trueifCLIdeftest_printprint"CommandLineVersion\n"endelsedeftest_printprint"ReleaseVersion\n"endendtest_print()这导致:TestingnestedfunctionsdefinedCommandLin

  4. ruby - 定义方法参数的条件 - 2

    我有一个只接受一个参数的方法:defmy_method(number)end如果使用number调用方法,我该如何引发错误??通常,我如何定义方法参数的条件?比如我想在调用的时候报错:my_method(1) 最佳答案 您可以添加guard在函数的开头,如果参数无效则引发异常。例如:defmy_method(number)failArgumentError,"Inputshouldbegreaterthanorequalto2"ifnumbereputse.messageend#=>Inputshouldbegreaterthano

  5. ruby-on-rails - Rails 3.1 中具有相同形式的多个模型? - 2

    我正在使用Rails3.1并在一个论坛上工作。我有一个名为Topic的模型,每个模型都有许多Post。当用户创建新主题时,他们也应该创建第一个Post。但是,我不确定如何以相同的形式执行此操作。这是我的代码:classTopic:destroyaccepts_nested_attributes_for:postsvalidates_presence_of:titleendclassPost...但这似乎不起作用。有什么想法吗?谢谢! 最佳答案 @Pablo的回答似乎有你需要的一切。但更具体地说...首先改变你View中的这一行对此#

  6. ruby - 具有两个参数的 block - 2

    我从用户Hirolau那里找到了这段代码:defsum_to_n?(a,n)a.combination(2).find{|x,y|x+y==n}enda=[1,2,3,4,5]sum_to_n?(a,9)#=>[4,5]sum_to_n?(a,11)#=>nil我如何知道何时可以将两个参数发送到预定义方法(如find)?我不清楚,因为有时它不起作用。这是重新定义的东西吗? 最佳答案 如果您查看Enumerable#find的文档,您会发现它只接受一个block参数。您可以将它发送两次的原因是因为Ruby可以方便地让您根据它的“并行赋

  7. ruby-on-rails - 在 RSpec 中,如何以任意顺序期望具有不同参数的多条消息? - 2

    RSpec似乎按顺序匹配方法接收的消息。我不确定如何使以下代码工作:allow(a).toreceive(:f)expect(a).toreceive(:f).with(2)a.f(1)a.f(2)a.f(3)我问的原因是a.f的一些调用是由我的代码的上层控制的,所以我不能对这些方法调用添加期望。 最佳答案 RSpecspy是测试这种情况的一种方式。要监视一个方法,用allowstub,除了方法名称之外没有任何约束,调用该方法,然后expect确切的方法调用。例如:allow(a).toreceive(:f)a.f(2)a.f(1)

  8. ruby-on-rails - 使用包含多个关联和单独的条件 - 2

    我的Gallery模型中有以下查询:media_items.includes(:photo,:video).rank(:position_in_gallery)我的图库模型有_许多媒体项,每个都有一个照片或视频关联。到目前为止,一切正常。它返回所有media_items包括它们的photo或video关联,由media_item的position_in_gallery属性排序。但是我现在需要将此查询返回的照片限制为仅具有is_processing属性的照片,即nil。是否可以进行相同的查询,但条件是返回的照片等同于:.where(photo:'photo.is_processingIS

  9. ruby-on-rails - 在 haml View 中重构条件 - 2

    除了可访问性标准不鼓励使用这一事实指向当前页面的链接,我应该怎么做重构以下View代码?#navigation%ul.tabbed-ifcurrent_page?(new_profile_path)%li{:class=>"current_page_item"}=link_tot("new_profile"),new_profile_path-else%li=link_tot("new_profile"),new_profile_path-ifcurrent_page?(profiles_path)%li{:class=>"current_page_item"}=link_tot("p

  10. ruby-on-rails - 具有同名的模块和类 - 2

    我有一个模块stat存在于目录结构中:lib/stat_creator/stat/在lib/stat_creator/stat.rb中,我在lib/stat_creator/stat/目录中有我需要的文件,以及:moduleStatCreatormoduleStatendend当我使用该模块时,我将这些类称为StatCreator::Stat::Foo.new现在我想要一个存在于应用程序中的根Stat类。我在app/models中制作了我的Stat类,并在routes.rb中进行了设置。但是,如果我转到Rails控制台并尝试在应用程序/模型中使用Stat类,例如:Stat.by_use

随机推荐