草庐IT

MongoDB 在多个文档字段上完全匹配

coder 2023-11-05 原文

我正在尝试使用 PyMongo 构建一个 Python 脚本,该脚本将能够命中一个 Mongo 数据库,该数据库可以精确匹配数据库中可能存在的 n 个对象。目前,我有这个设置:

db.entries.find({'$or': [<list-of-objects]})

对象列表看起来像这样:

[{'email': 'some@email.com', 'zip': '11111'}, {'email': 'another@email.com', 'zip': '11112'}, ...]

当我在列表中有 10 个左右的项目时,使用 $or 可以正常工作。我现在正在用 100 测试,需要很长时间才能返回。我考虑过使用多个 $in 过滤器,但我不知道这是否是最佳选择。

我确信有更好的方法来处理这个问题,但我对 Mongo 还很陌生。

编辑:.explain() 的输出如下:

{
    "executionStats": {
        "executionTimeMillis": 228734,
        "nReturned": 2,
        "totalKeysExamined": 0,
        "allPlansExecution": [],
        "executionSuccess": true,
        "executionStages": {
            "needYield": 0,
            "saveState": 43556,
            "restoreState": 43556,
            "isEOF": 1,
            "inputStage": {
                "needYield": 0,
                "saveState": 43556,
                "restoreState": 43556,
                "isEOF": 1,
                "inputStage": {
                    "needYield": 0,
                    "direction": "forward",
                    "saveState": 43556,
                    "restoreState": 43556,
                    "isEOF": 1,
                    "docsExamined": 5453000,
                    "nReturned": 2,
                    "needTime": 5452999,
                    "filter": {
                        "$or": [{
                            "$and": [{
                                "email": {
                                    "$eq": "some@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11111"
                                }
                            }]
                        }, {
                            "$and": [{
                                "email": {
                                    "$eq": "another@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11112"
                                }
                            }]
                        }]
                    },
                    "executionTimeMillisEstimate": 208083,
                    "invalidates": 0,
                    "works": 5453002,
                    "advanced": 2,
                    "stage": "COLLSCAN"
                },
                "nReturned": 2,
                "needTime": 5452999,
                "executionTimeMillisEstimate": 211503,
                "transformBy": {
                    "_id": false
                },
                "invalidates": 0,
                "works": 5453002,
                "advanced": 2,
                "stage": "PROJECTION"
            },
            "nReturned": 2,
            "needTime": 5452999,
            "executionTimeMillisEstimate": 213671,
            "invalidates": 0,
            "works": 5453002,
            "advanced": 2,
            "stage": "SUBPLAN"
        },
        "totalDocsExamined": 5453000
    },
    "queryPlanner": {
        "parsedQuery": {
            "$or": [{
                "$and": [{
                    "email": {
                        "$eq": "some@email.com"
                    }
                }, {
                    "zipcode": {
                        "$eq": "11111"
                    }
                }]
            }, {
                "$and": [{
                    "email": {
                        "$eq": "another@email.com"
                    }
                }, {
                    "zipcode": {
                        "$eq": "11112"
                    }
                }]
            }]
        },
        "rejectedPlans": [],
        "namespace": "db.entries",
        "winningPlan": {
            "inputStage": {
                "transformBy": {
                    "_id": false
                },
                "inputStage": {
                    "filter": {
                        "$or": [{
                            "$and": [{
                                "email": {
                                    "$eq": "some@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11111"
                                }
                            }]
                        }, {
                            "$and": [{
                                "email": {
                                    "$eq": "another@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11112"
                                }
                            }]
                        }]
                    },
                    "direction": "forward",
                    "stage": "COLLSCAN"
                },
                "stage": "PROJECTION"
            },
            "stage": "SUBPLAN"
        },
        "indexFilterSet": false,
        "plannerVersion": 1
    },
    "ok": 1.0,
    "serverInfo": {
        "host": "somehost",
        "version": "3.4.6",
        "port": 27017,
        "gitVersion": "c55eb86ef46ee7aede3b1e2a5d184a7df4bfb5b5"
    }
}

最佳答案

我建议创建一个新索引(复合索引),因为您使用两个字段进行搜索:

db.entries.createIndex( {"email": 1, "zip": 1} )

现在运行您的查询并在您的查询中附加 explain() 命令,您应该看到它开始使用 IXSCAN 而不是 COLLSCAN。

关于MongoDB 在多个文档字段上完全匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45514068/

有关MongoDB 在多个文档字段上完全匹配的更多相关文章

  1. ruby-on-rails - Rails 3 中的多个路由文件 - 2

    Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

  2. ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2

    我有多个ActiveRecord子类Item的实例数组,我需要根据最早的事件循环打印。在这种情况下,我需要打印付款和维护日期,如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询,用于查找maintenance和payment项目(非排他性查询),并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代

  3. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

    我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

  4. ruby - 完全离线安装RVM - 2

    我打算为ruby​​脚本创建一个安装程序,但我希望能够确保机器安装了RVM。有没有一种方法可以完全离线安装RVM并且不引人注目(通过不引人注目,就像创建一个可以做所有事情的脚本而不是要求用户向他们的bash_profile或bashrc添加一些东西)我不是要脚本本身,只是一个关于如何走这条路的快速指针(如果可能的话)。我们还研究了这个很有帮助的问题:RVM-isthereawayforsimpleofflineinstall?但有点误导,因为答案只向我们展示了如何离线在RVM中安装ruby。我们需要能够离线安装RVM本身,并查看脚本https://raw.github.com/wayn

  5. ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2

    在我的应用程序中,我需要能够找到所有数字子字符串,然后扫描每个子字符串,找到第一个匹配范围(例如5到15之间)的子字符串,并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串,例如,re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项,并且只替换第N个匹配项,我该怎么做?例如,如果我想替换第三个匹配项“10”(匹配项[2]),我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg

  6. ruby - 匹配未转义的平衡定界符对 - 2

    如何匹配未被反斜杠转义的平衡定界符对(其本身未被反斜杠转义)(无需考虑嵌套)?例如对于反引号,我试过了,但是转义的反引号没有像转义那样工作。regex=/(?!$1:"how\\"#expected"how\\`are"上面的正则表达式不考虑由反斜杠转义并位于反引号前面的反斜杠,但我愿意考虑。StackOverflow如何做到这一点?这样做的目的并不复杂。我有文档文本,其中包括内联代码的反引号,就像StackOverflow一样,我想在HTML文件中显示它,内联代码用一些spanMaterial装饰。不会有嵌套,但转义反引号或转义反斜杠可能出现在任何地方。

  7. ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2

    我有一个表单,其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在?solve_problem_pathdo|f|%>... 最佳答案 创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss

  8. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

    我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

  9. ruby - 多个属性的 update_column 方法 - 2

    我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法,但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案 您可以使用update_columns(attr1:val1,attr2:val2

  10. ruby-on-rails - 在 ruby​​ .gemspec 文件中,如何指定依赖项的多个版本? - 2

    我正在尝试修改当前依赖于定义为activeresource的gem:s.add_dependency"activeresource","~>3.0"为了让gem与Rails4一起工作,我需要扩展依赖关系以与activeresource的版本3或4一起工作。我不想简单地添加以下内容,因为它可能会在以后引起问题:s.add_dependency"activeresource",">=3.0"有没有办法指定可接受版本的列表?~>3.0还是~>4.0? 最佳答案 根据thedocumentation,如果你想要3到4之间的所有版本,你可以这

随机推荐