MongoDB 在多个文档字段上完全匹配

coder 2023-11-05 原文

我正在尝试使用 PyMongo 构建一个 Python 脚本，该脚本将能够命中一个 Mongo 数据库，该数据库可以精确匹配数据库中可能存在的 n 个对象。目前，我有这个设置:

db.entries.find({'$or': [<list-of-objects]})

对象列表看起来像这样:

[{'email': 'some@email.com', 'zip': '11111'}, {'email': 'another@email.com', 'zip': '11112'}, ...]

当我在列表中有 10 个左右的项目时，使用 $or 可以正常工作。我现在正在用 100 测试，需要很长时间才能返回。我考虑过使用多个 $in 过滤器，但我不知道这是否是最佳选择。

我确信有更好的方法来处理这个问题，但我对 Mongo 还很陌生。

编辑:.explain() 的输出如下:

{
    "executionStats": {
        "executionTimeMillis": 228734,
        "nReturned": 2,
        "totalKeysExamined": 0,
        "allPlansExecution": [],
        "executionSuccess": true,
        "executionStages": {
            "needYield": 0,
            "saveState": 43556,
            "restoreState": 43556,
            "isEOF": 1,
            "inputStage": {
                "needYield": 0,
                "saveState": 43556,
                "restoreState": 43556,
                "isEOF": 1,
                "inputStage": {
                    "needYield": 0,
                    "direction": "forward",
                    "saveState": 43556,
                    "restoreState": 43556,
                    "isEOF": 1,
                    "docsExamined": 5453000,
                    "nReturned": 2,
                    "needTime": 5452999,
                    "filter": {
                        "$or": [{
                            "$and": [{
                                "email": {
                                    "$eq": "some@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11111"
                                }
                            }]
                        }, {
                            "$and": [{
                                "email": {
                                    "$eq": "another@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11112"
                                }
                            }]
                        }]
                    },
                    "executionTimeMillisEstimate": 208083,
                    "invalidates": 0,
                    "works": 5453002,
                    "advanced": 2,
                    "stage": "COLLSCAN"
                },
                "nReturned": 2,
                "needTime": 5452999,
                "executionTimeMillisEstimate": 211503,
                "transformBy": {
                    "_id": false
                },
                "invalidates": 0,
                "works": 5453002,
                "advanced": 2,
                "stage": "PROJECTION"
            },
            "nReturned": 2,
            "needTime": 5452999,
            "executionTimeMillisEstimate": 213671,
            "invalidates": 0,
            "works": 5453002,
            "advanced": 2,
            "stage": "SUBPLAN"
        },
        "totalDocsExamined": 5453000
    },
    "queryPlanner": {
        "parsedQuery": {
            "$or": [{
                "$and": [{
                    "email": {
                        "$eq": "some@email.com"
                    }
                }, {
                    "zipcode": {
                        "$eq": "11111"
                    }
                }]
            }, {
                "$and": [{
                    "email": {
                        "$eq": "another@email.com"
                    }
                }, {
                    "zipcode": {
                        "$eq": "11112"
                    }
                }]
            }]
        },
        "rejectedPlans": [],
        "namespace": "db.entries",
        "winningPlan": {
            "inputStage": {
                "transformBy": {
                    "_id": false
                },
                "inputStage": {
                    "filter": {
                        "$or": [{
                            "$and": [{
                                "email": {
                                    "$eq": "some@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11111"
                                }
                            }]
                        }, {
                            "$and": [{
                                "email": {
                                    "$eq": "another@email.com"
                                }
                            }, {
                                "zipcode": {
                                    "$eq": "11112"
                                }
                            }]
                        }]
                    },
                    "direction": "forward",
                    "stage": "COLLSCAN"
                },
                "stage": "PROJECTION"
            },
            "stage": "SUBPLAN"
        },
        "indexFilterSet": false,
        "plannerVersion": 1
    },
    "ok": 1.0,
    "serverInfo": {
        "host": "somehost",
        "version": "3.4.6",
        "port": 27017,
        "gitVersion": "c55eb86ef46ee7aede3b1e2a5d184a7df4bfb5b5"
    }
}

最佳答案

我建议创建一个新索引(复合索引)，因为您使用两个字段进行搜索:

db.entries.createIndex( {"email": 1, "zip": 1} )

现在运行您的查询并在您的查询中附加 explain() 命令，您应该看到它开始使用 IXSCAN 而不是 COLLSCAN。

关于MongoDB 在多个文档字段上完全匹配，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45514068/

MongoDB 在 34 email code pymongo

有关MongoDB 在多个文档字段上完全匹配的更多相关文章

ruby-on-rails - Rails 3 中的多个路由文件 - 2
Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情？最佳答案在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中，使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件，我们在StackOverflow上找到一个类似的问题
ruby-on-rails - 在 Ruby 中循环遍历多个数组 - 2
我有多个ActiveRecord子类Item的实例数组，我需要根据最早的事件循环打印。在这种情况下，我需要打印付款和维护日期，如下所示:ItemAmaintenancerequiredin5daysItemBpaymentrequiredin6daysItemApaymentrequiredin7daysItemBmaintenancerequiredin8days我目前有两个查询，用于查找maintenance和payment项目(非排他性查询)，并输出如下内容:paymentrequiredin...maintenancerequiredin...有什么方法可以改善上述(丑陋的)代
ruby-on-rails - Rails - 一个 View 中的多个模型 - 2
我需要从一个View访问多个模型。以前，我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它，但这似乎不是“ruby方式”，我将需要在不久的将来访问更多模型。这可能会变得很脏，是否有针对这种情况的任何技术？注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展，本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向，这似乎很麻烦。最终从任何
ruby - 完全离线安装RVM - 2
我打算为ruby脚本创建一个安装程序，但我希望能够确保机器安装了RVM。有没有一种方法可以完全离线安装RVM并且不引人注目(通过不引人注目，就像创建一个可以做所有事情的脚本而不是要求用户向他们的bash_profile或bashrc添加一些东西)我不是要脚本本身，只是一个关于如何走这条路的快速指针(如果可能的话)。我们还研究了这个很有帮助的问题:RVM-isthereawayforsimpleofflineinstall?但有点误导，因为答案只向我们展示了如何离线在RVM中安装ruby。我们需要能够离线安装RVM本身，并查看脚本https://raw.github.com/wayn
ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2
在我的应用程序中，我需要能够找到所有数字子字符串，然后扫描每个子字符串，找到第一个匹配范围(例如5到15之间)的子字符串，并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串，例如，re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项，并且只替换第N个匹配项，我该怎么做？例如，如果我想替换第三个匹配项“10”(匹配项[2])，我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg
ruby - 匹配未转义的平衡定界符对 - 2
如何匹配未被反斜杠转义的平衡定界符对(其本身未被反斜杠转义)(无需考虑嵌套)？例如对于反引号，我试过了，但是转义的反引号没有像转义那样工作。regex=/(?!$1:"how\\"#expected"how\\`are"上面的正则表达式不考虑由反斜杠转义并位于反引号前面的反斜杠，但我愿意考虑。StackOverflow如何做到这一点？这样做的目的并不复杂。我有文档文本，其中包括内联代码的反引号，就像StackOverflow一样，我想在HTML文件中显示它，内联代码用一些spanMaterial装饰。不会有嵌套，但转义反引号或转义反斜杠可能出现在任何地方。
ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2
我有一个表单，其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在？solve_problem_pathdo|f|%>... 最佳答案创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss
ruby-on-rails - form_for 中不在模型中的自定义字段 - 2
我想向我的Controller传递一个参数，它是一个简单的复选框，但我不知道如何在模型的form_for中引入它，这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框，但我该怎么做，模型中没有一个对象，而是一个要检查的对象，以便在Controller中创建一个ifelse，如果没有检查，请帮助我，非常感谢,谢谢
ruby - 多个属性的 update_column 方法 - 2
我有一个具有一些属性的模型:attr1、attr2和attr3。我需要在不执行回调和验证的情况下更新此属性。我找到了update_column方法，但我想同时更新三个属性。我需要这样的东西:update_columns({attr1:val1,attr2:val2,attr3:val3})代替update_column(attr1,val1)update_column(attr2,val2)update_column(attr3,val3) 最佳答案您可以使用update_columns(attr1:val1,attr2:val2
ruby-on-rails - 在 ruby .gemspec 文件中，如何指定依赖项的多个版本？ - 2
我正在尝试修改当前依赖于定义为activeresource的gem:s.add_dependency"activeresource","~>3.0"为了让gem与Rails4一起工作，我需要扩展依赖关系以与activeresource的版本3或4一起工作。我不想简单地添加以下内容，因为它可能会在以后引起问题:s.add_dependency"activeresource",">=3.0"有没有办法指定可接受版本的列表？~>3.0还是~>4.0？最佳答案根据thedocumentation,如果你想要3到4之间的所有版本，你可以这

MongoDB 在多个文档字段上完全匹配

有关MongoDB 在多个文档字段上完全匹配的更多相关文章

随机推荐