草庐IT

mongodb - 使用mgo在MongoDB中进行有效的分页

coder 2023-06-25 原文

我搜索并没有找到解决该问题的Go解决方案,无论是否使用 mgo.v2 ,都不在StackOverflow上,也不在任何其他站点上。此问答符合knowledge sharing / documenting的精神。

假设我们在Gogo users中建模了MongoDB中的struct集合:

type User struct {
    ID      bson.ObjectId `bson:"_id"`
    Name    string        `bson:"name"`
    Country string        `bson:"country"`
}

我们希望根据某些条件对用户进行排序和列出,但由于预期结果列表较长,因此已实现了分页。

为了实现对某些查询结果的分页,MongoDB和 mgo.v2 驱动程序包以 Query.Skip() Query.Limit() 的形式提供了内置支持,例如:
session, err := mgo.Dial(url) // Acquire Mongo session, handle error!

c := session.DB("").C("users")
q := c.Find(bson.M{"country" : "USA"}).Sort("name", "_id").Limit(10)

// To get the nth page:
q = q.Skip((n-1)*10)

var users []*User
err = q.All(&users)

但是,如果页数增加,这将变得很慢,因为MongoDB不能仅仅“神奇地”跳转到结果中的第x个文档,它必须遍历所有结果文档并忽略(不返回)需要将第一个x跳过了。

MongoDB提供了正确的解决方案:如果查询对索引进行操作(必须对索引进行操作),则 cursor.min() 可用于指定第一个索引条目以开始列出结果。

这个Stack Overflow答案显示了如何使用mongo客户端来完成它:How to do pagination using range queries in MongoDB?

注意:以上查询所需的索引为:
db.users.createIndex(
    {
        country: 1,
        name: 1,
        _id: 1
    }
)

但是,存在一个问题:mgo.v2包不支持指定此min()

我们如何通过cursor.min()驱动程序实现使用MongoDB的mgo.v2功能的高效分页?

最佳答案

不幸的是 mgo.v2 驱动程序不提供API调用来指定 cursor.min()

但是有一个解决方案。 mgo.Database 类型提供 Database.Run() 方法来运行任何MongoDB命令。可在此处找到可用的命令及其文档:Database commands

从MongoDB 3.2开始,提供了一个新的 find 命令,该命令可用于执行查询,并且它支持指定min参数,该参数表示从其开始列出结果的第一个索引条目。

好的。我们需要做的是在每个批次(页面的文档)从查询结果的最后一个文档生成min文档之后,该文档必须包含用于执行查询的索引条目的值,然后是下一个批次(下一页的文档)可以通过在执行查询之前设置此min索引条目来获取。

索引条目(从现在开始将其称为光标)可以被编码为string并与结果一起发送给客户端,当客户端想要下一页时,他发送回光标,说他想要从该光标之后开始的结果。

手动执行(“硬”方式)

要执行的命令可以采用不同的形式,但是命令名称(find)必须在编码(marshal)结果中位于第一个位置,因此我们将使用 bson.D (与 bson.M 相比,保留顺序):

limit := 10
cmd := bson.D{
    {Name: "find", Value: "users"},
    {Name: "filter", Value: bson.M{"country": "USA"}},
    {Name: "sort", Value: []bson.D{
        {Name: "name", Value: 1},
        {Name: "_id", Value: 1},
    },
    {Name: "limit", Value: limit},
    {Name: "batchSize", Value: limit},
    {Name: "singleBatch", Value: true},
}
if min != nil {
    // min is inclusive, must skip first (which is the previous last)
    cmd = append(cmd,
        bson.DocElem{Name: "skip", Value: 1},
        bson.DocElem{Name: "min", Value: min},
    )
}

可以使用以下类型捕获使用find执行MongoDB Database.Run()命令的结果:
var res struct {
    OK       int `bson:"ok"`
    WaitedMS int `bson:"waitedMS"`
    Cursor   struct {
        ID         interface{} `bson:"id"`
        NS         string      `bson:"ns"`
        FirstBatch []bson.Raw  `bson:"firstBatch"`
    } `bson:"cursor"`
}

db := session.DB("")
if err := db.Run(cmd, &res); err != nil {
    // Handle error (abort)
}

现在,我们得到了结果,但是在[]bson.Raw类型的 slice 中。但是我们希望将其放在[]*User类型的 slice 中。这是 Collection.NewIter() 派上用场的地方。它可以将[]bson.Raw类型的值转换(解码)为我们通常传递给 Query.All() Iter.All() 的任何类型。好的。让我们来看看它:
firstBatch := res.Cursor.FirstBatch
var users []*User
err = db.C("users").NewIter(nil, firstBatch, 0, nil).All(&users)

现在,我们有了下一页的用户。只剩下一件事:如果需要,生成用于获取下一页的游标:
if len(users) > 0 {
    lastUser := users[len(users)-1]
    cursorData := []bson.D{
        {Name: "country", Value: lastUser.Country},
        {Name: "name", Value: lastUser.Name},
        {Name: "_id", Value: lastUser.ID},
    }
} else {
    // No more users found, use the last cursor
}

一切都很好,但是如何将cursorData转换为string,反之亦然?我们可以将 bson.Marshal() bson.Unmarshal() 与base64编码结合使用; base64.RawURLEncoding 的使用将为我们提供一个网络安全的游标字符串,可以将其添加到URL查询中而不进行转义。

这是一个示例实现:
// CreateCursor returns a web-safe cursor string from the specified fields.
// The returned cursor string is safe to include in URL queries without escaping.
func CreateCursor(cursorData bson.D) (string, error) {
    // bson.Marshal() never returns error, so I skip a check and early return
    // (but I do return the error if it would ever happen)
    data, err := bson.Marshal(cursorData)
    return base64.RawURLEncoding.EncodeToString(data), err
}

// ParseCursor parses the cursor string and returns the cursor data.
func ParseCursor(c string) (cursorData bson.D, err error) {
    var data []byte
    if data, err = base64.RawURLEncoding.DecodeString(c); err != nil {
        return
    }

    err = bson.Unmarshal(data, &cursorData)
    return
}

最后,我们有了高效但不那么短的MongoDB mgo分页功能。继续阅读...

使用github.com/icza/minquery(“简单”方式)

手动方式相当冗长;它可以变得通用和自动化。这是 github.com/icza/minquery 进入图片的地方(公开:我是作者)。它提供了一个包装器,用于配置和执行MongoDB find命令,允许您指定一个游标,并且在执行查询后,它为您提供了用于查询下一批结果的新游标。包装器是 MinQuery 类型,与 mgo.Query 非常相似,但它支持通过min方法指定MongoDB的MinQuery.Cursor()

上面使用minquery的解决方案如下所示:
q := minquery.New(session.DB(""), "users", bson.M{"country" : "USA"}).
    Sort("name", "_id").Limit(10)
// If this is not the first page, set cursor:
// getLastCursor() represents your logic how you acquire the last cursor.
if cursor := getLastCursor(); cursor != "" {
    q = q.Cursor(cursor)
}

var users []*User
newCursor, err := q.All(&users, "country", "name", "_id")

就这样。 newCursor是用于获取下一批的光标。

注1:调用MinQuery.All()时,您必须提供游标字段的名称,这将用于从中构建游标数据(最终是游标字符串)。

注2:如果要检索部分结果(通过使用MinQuery.Select()),则即使您不打算直接使用它们,也必须包括属于光标的所有字段(索引条目),否则MinQuery.All()不会具有游标字段的所有值,因此它将无法创建正确的游标值。

在此处查看minquery的打包文档:https://godoc.org/github.com/icza/minquery,它很短,希望可以清除。

关于mongodb - 使用mgo在MongoDB中进行有效的分页,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40634865/

有关mongodb - 使用mgo在MongoDB中进行有效的分页的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 使用 RubyZip 生成 ZIP 文件时设置压缩级别 - 2

    我有一个Ruby程序,它使用rubyzip压缩XML文件的目录树。gem。我的问题是文件开始变得很重,我想提高压缩级别,因为压缩时间不是问题。我在rubyzipdocumentation中找不到一种为创建的ZIP文件指定压缩级别的方法。有人知道如何更改此设置吗?是否有另一个允许指定压缩级别的Ruby库? 最佳答案 这是我通过查看ruby​​zip内部创建的代码。level=Zlib::BEST_COMPRESSIONZip::ZipOutputStream.open(zip_file)do|zip|Dir.glob("**/*")d

  3. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  4. ruby-on-rails - 使用 Ruby on Rails 进行自动化测试 - 最佳实践 - 2

    很好奇,就使用ruby​​onrails自动化单元测试而言,你们正在做什么?您是否创建了一个脚本来在cron中运行rake作业并将结果邮寄给您?git中的预提交Hook?只是手动调用?我完全理解测试,但想知道在错误发生之前捕获错误的最佳实践是什么。让我们理所当然地认为测试本身是完美无缺的,并且可以正常工作。下一步是什么以确保他们在正确的时间将可能有害的结果传达给您? 最佳答案 不确定您到底想听什么,但是有几个级别的自动代码库控制:在处理某项功能时,您可以使用类似autotest的内容获得关于哪些有效,哪些无效的即时反馈。要确保您的提

  5. ruby - 在 Ruby 中使用匿名模块 - 2

    假设我做了一个模块如下:m=Module.newdoclassCendend三个问题:除了对m的引用之外,还有什么方法可以访问C和m中的其他内容?我可以在创建匿名模块后为其命名吗(就像我输入“module...”一样)?如何在使用完匿名模块后将其删除,使其定义的常量不再存在? 最佳答案 三个答案:是的,使用ObjectSpace.此代码使c引用你的类(class)C不引用m:c=nilObjectSpace.each_object{|obj|c=objif(Class===objandobj.name=~/::C$/)}当然这取决于

  6. ruby - 使用 ruby​​ 和 savon 的 SOAP 服务 - 2

    我正在尝试使用ruby​​和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我

  7. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  8. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

    我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

  9. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  10. ruby - 在 64 位 Snow Leopard 上使用 rvm、postgres 9.0、ruby 1.9.2-p136 安装 pg gem 时出现问题 - 2

    我想为Heroku构建一个Rails3应用程序。他们使用Postgres作为他们的数据库,所以我通过MacPorts安装了postgres9.0。现在我需要一个postgresgem并且共识是出于性能原因你想要pggem。但是我对我得到的错误感到非常困惑当我尝试在rvm下通过geminstall安装pg时。我已经非常明确地指定了所有postgres目录的位置可以找到但仍然无法完成安装:$envARCHFLAGS='-archx86_64'geminstallpg--\--with-pg-config=/opt/local/var/db/postgresql90/defaultdb/po

随机推荐