草庐IT

mapreduce-name

全部标签

带有 MongoDb 和 MapReduce 的 Grails

MongoDBGORMGrails插件支持MapReduce,我该如何使用它?我一直在查看文档,但没有看到任何提及。Gmongo插件支持MapReduce,但我发现文档有些欠缺。如何提供最终确定函数并将输出设置为inline? 最佳答案 GMongo只是标准JavaMongoDBAPI的一个薄包装,Map/Reduce的引用在这里:http://api.mongodb.org/java/2.6/com/mongodb/DBCollection.html#mapReduce(java.lang.String,%20java.lang.

mongodb - MapReduce 与 MongoDB - reduce 运行了多少次?

我在MongoDB中使用MapReduce,我想我已经全神贯注了,除了有一点我仍然不明白:reduce运行了多少次?例如,我有一个“项目”集合,每个项目都有一个“类别”。这是测试数据(用javascript编写,用于node.js单元测试):vari=0;vardummyCategories=[{categoryId:(++i),categoryName:'Category'+i},//[0]1{categoryId:(++i),categoryName:'Category'+i},//[1]2{categoryId:(++i),categoryName:'Category'+i},/

MongoDB MapReduce 每个键有很多 emit()

是否保证将同一键的所有emit()发送到reduce函数?例如,如果您有100万个文档,每个文档emit()一次,但只有10个可能的emit()键(均匀分布),则减少函数在一次调用中被100k发射猛烈撞击?或者mongo会将这些拆分并逐渐减少结果?如果是这样,它如何决定将多少值发送到reduce? 最佳答案 同一个键的所有emit()都将被发送到reduce函数,但它们不一定会立即发送到reduce函数(如果为特定键发出单个文档,文档不会传递给reduce函数)。可能会针对同一个键多次调用Reduce,这就是为什么reduce函数的

mongodb - MongoDB 中 "Parent Links"树上的 MapReduce

我有一个实体集合,代表一棵树。每个实体都有一个包含属性数组的属性。例如:{"_id":1,"parent_id":null,"attributes":["A","B","C"]}我想使用MapReduce生成另一个类似于原始集合的集合,但是对于集合中的每个项目,它不仅包含与实体直接关联的属性,还包含其祖先的属性,一路直到层次结构的根。因此给定以下实体:{"_id":1,"parent_id":null,"attributes":["A","B","C"]}{"_id":2,"parent_id":1,"attributes":["D","E","F"]}{"_id":3,"parent

使用索引的 Mongodb MapReduce 性能

我在mongodb中有一个示例文档(我对mongodb还是个新手){"ID":0,"Facet1":"Value1","Facet2":[{"Facet2Obj1":{"Obj1Facet1":"Value11","Obj2Facet1":"Value21","Obj3Facet1":"Value31"}},{"Facet2Obj2":{"Obj1Facet2":"Value12","Obj2Facet2":"Value22","Obj3Facet2":"Value32"}},{"Facet2Obj3":{"Obj1Facet3":"Value13","Obj2Facet3":"Val

解决Python ImportError: No module named ‘distutils.util‘错误

Python是一种广泛使用的编程语言,它提供了丰富的标准库和第三方库来支持各种开发需求。然而,在使用Python开发过程中,有时会遇到各种各样的错误。其中之一就是"ModuleNotFoundError:Nomodulenamed‘distutils.util’"错误。这个错误通常表示Python解释器无法找到名为’distutils.util’的模块。distutils模块是Python的标准库之一,它提供了一些工具函数和类,用于构建和安装Python软件包。在某些情况下,该模块可能会丢失或损坏,导致无法导入。要解决这个错误,我们可以采取以下步骤:确认Python版本:首先,请确保您正在使用

mongodb - mapReduce 内联结果与 java mongodb 驱动程序 3.2

如何使用mongodbjava驱动程序3.2从mapReducet获得内联结果?我在使用驱动程序版本2.x时:DBColleciontcoll=client.getDB(dbName).getCollection(collName);coll.mapReduce(map,reduce,null,OutputType.INLINE,query);新的3.x驱动程序有两个返回MapReduceIterable的mapReduce()方法,其中缺少指定INLINE输出模式的方法。MongoCollectioncoll=client.getDatabase(dbName).getCollect

django.core.exceptions.ImproperlyConfigured : name must be an instance of basestring

我正在尝试在我的Django中使用Mongodb。下面是settings.py中的连接设置DEBUG=TrueTEMPLATE_DEBUG=DEBUGADMINS=(#('YourName','your_email@example.com'),)MANAGERS=ADMINSDATABASES={'default':{'ENGINE':'django_mongodb_engine','NAME':'','USER':'','PASSWORD':'','HOST':'localhost','PORT':27017,}}当我尝试运行pythonmanage.pysyncdb时,出现如下错误

node.js - 在 Node js中获取 "name"的值

Category=collection.find({},{name:true}).toArray();console.log("CategoriesFound",Category);输出:Promise{[{name:'Agriculture'},{name:'engineer'}]}如何获取name的值?(注意:在NodeJS中工作) 最佳答案 toArray是一个返回promise的异步函数。您可以通过以下两种方式之一获取类别:promise风格:collection.find({},{name:true}).toArray()

mongodb - mongoDB 中具有时间间隔的增量 MapReduce

我以10分钟的时间间隔从服务器获取了一些记录(在1小时内我将获取6个文件)我想在接下来的几个小时内每1小时做一次mapreduce我将不得不对6个文件和最后几个小时的文件进行下一组的mapreduce我将如何解决这个问题?帮我我混淆了过去1个月谢谢苏希尔·克尔·辛格 最佳答案 为了按小时汇总您的10分钟日志文件,您可以在map函数中将每个日志文件的时间戳舍入到最接近的小时,并在reduce函数中按小时对结果进行分组。这是一个小的虚拟示例,它从mongoshell中说明了这一点:创建100个日志文件,每个间隔10分钟并包含一个0-10