草庐IT

reduce_by

全部标签

ruby-on-rails - 无架构数据库 : Indexing dynamically-typed things by their properties?

在RDBMS中,您可以声明类型(表)和子类型(具有父类(superclass)型FK的子类型表)。在Rails中,这将是类表继承。例如,您可以有Person表和一个Friend子类型表,其中包含有关此人的更多个人详细信息(例如生日/周年纪念日)。当您跳入NoSQL世界并使用像MongoDB这样的文档数据库时,实现子类型要容易得多,因为集合是无模式的。这是创建CMS的理想选择。您现在可以动态键入任何内容。事实上,一个事物可以是多类型的,具有其所有类型的属性。也不太棘手。但这是棘手的部分。你想索引你的动态类型的东西(例如你的“东西”集合)。您想要按start_date搜索事件事物。您想按名

mongodb - 用于分析时间序列的 Map Reduce

我是mapreduce概念的新手,想知道是否可以使用它解决以下问题。我们有一个这样的数据日志:TransIDDateOperationDocumentIDUser101/01/2010OpenaaaAnne201/11/2010CloseaaaAnne301/12/2010OpenbbbMary401/12/2010ClosebbbMary我们希望能够计算不同的时间指标,例如:全局平均打开和关闭操作之间经过多少时间?或每位用户平均打开和关闭之间经过多少时间?有没有一种简单的方法可以通过map-reduce实现这一点?我们正在考虑MongoDB或Hadoop。数据量可能很大——数十亿条记

mongodb - DBRefs vs Map/Reduce vs 手册引用

我遇到过三种“加入”集合的不同方式:手动保留对您希望加入目标集合的集合的“foreign-key-esk”引用使用DBRefs写一系列Map/Reduce维持关系的功能有人能解释一下每种方法的好处以及我应该在什么时候使用吗?我的第一印象是Map/Reduce用于大型、频繁使用的集合,而其他两个主要用于小型/快速查询。 最佳答案 抱歉回复晚了-这是一个用mongoose编写的嵌入式文档的简单示例:varpostSchema=newSchema({author:{type:String},title:{type:String,requi

mongodb - Map Reduce 上的 Reduce 函数显示不正确的结果——为什么?

我有一个数据结构可以跟踪不同城市的人://indb.persons{name:"John",city:"Seattle},{name:"Bill",city:"Portland"}我想运行mapreduce以获取每个城市中有多少人的列表,因此结果将如下所示:{_id:"Seattle",value:10}我的mapreduce函数如下所示:map=function(){varcity=this.cityemit(city,1);};reduce=function(key,values){varresult=0;values.forEach(function(value){result+

ruby-on-rails - 在 map reduce 之前对 mongoid 集合进行排序

我如何在对其执行mapreduce操作之前对集合进行排序?假设我有这个收藏:{a:1,b:1},{a:2,b:2},{a:3,b:e},{a:1,b:7}现在,我想按a的值排序并返回b的总和我只需要x结果(按a排序)。我如何按a排序第一的?在mongo我可以这样做:mapReduce(map,reduce,{sort:{a:1}})我怎样才能在mongoid上做到这一点?它只接受map_reduce的2个参数功能。 最佳答案 检查这个问题后,我发现了两种方法:1-使用native驱动程序,例如:db=Mongoid::Session

javascript - Node.js 到 MongoDB : find by Date

从Node到MongoDB的查找日期问题:有人说MongoDB可能存储的不是Date对象,而是字符串,但我不确定如何检查或如何修复它。在我的turnys.js文件中:exports.findNeededTurnys=function(req,handler){console.log("findNeededTurnys");varkey;//vararg0={$or:[{start:{$lte:newDate()},$where:"this.users.length==this.seats"}]};vararg0={start:{$lte:newDate()}};console.log(

java - MongoDB 的 Map Reduce OutputType 之间的差异

我想使用MongoDB的MapReduce功能并访问大量数据。我正在使用INLINEOutputTypeMapReduceCommandcmd=newMapReduceCommand(dbCollection,MapReduceTest.map,MapReduceTest.reduce,null,MapReduceCommand.OutputType.INLINE,query);这在处理小数据集时工作正常,但它可用于处理高达16MB的数据,这对我来说是个问题。我想访问一个非常大的数据集,但我还没有找到任何关于其他选项MERGE、REDUCE、REPLACE的好文档。有谁知道区别吗?

javascript - 聚合或 Map Reduce 以创建规范化的 'Unique Paying Users Per Vendor'

我正在尝试使用MapReduce或Mongodb中的聚合框架为每个vendor的唯一付费用户创建一个报告。唯一的问题是总数需要标准化,这样每个用户在他/她购买的所有vendor中总共贡献1。例如{"account":"abc","vendor":"amazon",},{"account":"abc","vendor":"overstock",},{"account":"ccc","vendor":"overstock",}会产生{"vendor":"amazon","total":0.5},{"vendor":"overstock","total":1.5}在这里,我们看到用户“abc

node.js - 库存 Mongodb 适配器 : Connection Closed By Application 的 NodeJS 错误

我在使用MongoDB时遇到了一个奇怪的问题。我的数据库集合正在关闭,我想这就是它应该做的(我正在遵循mongo样板文件)但我看不出为什么文档会是空值。我已经用我能想到的所有方法检查过了,但我不太了解光标对象。Console.logging它似乎给了我一堆原生的mongo属性(它们看起来像函数,例如each、toArray等)所以它看起来是正确的,但它不是我可以看到的带有数据字段的常规对象。在它遇到带有if(docs==null)的ifblock后,连接将关闭,并且不会执行elseif中的每个block。理想情况下,如果有一种方法可以帮助解决问题或弄清楚如何执行此操作,那就太好了。更多

string - MongoDB:使用 map-reduce 将字符串更改为整数

我是新来的,想问一个我一直面临的与mongodb相关的问题。这是一个记录的示例结构。{"_id":{"id":"lk23j","language":"English"},"class":"test","title":{"duration":"34""year":"1991"}}有几条这样的记录,我想在所有记录中计算持续时间的总和。据我了解,聚合不起作用,因为title.duration字段需要转换为整数,因此求和返回NaN(不是数字)。因此,我需要转换然后使用map-reduce求和,这将允许parseInt(在javascript中)。来自http://blog.physalix.c