我正在为 mongodb 数据库开发一个复杂的 map-reduce 过程。我已将一些更复杂的代码拆分为模块,然后通过将其包含在我的 scopeObj 中,使其可用于我的 map/reduce/finalize 函数,如下所示:
const scopeObj = {
userCalculations: require('../lib/userCalculations')
}
function myMapFn() {
let userScore = userCalculations.overallScoreForUser(this)
emit({
'Key': this.userGroup
}, {
'UserCount': 1,
'Score': userScore
})
}
function myReduceFn(key, objArr) { /*...*/ }
db.collection('userdocs').mapReduce(
myMapFn,
myReduceFn,
{
scope: scopeObj,
query: {},
out: {
merge: 'userstats'
}
},
function (err, stats) {
return cb(err, stats);
}
)
...这一切都很好。直到最近我还认为不可能将模块代码包含到 map-reduce scopeObj 中,但事实证明这只是因为我试图包含的模块都依赖于其他模块。完全独立的模块似乎工作得很好。
这让我(最终)想到了我的问题。我如何——或者,就此而言,我应该——将更复杂的模块(包括我从 npm 提取的东西)合并到我的 map-reduce 代码中?一个想法是我使用 Browserify 或类似的东西将我所有的依赖项拉到一个文件中,然后以某种方式包含它......但我不确定这样做的正确方法是什么。而且我也不确定我的 map-reduce 代码会在多大程度上冒着严重膨胀的风险,这(出于显而易见的原因)必须是高效的。
有没有人做过这样的事情?它是如何解决的,如果有的话?我是不是走错了路?
更新:澄清我正在努力克服的问题:
在上面的代码中, require('../lib/userCalculations') 由 Node 执行——它读入文件 ../lib/userCalculations.js 和将该文件的 module.exports 对象的内容分配给 scopeObj.userCalculations。但是,假设在 userCalculations.js 中的某处调用了 require(...)。该调用实际上尚未执行。因此,当我尝试在 Map 函数中调用 userCalculations.overallScoreForUser() 时,MongoDB 会尝试执行 require 函数。并且 require 没有在 mongo 上定义。
Browserify 通过将所有必需模块中的所有代码编译到一个没有 require 调用的单个 javascript 文件中来处理这个问题,因此它可以在浏览器中运行。但这在这里并不完全有效,因为我需要将生成的代码本身作为一个我可以使用的模块,就像我在代码示例中使用 userCalculations 一样。也许有一种奇怪的方式来运行我不知道的 browserify?还是其他工具将整个模块层次结构“扁平化”为单个模块?
希望能澄清一点。
最佳答案
作为一般性的回答,您的问题的答案:我如何——或者,就此而言,我应该——将更复杂的模块(包括我从 npm 中提取的东西)合并到我的 map 中——减少代码? - 不,您不能在计划发送到 MongoDB 以执行 mapReduce 作业的 Node 代码中安全地包含复杂模块。
您自己提到了这个问题 - 嵌套的 require 语句。现在,require 是同步的,但是如果你在里面有嵌套函数,这些 require 调用直到调用时才会执行,并且 MongoDB VM 会在此时抛出。
考虑以下三个文件的示例:data.json、dep.js 和 main.js。
// data.json - just something we require "lazily"
false
// dep.js -- equivalent of your userCalculations
module.exports = {
isValueTrue() {
// The problem: nested require
return require('./data.json');
}
}
// main.js - from here you send your mapReduce to MongoDB.
// require dependency instantly
const calc = require('./dep.js');
// require is synchronous, the effectis the same if you do:
// const calc = (function () {return require('./dep.js')})();
console.log('Calc is loaded.');
// Let's mess with unwary devs
require('fs').writeFileSync('./data.json', 'false');
// Is calc.isValueTrue() true or false here?
console.log(calc.isValueTrue());
作为一般解决方案,这是不可行的。虽然绝大多数模块可能没有嵌套的 require 语句、HTTP 调用,甚至是内部、服务调用、全局变量和类似的,但还是有的。你不能保证这会奏效。
现在,作为您的本地实现:例如你需要使用这种技术很好地测试过的特定版本的 NPM 模块,并且你知道它会起作用,或者你自己发布了它们,这在某种程度上是可行的。
但是,即使在这种情况下,如果这是一个团队的努力,肯定会有一个开发人员不知道您的依赖项在哪里使用或如何使用全局变量(不是故意的,而是由于疏忽,例如他们错误地计算了 this) 或者根本不知道他们所做的任何事情的含义。如果你有强大的集成测试套件,你可以防范这种情况,但问题是,它是不可预测的。我个人认为,当您可以在不可预测和可预测之间进行选择时,几乎总是应该使用可预测的。
现在,如果您明确说明了要在 MongoDB mapReduce 中使用某个库的目的,那么这将起作用。你必须很好地防范疏忽和问题,并在基础上进行强大的测试,但我会确保目的是明确的,然后才能感到足够安全来执行此操作。但是,当然,如果您使用的东西非常复杂以至于需要多个 npm 包来执行,也许您可以直接在 MongoDB 服务器上使用这些功能,也许您可以使用更适合该目的的方法来执行 mapReducing,或类似的.
总结:作为一个有目的地构建的库,它具有明确的使命声明,它将与 node 和 MongoDB mapReduce 一起使用,我会确保我的测试涵盖我所有的关键任务和重要功能,然后导入这样的 npm 包。否则我不会使用也不推荐这种方法。
关于javascript - MongoDB map-reduce(通过nodejs): How to include complex modules (with dependencies) in scopeObj?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49238973/
尝试通过RVM将RubyGems升级到版本1.8.10并出现此错误:$rvmrubygemslatestRemovingoldRubygemsfiles...Installingrubygems-1.8.10forruby-1.9.2-p180...ERROR:Errorrunning'GEM_PATH="/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/ruby-1.9.2-p180@global:/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/rub
我正在使用puppet为ruby程序提供一组常量。我需要提供一组主机名,我的程序将对其进行迭代。在我之前使用的bash脚本中,我只是将它作为一个puppet变量hosts=>"host1,host2"我将其提供给bash脚本作为HOSTS=显然这对ruby不太适用——我需要它的格式hosts=["host1","host2"]自从phosts和putsmy_array.inspect提供输出["host1","host2"]我希望使用其中之一。不幸的是,我终其一生都无法弄清楚如何让它发挥作用。我尝试了以下各项:我发现某处他们指出我需要在函数调用前放置“function_”……这
我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是
我的最终目标是安装当前版本的RubyonRails。我在OSXMountainLion上运行。到目前为止,这是我的过程:已安装的RVM$\curl-Lhttps://get.rvm.io|bash-sstable检查已知(我假设已批准)安装$rvmlistknown我看到当前的稳定版本可用[ruby-]2.0.0[-p247]输入命令安装$rvminstall2.0.0-p247注意:我也试过这些安装命令$rvminstallruby-2.0.0-p247$rvminstallruby=2.0.0-p247我很快就无处可去了。结果:$rvminstall2.0.0-p247Search
我在理解Enumerator.new方法的工作原理时遇到了一些困难。假设文档中的示例:fib=Enumerator.newdo|y|a=b=1loopdoy[1,1,2,3,5,8,13,21,34,55]循环中断条件在哪里,它如何知道循环应该迭代多少次(因为它没有任何明确的中断条件并且看起来像无限循环)? 最佳答案 Enumerator使用Fibers在内部。您的示例等效于:require'fiber'fiber=Fiber.newdoa=b=1loopdoFiber.yieldaa,b=b,a+bendend10.times.m
几个月前,我读了一篇关于rubygem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:
从MB升级到新的MBP后,Apple的迁移助手没有移动我的gem。我这次是通过macports安装rubygems,希望在下次升级时避免这种情况。有什么我应该注意的陷阱吗? 最佳答案 如果你想把你的gems安装在你的主目录中(在传输过程中应该复制过来,作为一个附带的好处,会让你以你自己的身份运行geminstall,而不是root),将gemhome:键设置为您在~/.gemrc中的主目录中的路径. 关于通过MacPorts的RubyGems是个好主意吗?,我们在StackOverf
当我执行>rvminstall1.9.2时一切顺利。然后我做>rvmuse1.9.2也很顺利。但是当涉及到ruby-v时..sam@sjones:~$rvminstall1.9.2/home/sam/.rvm/rubies/ruby-1.9.2-p136,thismaytakeawhiledependingonyourcpu(s)...ruby-1.9.2-p136-#fetchingruby-1.9.2-p136-#downloadingruby-1.9.2-p136,thismaytakeawhiledependingonyourconnection...%Total%Rece
当谈到运行时自省(introspection)和动态代码生成时,我认为ruby没有任何竞争对手,可能除了一些lisp方言。前几天,我正在做一些代码练习来探索ruby的动态功能,我开始想知道如何向现有对象添加方法。以下是我能想到的3种方法:obj=Object.new#addamethoddirectlydefobj.new_method...end#addamethodindirectlywiththesingletonclassclass这只是冰山一角,因为我还没有探索instance_eval、module_eval和define_method的各种组合。是否有在线/离线资
如何检查Ruby文件是否是通过“require”或“load”导入的,而不是简单地从命令行执行的?例如:foo.rb的内容:puts"Hello"bar.rb的内容require'foo'输出:$./foo.rbHello$./bar.rbHello基本上,我想调用bar.rb以不执行puts调用。 最佳答案 将foo.rb改为:if__FILE__==$0puts"Hello"end检查__FILE__-当前ruby文件的名称-与$0-正在运行的脚本的名称。 关于ruby-检查是否