5mongo

python - 在 mongo-hadoop 中运行 mapreduce 示例时出现异常

当我尝试运行该示例时，它显示了一些异常。我已经引用了以下链接以供引用http://docs.mongodb.org/ecosystem/tutorial/getting-started-with-hadoop/异常如下，hduser@adminpc:/mongo-hadoop$sudo./gradlewjartestJarhistoricalYield[sudo]passwordforhduser::compileJavaUP-TO-DATE:processResourcesUP-TO-DATE:classesUP-TO-DATE:jarUP-TO-DATE:core:compileJ

中运时出 UP-TO-DATE DATE examples python mongodb hadoop mapreduce

mongodb - Mongo-Hadoop 流式传输

我是Mongodb和Hadoop的新手。我正在尝试访问mongodb数据作为hadoopmapreduce作业的输入。我不太清楚如何指定使用哪个集合从中获取数据。这是我试过的:hadoopjar/usr/local/Cellar/hadoop/2.6.0/libexec/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar-inputuser/test/input/-outputuser/test/output/-inputformatcom.mongodb.hadoop.mapred.MongoInputFormat-outputform

流式 Mongo-Hadoop hadoop mongodb streaming hadoop-streaming

java - 相当于 mongo 的输出 :reduce option in hadoop

我正在重写MongoDBmapreduce作业以改用Hadoop(使用mongo-hadoop连接器)，但是当我将两个数据集映射到同一个集合时，它会覆盖值而不是使用它们{reduce:"collectionName"}-Ifdocumentsexistsforagivenkeyintheresultsetandintheoldcollection,thenareduceoperation(usingthespecifiedreducefunction)willbeperformedonthetwovaluesandtheresultwillbewrittentotheoutputcol

相当 hadoop section reduce the java mongodb mapreduce

mongodb - 是否可以通过 Mongo 连接器将多个 mongo 集合导入 Hadoop

我们正在使用MongoDB和AmazonEMR进行概念验证。我们已经能够得到一个简单的端到端解决方案，它可以从mongo中的一个集合读取数据，执行映射/归约函数，然后将输出写入Mongo中的另一个集合。我的问题是-是否可以从Mongo中读取用于查找目的的其他集合。即，collection1中的所有数据都将对其执行map/reduce函数，但map/reduce函数将使用collection2和collection3中的数据进行查找。如果这不可能-那么将查找数据放入hadoop以便将其用于查找目的的最佳方法是什么？最佳答案可以在M

可以通过 mongodb section noreferrer noopener hadoop emr

java - 无法使用 mongo-hadoop 连接器将 Hive 与 MongoDB 连接

我第一次尝试使用mongo-hadoop-core2.0.2安装和配置hive。我已经安装了hadoop2.8.0、Hive2.1.1和MongoDB3.4.6。单独运行时一切正常。我的问题是，我无法将MongoDB与Hive连接起来。如此处所述，我正在使用mongo-Hadoop连接器https://github.com/mongodb/mongo-hadoop/wiki/Hive-Usage所需的jar已添加到Hadoop和Hive库中。即使我从配置单元控制台将它们添加到hive.sh或运行时。执行创建表查询时出现错误我的查询是CREATEEXTERNALTABLEtestHive

mongo-hadoop MongoDB hadoop hive mongo java

mongodb - Mongo Hadoop 连接器支持聚合吗？

我正在尝试使用spark的mongohadoop(https://github.com/mongodb/mongo-hadoop)库对mongo集合执行一些聚合操作。我使用作为输入发送到newApiHadoopRDD的mongo.input.query配置输入我的查询。ConfigurationmongodbConfig=newConfiguration();mongodbConfig.set("mongo.job.input.format","com.mongodb.hadoop.MongoInputFormat";mongodbConfig.set("mongo.input.uri

mongodb Hadoop 34 mongo section apache-spark

mongodb - RDD 仅部分写入 mongo

我正在使用Spark1.3.1并尝试使用mongo-hadoopconnector将RDD保存到mongodb版本1.3.2和mongo-java-driver版本3.0.1。当我在独立集群上运行下面的应用程序时，驱动程序被标记为失败。这是我用来重现问题的代码，importorg.apache.spark.SparkConfimportorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.hadoop.conf.Configurationimportorg.apache.sp

mongodb mongo DAGScheduler apache hadoop apache-spark

java - Mongo-Hadoop 简单测试因 NPE 而失败

这是支持论坛中发布的未决问题here但由于我没有得到任何回应，我想我应该尝试在这里提问。我有一个使用MongoDB作为数据层。目前我正在使用Mongo的Mapreduce机制，但是，我我面临一些性能问题。所以我想到了使用Hadoop来实现该逻辑。我已经成功地运行了国债yield的例子，并且想到了创建一个简单的项目只是为了了解mongo-hadoop驱动程序。所以我创建了一个项目，在构建中插入了适当的jar文件路径并运行它。这是我的java代码:finalConfigurationconf=newConfiguration();MongoConfigUtil.setInputURI(co

Mongo-Hadoop Hadoop JobClient java mongodb nullpointerexception mapreduce

scala - 找不到 Apache Spark Mongo-Hadoop 连接器类

所以我正在尝试运行这个示例https://github.com/plaa/mongo-spark/blob/master/src/main/scala/ScalaWordCount.scala但我一直收到这个错误Exceptioninthread"main"java.lang.NoClassDefFoundError:com/mongodb/hadoop/MongoInputFormatatScalaWordCount$.main(ScalaWordCount.scala:27)我不确定为什么很难找到类(class)。我用Maven构建了这个项目，它似乎构建得很好。/usr/local

Mongo-Hadoop Apache section code ScalaWordCount scala maven hadoop apache-spark mongodb-hadoop

PHP Mongo:注意:Mongo::__construct(): 解析服务器

我想知道为什么我会收到以下php通知:(!)Notice:Mongo::__construct():parsingserversinC:\htdocs\multishop\library\Lupi\Resource\Odm.phponline38CallStack#TimeMemoryFunctionLocation10.0004138504{main}()..\index.php:020.0130667392Zend_Application->bootstrap()..\index.php:2530.0130667488Zend_Application_Bootstrap_Boots

Mongo construct php section MongoLog doctrine mongodb-php doctrine-odm

142 143 144145146 147 148