mongo-csharp-driver

mongodb - 是否可以通过 Mongo 连接器将多个 mongo 集合导入 Hadoop

我们正在使用MongoDB和AmazonEMR进行概念验证。我们已经能够得到一个简单的端到端解决方案，它可以从mongo中的一个集合读取数据，执行映射/归约函数，然后将输出写入Mongo中的另一个集合。我的问题是-是否可以从Mongo中读取用于查找目的的其他集合。即，collection1中的所有数据都将对其执行map/reduce函数，但map/reduce函数将使用collection2和collection3中的数据进行查找。如果这不可能-那么将查找数据放入hadoop以便将其用于查找目的的最佳方法是什么？最佳答案可以在M

maven - 错误:无法找到或加载主类org.apache.mahout.driver.MahoutDriver

我试图运行以下语句：代码：/usr/local/lib/mahout/bin$mahoutseqwiki-i/user/wiki/enwiki-articles.xml-o/user/wiki/kmeansseqfiles错误：MAHOUT_LOCALisset,sowedon'taddHADOOP_CONF_DIRtoclasspath.MAHOUT_LOCALisset,runninglocallyError:Couldnotfindorloadmainclassorg.apache.mahout.driver.MahoutDriver我遵循了这个stackoverflowpage

MahoutDriver apache mahout root xml maven ubuntu hadoop classnotfoundexception

java - Mapreduce 作业吐出 java.io.IOException : com. mysql.jdbc.Driver

hadoop-2.7.3我正在创建一个mapreduce作业，它从HDFS输入文件读取数据并将数据写入mysql。它在启动连接时抛出错误。没有其他信息，例如连接被拒绝或classNotFound异常。简单的IO异常，对我来说没有任何意义。Error:java.io.IOException:com.mysql.jdbc.Driveratorg.apache.hadoop.mapreduce.lib.db.DBOutputFormat.getRecordWriter(DBOutputFormat.java:185)atorg.apache.hadoop.mapred.ReduceTask$

java IOException hadoop section mysql jdbc mapreduce

java - 无法使用 mongo-hadoop 连接器将 Hive 与 MongoDB 连接

我第一次尝试使用mongo-hadoop-core2.0.2安装和配置hive。我已经安装了hadoop2.8.0、Hive2.1.1和MongoDB3.4.6。单独运行时一切正常。我的问题是，我无法将MongoDB与Hive连接起来。如此处所述，我正在使用mongo-Hadoop连接器https://github.com/mongodb/mongo-hadoop/wiki/Hive-Usage所需的jar已添加到Hadoop和Hive库中。即使我从配置单元控制台将它们添加到hive.sh或运行时。执行创建表查询时出现错误我的查询是CREATEEXTERNALTABLEtestHive

mongo-hadoop MongoDB hadoop hive mongo java

java - 在 MapReduce 程序中，reducer 没有被 Driver 调用

我根据mapreduce编程模型编写了这个程序，Driver代码如下我的司机类(class)publicclassMRDriverextendsConfiguredimplementsTool{@Overridepublicintrun(String[]strings)throwsException{if(strings.length!=2){System.err.println("usage:");System.exit(0);}Jobjob=newJob(getConf(),"multiplefiles");job.setJarByClass(MRDriver.class);job

MapReduce reducer Text 34 String java hadoop

mongodb - Mongo Hadoop 连接器支持聚合吗？

我正在尝试使用spark的mongohadoop(https://github.com/mongodb/mongo-hadoop)库对mongo集合执行一些聚合操作。我使用作为输入发送到newApiHadoopRDD的mongo.input.query配置输入我的查询。ConfigurationmongodbConfig=newConfiguration();mongodbConfig.set("mongo.job.input.format","com.mongodb.hadoop.MongoInputFormat";mongodbConfig.set("mongo.input.uri

mongodb Hadoop 34 mongo section apache-spark

mongodb - RDD 仅部分写入 mongo

我正在使用Spark1.3.1并尝试使用mongo-hadoopconnector将RDD保存到mongodb版本1.3.2和mongo-java-driver版本3.0.1。当我在独立集群上运行下面的应用程序时，驱动程序被标记为失败。这是我用来重现问题的代码，importorg.apache.spark.SparkConfimportorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.hadoop.conf.Configurationimportorg.apache.sp

mongodb mongo DAGScheduler apache hadoop apache-spark

eclipse - Hive JDBC Web 应用程序中的 "Driver not capable"异常

“java.sql.SQLFeatureNotSupportedException:[Simba][JDBC](10220)驱动程序不可用。”当我在Eclipse(Kepler)中使用Hive0.13执行我的JavaEEweb应用程序时出现上述异常。由于下面一行:pstmt=con.prepareStatement(query,ResultSet.TYPE_SCROLL_INSENSITIVE,ResultSet.CONCUR_UPDATABLE);注意:-应用程序使用上述方法的查询参数正确执行。-但是，这个异常只是因为上述方法的最后2个参数，只不过是ResultSet类型。我遵循的配

amp eclipse strong section li tomcat hadoop hive cloudera

java - Mongo-Hadoop 简单测试因 NPE 而失败

这是支持论坛中发布的未决问题here但由于我没有得到任何回应，我想我应该尝试在这里提问。我有一个使用MongoDB作为数据层。目前我正在使用Mongo的Mapreduce机制，但是，我我面临一些性能问题。所以我想到了使用Hadoop来实现该逻辑。我已经成功地运行了国债yield的例子，并且想到了创建一个简单的项目只是为了了解mongo-hadoop驱动程序。所以我创建了一个项目，在构建中插入了适当的jar文件路径并运行它。这是我的java代码:finalConfigurationconf=newConfiguration();MongoConfigUtil.setInputURI(co

Mongo-Hadoop Hadoop JobClient java mongodb nullpointerexception mapreduce

scala - 找不到 Apache Spark Mongo-Hadoop 连接器类

所以我正在尝试运行这个示例https://github.com/plaa/mongo-spark/blob/master/src/main/scala/ScalaWordCount.scala但我一直收到这个错误Exceptioninthread"main"java.lang.NoClassDefFoundError:com/mongodb/hadoop/MongoInputFormatatScalaWordCount$.main(ScalaWordCount.scala:27)我不确定为什么很难找到类(class)。我用Maven构建了这个项目，它似乎构建得很好。/usr/local

Mongo-Hadoop Apache section code ScalaWordCount scala maven hadoop apache-spark mongodb-hadoop

192 193 194195196 197 198