草庐IT

mongodb-native

全部标签

java - Hadoop 与 mongoDB : NoClassDefFoundError MongoConfigUtil

我正在学习如何使用mongodb数据作为输入在hadoop中编写map/reduce作业。所以我关注了this示例,但出现以下错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:com/mongodb/hadoop/util/MongoConfigUtilatWordCount.main(WordCount.java:58)atsun.reflect.NativeMethodAccessorImpl.invoke0(NativeMethod)atsun.reflect.NativeMethodAccessorImpl.inv

java - Hadoop HDFS MapReduce 输出到 MongoDb

我想编写Java程序,它从HDFS读取输入,使用MapReduce处理它并将输出写入MongoDb。场景如下:我有一个包含3个数据节点的Hadoop集群。Java程序从HDFS读取输入,并使用MapReduce对其进行处理。最后将结果写入MongoDb。其实从HDFS读取数据,用MapReduce处理很简单。但是我对将结果写入MongoDb感到困惑。是否支持任何JavaAPI将结果写入MongoDB?另外一个问题是,由于是HadoopCluster,所以我们不知道哪个datanode会运行Reducer任务并产生结果,是否可以将结果写到安装在特定服务器上的MongoDb中?如果我想把结

mongodb - 我们对 mongodb 使用 nosql 就像对 oracle 使用 sql 一样?

关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗?通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我将以我的问题为例。如果我们使用ORACLE作为数据库,如果我们想从中获取数据,我们应该知道的是SQL。在sql的帮助下,我们可以从oracle中获取数据。如果我们使用Mongodb作为数据库,我们是否必须了解NoSql。??简单来说。用于ORACLE的SQL。和MongoDB的NoSql?我说得对吗?

mongodb - 通过 spark-submit 将额外的 jar 传递给 Spark

我将Spark与MongoDB结合使用,因此依赖于mongo-hadoop驱动程序。多亏了对我原来问题的输入,我才开始工作here.我的Spark作业正在运行,但是,我收到了我不理解的警告。当我运行这个命令时$SPARK_HOME/bin/spark-submit--driver-class-path/usr/local/share/mongo-hadoop/build/libs/mongo-hadoop-1.5.0-SNAPSHOT.jar:/usr/local/share/mongo-hadoop/spark/build/libs/mongo-hadoop-spark-1.5.0-

hadoop - 在 osx 中构建 hadoop 3.1.1 以获取 native 库

我通过brewinstallhadoop安装hadoop,然后使用pipinstallpyarrow作为客户端client=pa.hdfs.connect('localhost',9000,driver='libhdfs')forxinclient.ls('/'):print(x)获取错误Traceback(mostrecentcalllast):File"/Users/wyx/project/py3.7aio/hdfs/list_dir.py",line13,inclient=pa.hdfs.connect('localhost',9000,)File"/Users/wyx/proj

mongodb - hadoop-mongodb 驱动程序和 mahout

我使用hadoop-mongodb驱动程序在mongodb之上设置了hadoop。目前我可以成功地将M/R作业的结果输出到mongo集合。我想使用mahout来利用一些提供的算法。是否可以在mongodb之上使用mahout并直接输出到mongo集合?有我可以阅读的方法或示例吗? 最佳答案 是的,但它与Mahout没有直接关系。您以选择MongoDB位置的方式指定输入和输出URL。剩下的就是Hadoop-Mongo集成和设置的问题。 关于mongodb-hadoop-mongodb驱动程

mongodb - flume 或 kafka 相当于 mongodb

在Hadoop世界中,flume或kafka用于流式传输或收集数据并将它们存储在Hadoop中。我只是想知道MangoDB是否有一些类似的机制或工具来实现一些? 最佳答案 MongoDB只是数据库层,并不是像Hadoop生态系统那样的完整解决方案。实际上,在需要处理和存储大量传入数据的情况下,我实际上使用Kafka和Storm将数据存储在MongoDB中。 关于mongodb-flume或kafka相当于mongodb,我们在StackOverflow上找到一个类似的问题:

java - 编译 Hadoop native - 在 Maven 插件中发现错误

我正在尝试编译Hadoop,但在ant插件中出现Maven错误。我从未使用过Maven或ant,错误似乎没有给出任何错误所在的指示。错误输出在文章末尾。我在pom文件中搜索了maven-antrun-plugin(有54个pom.xml文件带有该字符串)。该错误表明它位于hadoop-common下的文件中,但在该文件中出现了多个maven-antrun-plugin。我不知道哪一个是问题所在,Maven错误掩盖了任何命令失败给出的实际错误消息。我如何:准确找出导致错误的行获取实际的错误输出而不是Maven的无用错误这是错误:[ERROR]Failedtoexecutegoalorg.

访问软件包的最佳方法。JSON版本并在React Native应用中构建变量?

我正在构建一个本地iOS应用程序,并且想:1)从应用程序本身中显示该应用程序的当前版本。具体:现在我已经实施了codepush,我想在“设置”页面上显示当前的应用程序版本,以便应用程序用户可以判断其应用程序是否已升级。我当前在package.json文件中设置版本号并使用这个将其传播到Xcode项目。如果有更好的方法来管理/更新项目版本号,请告诉我!2)基于XCode的构建变量执行某些.js代码。我在Xcode中有三个构建配置(调试,登台,发布)设置,我想指定updateDialog:true标志到CodePush仅用于登台构建。我还想在设置页面上显示,无论是调试,分期还是发布构建。完成这些事

mongodb - 如何将 _id 数据从 mongodb 加载到 Apache Pig

我是Hadoop和ApachePig的新手。我在mongodb中有一个名为用户的集合,具有以下结构。我想通过以下方式将_id加载到ApachePig中:B=LOAD'mongodb://localhost:27017/test.user'USINGcom.mongodb.hadoop.pig.MongoLoader('_id:chararray,firstName:chararray,email:chararray')AS(UID,NAME,EMAIL);但我无法加载它。名称和电子邮件已完美加载。我正在使用这些jar文件REGISTER//avro-1.7.5.jarREGISTER/