草庐IT

mongodb-container

全部标签

mongodb - mongo-hadoop。不处理 mongodb 文档删除

我想同步mongodb和hadoop,但是当我从mongodb中删除文件时,这个文件在hadoop中一定不能被删除。我尝试使用mongo-hadoop和hive。这是配置单元查询:CREATEEXTERNALTABLESubComponentSubmission(idSTRING,statusINT,providerIdSTRING,dateCreatedTIMESTAMP,subComponentIdSTRING,packageNameSTRING)STOREDBY'com.mongodb.hadoop.hive.MongoStorageHandler'WITHSERDEPROPER

hadoop - 如何知道 Amazon EMR 实例的 MIN_CONTAINER_SIZE?

如何在AmazonEMR集群上获取MIN_CONTAINER_SIZE的默认设置?因为我想通过这个公式来计算EMR上每个节点的内存使用情况RAM-per-container=max(MIN_CONTAINER_SIZE,(TotalAvailableRAM)/containers))谢谢! 最佳答案 在EMR4.x中,默认的最小容器大小为256M。但是上限将受到每个实例类型的节点管理器可用内存的限制(http://docs.aws.amazon.com/ElasticMapReduce/latest/ReleaseGuide/emr

MongoDB助力西门子数字化工厂构建下一代制造执行系统

数据库的高可用性是保障工厂不停工、连续生产的关键所在。在混线生产的情况下,MongoDB对于我们MEMO系统的数据灵活性支撑,保证了产线不停机生产,将运维人员从僵化的工作任务中释放出来,从而能够腾出时间和精力去完成更多高价值工作,极大地提升了运维效率,减少了不必要的人工成本。未来,我们期待能够透过MongoDB新版本、新功能深入更多工业场景,探索更多制造业数字化转型的前沿应用。西门子成都全球灯塔工厂(SEWC),IT工程师田爵松客户简介SEWC:引领数字化未来的灯塔工厂西门子工业自动化产品成都有限公司,简称SEWC,位于四川省成都市高新西区,是西门子工业自动化产品全球第三大研发中心,也是西门子

mongodb - 在 Hadoop 中提交 MapReduce 作业时找不到 com.mongodb.hadoop.MongoOutputFormat

我遵循本教程http://www.mongodb.org/display/DOCS/Hadoop+Quick+Start构建mongodb-hadoop。我尝试构建TreasuryYield示例(我的Hadoop版本是0.20.2。),但是当我提交MapReduce作业时出现以下错误:12/10/2414:01:09INFOutil.MongoTool:Createdaconf:'Configuration:core-default.xml,core-site.xml,mongo-defaults.xml,mongo-treasury_yield.xml'on{classcom.mon

MongoDB的安装配置与操作

目录(一)MongoDB具体配置步骤1、安装MongoDB2、启动MongoDB3、MongoDB命令4、MongoDB权限说明(二)MongoDB常用指令集1、常用命令2、Collection聚集集合3、用户相关4、聚集集合查询用户相关5、索引6、修改、添加、删除集合数据7、语句块操作8、其他(一)MongoDB具体配置步骤1、安装MongoDBMongoDB官网:DownloadMongoDBCommunityServer|MongoDBWindows平台下载:mongodb-windows-x86_64-5.0.2-signed.msi或者mongodb-windows-x86_64-5

mongodb - Hadoop 错误 - 无法计算输入拆分 : need to login

我正在尝试Hadoop在我的数据中应用MapReduce,示例inthislink当我为正确的mongo.input.uri配置本地mongo集合时工作正常。但是当我如下所示配置远程mongo集合时,mongo.input.urimongodb://username:password@remote_mongodb_ip:27017/input_collection我得到以下错误java.lang.IllegalArgumentException:Unabletocalculateinputsplits:needtologin最奇怪的是,如果我为输入表和输出表的远程mongo数据库集合使

mongodb - 动态模式的 Hive 表创建

我们正在研究Hive是否允许我们运行一些类似SQL的查询mongo风格的动态模式作为我们map-reduce作业的先驱。数据以几个TiB的BSON文件的形式出现;每个文件包含JSON“样本”。示例示例如下:{"_id":"SomeGUID","SomeScanner":{"B64LR":22,"Version":192565886128245},"Parser":{"Size":73728,"Headers":[{"VAddr":4096,"VSize":7924....etc....作为动态模式,只有少数字段保证存在。我们希望能够针对可能是某物的输入集运行查询喜欢SomeScanne

python - mongodb_hadoop 流与 python : -inputURI not recognized

我正在尝试使用mongodb_hadoop连接器在python中创建一个MapReduce应用程序。我有一个安装了hadoop2.2.0的集群。我已经安装了mongodb_hadoop连接器v1.3.0。我已经安装了mongodb并创建了一个名为hadoop_db的测试数据库,其中包含一个名为“整数”的集合,其中包含整数值。我的目标是尝试计算每个整数的出现次数。我的工作基于此presentation但是当我尝试执行作业时,这是我得到的:bin/hadoopjarshare/hadoop/tools/lib/hadoop-streaming-2.2.0.jar\-mapperpyhado

hadoop - ESRI Hive ST_Contains 无法正常工作

尝试使用我能找到的JAR(不确定它们是否是最佳选择,我需要使用ESRI并在Hive中执行):ADDJAR/home/user/lib/esri-geometry-api-1.2.1.jar;ADDJAR/home/user/lib/spatial-sdk-hive-1.1.1-SNAPSHOT.jar;ADDJAR/home/user/lib/esri-geometry-api.jar;ADDJAR/home/user/lib/spatial-sdk-hadoop.jar;CREATETEMPORARYFUNCTIONST_PolygonAS'com.esri.hadoop.hive.

java - Hadoop 与 mongoDB : NoClassDefFoundError MongoConfigUtil

我正在学习如何使用mongodb数据作为输入在hadoop中编写map/reduce作业。所以我关注了this示例,但出现以下错误:Exceptioninthread"main"java.lang.NoClassDefFoundError:com/mongodb/hadoop/util/MongoConfigUtilatWordCount.main(WordCount.java:58)atsun.reflect.NativeMethodAccessorImpl.invoke0(NativeMethod)atsun.reflect.NativeMethodAccessorImpl.inv