草庐IT

MongoDb-Server

全部标签

mongodb - 无法在 HDP 的 Hive 查询中使用 mongo-hadoop 连接器

我是hadoop的新手。我已经安装了hortonworks沙箱2.1。我正在尝试使用HiveUI执行Hive脚本。我想访问Hive中的mongo集合。我为此使用了以下查询:CREATETABLEindividuals(idINT,nameSTRING,ageINT,citySTRING,hobbySTRING)STOREDBY'com.mongodb.hadoop.hive.MongoStorageHandler'WITHSERDEPROPERTIES('mongo.columns.mapping'='{"id":"_id"}')TBLPROPERTIES('mongo.uri'='m

hadoop - 添加 phoenix-4.3.0-server.jar 后 region server 在 cloudera 中失败

我在cloudera的/opt/cloudera/parcels/CDH/lib/hbase/lib中添加了phoenix-4.3.0-server.jar。当我尝试启动服务器(区域和主服务器)时,只有主服务器启动。区域服务器有时会暂时启动并立即关闭。这适用于以前版本的phoenix(4.0.0-incubating)。请帮我解决这个问题。 最佳答案 从4.0.0升级到4.3.0失败的原因是兼容性。由于某种原因,4.3.0不兼容从旧版本的phoenix升级。因此,从4.0.0升级到4.1.0,重新启动HBase服务器,然后通过重新启

mongodb - 限制选择查询批量大小

我正在使用MongoToolrunner将数据从mongoDB导入到Hadoopmapreduce作业。由于数据的大小,我收到OutOfMemoryError。所以我想限制我以批量方式获取的记录数。MongoConfigUtil.setQuery()只能设置查询但我不能设置大小来限制获取的记录数。我正在寻找的是类似MongoConfigUtil.setBatchSize()接着MongoConfigUtil.getNextBatch()类似的东西。请提出建议。 最佳答案 您可以使用类MongoInputSplit的setLimit方

hadoop - Spark 错误 : Server IPC version 9 cannot communicate with client version 4

我运行的是hadoop2.7.0版本、scala2.10.4、java1.7.0_21和spark1.3.0我创建了一个如下所示的小文件hduser@ubuntu:~$cat/home/hduser/test_sample/sample1.txtEid1,EName1,EDept1,100Eid2,EName2,EDept1,102Eid3,EName3,EDept1,101Eid4,EName4,EDept2,110Eid5,EName5,EDept2,121Eid6,EName6,EDept3,99运行以下命令时出现错误。scala>valemp=sc.textFile("/hom

K8s 重设解决 “The connection to the server xxx:6443 was refused” 问题

文章目录1.引言2.解决步骤2.1查看kubelet状态2.2查看kubelet日志2.3kubeadm重新初始化2.3.1kubeadm重新设置2.3.2kubeadm初始化2.3.3配置kubectl工具,使其生效2.3.4验证kubectl是否生效2.3.5安装flannel2.3.6查看基础的pod状态2.3.7其他节点加入3.参考1.引言有时kubectl执行命令时出现问题,无法连接kube-apiserver,报错如下:[root@master~]#kubectlgetnoTheconnectiontotheserver192.168.127.128:6443wasrefused-

sql-server - 当表处于不同模式时,如何从 SQL Server 导入所有带有 sqoop 的表?

当我尝试使用sqoop从配置单元中的SQLServer导入所有表时,它有效,但仅当表处于默认架构(dbo)时。当表处于不同模式(并且存在多个模式)时,导入失败并出现错误:15/09/1216:47:50ERRORmanager.SqlManager:Errorexecutingstatement:com.microsoft.sqlserver.jdbc.SQLServerException:Invalidobjectname'Carveout'.com.microsoft.sqlserver.jdbc.SQLServerException:Invalidobjectname'Carve

hadoop - Cloudera-scm-server.log 在两个地方显示错误

我正在尝试运行Cloudera-Manager,但在以下屏幕截图中给出了错误并用红笔标记。谁能帮我解决这些错误?? 最佳答案 错误非常简单。ClouderaManager无法使用指定的凭据连接到数据库。您是否能够使用/etc/cloudera-scm-server/db.properties中提供的凭据手动连接? 关于hadoop-Cloudera-scm-server.log在两个地方显示错误,我们在StackOverflow上找到一个类似的问题: http

mongodb - 带有 $date 的 mongo.input.query 不过滤输入到 hadoop

我有一个分片输入集合,我想在将其发送到我的hadoop集群以进行mapreduce计算之前对其进行过滤。我的$hadoopjar-命令中有这个参数mongo.input.query='{_id.uuid:"device-964693"}'并且有效。输出不会mapreduce任何不满足此查询的数据。但这不起作用:mongo.input.query='{_id.day:{\\$lt:{\\$date:1388620740000}}}'没有数据作为输出产生。1388620740000表示日期WedJan01201423:59:00GMT+0000(GMT)。该设置使用的是hadoop2.2、

【软件开发/设计】分布式架构中的组件(如Kafka、MongoDB和Nginx)如何进行容器化部署

【软件开发/设计】分布式架构中的组件(如Kafka、MongoDB和Nginx)如何进行容器化部署方式一容器化部署的一般步骤Nginx、MongoDB、Kafka容器化部署示例1.Nginx2.MongoDB3.Kafka容器化部署的优势方式二1.Nginx部署创建Deployment创建ServiceNginx和ConfigMap总结应用配置2.MongoDB部署创建StatefulSet创建ServiceMongoDB和ConfigMap应用配置3.Kafka部署使用Helm1.验证Kafka安装2.查看Helm安装的说明3.连接到Kafka4.使用Kafka5.Kafka客户端配置6.监

hadoop - sqoop 导出到 sql server 失败

我正在尝试将250mb的数据(75个字符数组列)从hdfs导出到sqlserver。它因以下错误而失败,Causedby:java.io.IOException:com.microsoft.sqlserver.jdbc.SQLServerException:Theincomingtabulardatastream(TDS)remoteprocedurecall(RPC)protocolstreamisincorrect.ToomanyparameterswereprovidedinthisRPCrequest.Themaximumis2100.然后我通过"-Dsqoop.export.