草庐IT

HA集群

全部标签

Hadoop集群-重启后Hive无法启动

我有5个节点的hadoop集群正在运行。Hive运行良好,可以创建表、添加数据等。然后尝试重新启动所有5个节点,现在Hive无法启动。使用MySql作为Metastore。可能是什么问题以及如何解决?尝试启动hive时的日志:Exceptioninthread"main"java.lang.RuntimeException:org.apache.hadoop.hive.ql.metadata.HiveException:java.lang.RuntimeException:Unabletoinstantiateorg.apache.hadoop.hive.ql.metadata.Ses

apache-spark - 具有太多可抢占节点的 Google dataproc spark 集群有时会挂起

当在只有2个不可抢占的工作节点和其他100~个可抢占节点的dataproc上运行spark集群时,我有时会得到一个完全不可用的集群,原因是太多的连接错误、数据节点错误、丢失的执行程序,但仍在跟踪心跳...总是出现这样的错误:18/08/0815:40:11WARNorg.apache.hadoop.hdfs.DataStreamer:ErrorRecoveryforBP-877400388-10.128.0.31-1533740979408:blk_1073742308_1487inpipeline[DatanodeInfoWithStorage[10.128.0.35:9866,DS

java - 在集群中启动 MapReduce 作业失败,退出代码为 : -1000 and job. jar 不存在

我正在尝试在Java代码中启动mapreduce作业并将作业提交给yarn。但出现以下错误:2018-08-2600:46:26,075WARN[main]util.NativeCodeLoader(NativeCodeLoader.java:(62))-Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable2018-08-2600:46:27,526INFO[main]client.RMProxy(RMProxy.java:createRMProxy(92))-

hadoop - 创建dataproc集群时报告DataNodes数量不足

在使用gs://作为默认FS创建dataproc集群时,我收到“报告的DataNode数量不足”错误。下面是我正在使用dataproc集群的命令。gclouddataprocclusterscreatecluster-538f--image-version1.2\--bucketdataproc_bucket_test--subnetdefault--zoneasia-south1-b\--master-machine-typen1-standard-1--master-boot-disk-size500\--num-workers2--worker-machine-typen1-st

hadoop - 使用 ambari UI 在 HDP 集群中编辑 hdfs-default.xml

我有一个使用HortonworksDataPlatform2.6.1构建的HBase集群,我想编辑hdfs-default.xml中的一些属性。我们可以使用ambariUI编辑hdfs-default.xml吗?如果我们在所有节点中手动编辑文件,我们需要重新启动哪些服务? 最佳答案 是的,你可以,但Ambari不会编辑默认文件,它会编辑hdfs-site.xml,你至少需要重新启动每个HDFS客户端和服务才能进行更改产生影响。不要手动编辑磁盘上的文件-Ambari会在下次服务重启时覆盖它们

java - Hadoop 集群卡住卡在 Reduce > copy >

到目前为止,对于这个问题,我已经尝试了这里的解决方案,1,在这里,2.然而,虽然这些解决方案确实导致执行mapreduce任务,但看起来它们只在名称节点上运行,因为我得到类似于此处的输出,3。.基本上,我正在使用我自己设计的mapreduce算法运行一个2节点集群。mapreducejar在单节点集群上完美执行,这让我觉得我的hadoop多节点配置有问题。要设置多节点,我遵循了教程here.为了报告出了什么问题,当我执行我的程序时(在检查名称节点、任务跟踪器、作业跟踪器和数据节点正在各自的节点上运行之后),我的程序在终端中的这一行停止:INFOmapred.JobClient:map1

java - hadoop - 在多个集群上映射减少

我已经配置了Hadoop集群。我有两台机器MA和MB当我使用以下代码运行mapreduce程序时hadoopjar/HDP/hadoop-1.2.0.1.3.0.0-0380/contrib/streaming/hadoop-streaming-1.2.0.1.3.0.0-0380.jar-mapper"pythonC:\Python33\mapper.py"-reducer"pythonC:\Python33\redu.py"-input"/user/XXXX/input/input.txt"-output"/user/XXXX/output/out20131112_09"where

hadoop - hadoop集群的系统测试自动化框架

我正在寻找hadoop集群的系统测试框架。受支持的用例应包括HDFS的系统测试、mapreduce作业和hive查询。我从apache中找到了一个名为herriot的,但我不确定它是否仍在维护中。你们知道任何现有框架吗? 最佳答案 看看1和2用于对集群进行基准测试。它有测试的代码和数据。将它们自动化应该不是什么难事。 关于hadoop-hadoop集群的系统测试自动化框架,我们在StackOverflow上找到一个类似的问题: https://stackove

Hadoop - Cloudera MRV1 集群规划 - 理想集群的最小节点数是多少,它看起来如何?

我手动安装了一个具有以下配置的三节点集群:Master/SlaveNode0-NameNode,SecondaryNameNode,JobTracker,HMaster,DataNode,TaskTracker,HRegionServer,HiveMetaStore,DatabaseforHive/Sqoop,HiveServer2,HCatalog,OozieServer,Zookeeper,Oozie-client,Hive-client,pig-client,M/Rclienttools,SqoopSlaveNode1-DataNode,TaskTracker,HRegionSe

docker搭建mysql多主多从(集群),亲测有效!

提示:如果你只是想要搭建mysql主从看这篇文档就够了,很多地方参考了这篇文章:点击这里原理图:1、拉取镜像dockerpullmysql:8.0.252、新建mysql四个容器,两主两从主1(docker容器名为mysql-master)dockerrun-p3307:3306--namemysql-master\-v/home/zh188/mysql_data/mysql-master1/log:/var/log/mysql\-v/home/zh188/mysql_data/mysql-master1/data:/var/lib/mysql\-v/home/zh188/mysql_data