草庐IT

Kubernetes集群

全部标签

hadoop - 在 hadoop 集群中添加新的数据节点

我设置了3节点集群,运行良好。现在我想再添加一个节点到这个集群。我试过了,但是新节点没有添加到集群中。我的问题是在哪里可以找到此类问题的异常消息。如果我启动数据节点守护进程,它将在新节点中再启动一个,但如果我连接到集群,名称节点将停止数据节点守护进程。因为我猜是一些配置或目录权限问题,所以我怎样才能找出这些错误?这些错误在哪个日志文件中可用?异常:----------------013-06-1418:20:33,987INFOorg.apache.hadoop.hdfs.server.namenode.NameNode:NameNodeupat:master/192.168.0.13

跨集群记录

我正在运行一个基于集群的应用程序(使用Spark,但同样的问题适用于Hadoop)并且想要进行应用程序级别的日志记录(最好使用slf4j)。但是,我希望日志转到一个中央位置——我不想在每台机器上读取单个文件。HDFS文件会很棒-或者任何我可以在单个命令中拉回和grep的文件。我该怎么做? 最佳答案 有几种方法可以解决这个问题。对于罕见/临时搜索,可以使用并行SSH等工具。由于日志量可能很大,因此并行grep可能效率更高对于监控——将日志(在错误级别)重定向到像LogStash这样能够存储和搜索大量日志的系统是有意义的。

使用 cygwin 设置 Hadoop 集群

我打算在我的项目(3个节点)中设置一个hadoop集群。我的疑问是我们可以继续使用cygwin还是应该在我的机器上安装linux操作系统来设置集群?换句话说,使用cygwin建立集群会导致单节点的伪分布式模式还是像普通的分布式集群??请帮助我理解谢谢。 最佳答案 我尝试使用cygwin在pseduo模式下设置Hadoop集群(CDH5.0.2发行版),结果很糟糕。我在类路径方面遇到了问题,cygwin无法从hadoop文件中解析某些路径,所以我不得不重写一些hadoop代码。所以我不建议将hadoop与cygwin一起使用。一般来说

hadoop - 不允许Datanode连接到Hadoop 2.3.0集群中的Namenode

我正在尝试建立一个ApacheHadoop2.3.0集群,我有一个主节点和三个从节点,从节点列在$HADOOP_HOME/etc/hadoop/slaves文件中,我可以从从节点远程登录到端口9000上的主名称节点,但是当我在任何从节点上启动数据节点时,我得到以下异常。2014-08-0308:04:27,952FATALorg.apache.hadoop.hdfs.server.datanode.DataNode:InitializationfailedforblockpoolBlockpoolBP-1086620743-xx.xy.23.162-1407064313305(Data

hadoop - Ganglia 监控 Hadoop 多节点集群

我想使用ganglia监控Hadoop(Hadoop版本0.20.2)多节点集群。我的Hadoop工作正常。我在阅读以下博客后安装了Ganglia---http://hakunamapdata.com/ganglia-configuration-for-a-small-hadoop-cluster-and-some-troubleshooting/http://hokamblogs.blogspot.in/2013/06/ganglia-overview-and-installation-on.html我还学习了MonitoringwithGanglia.pdf(附录BGanglia和

Kubernetes核心组件之kube-proxy实现原理

kube-proxy,负责为Service提供集群内部的服务发现和负载均衡。1介绍了解不同网络组件的工作原理有助于正确设计和配置它们,以满足你的应用程序需求。在Kubernetes网络的背后,有一个在幕后工作的组件。它将你的服务(Services)转化为一些可用的网络规则。这个组件被称为Kube-Proxy。本文展示Kube-Proxy的工作原理。我们将解释创建服务时发生的流程。并展示Kube-Proxy创建的一些示例规则。2什么是Kube-ProxyKubernetes中的Pods是临时的,可随时被终止或重启。由于这种行为,我们不能依赖于它们的IP地址,因为它们总是在变。这就是Service

Kubernetes核心组件之kube-proxy实现原理

kube-proxy,负责为Service提供集群内部的服务发现和负载均衡。1介绍了解不同网络组件的工作原理有助于正确设计和配置它们,以满足你的应用程序需求。在Kubernetes网络的背后,有一个在幕后工作的组件。它将你的服务(Services)转化为一些可用的网络规则。这个组件被称为Kube-Proxy。本文展示Kube-Proxy的工作原理。我们将解释创建服务时发生的流程。并展示Kube-Proxy创建的一些示例规则。2什么是Kube-ProxyKubernetes中的Pods是临时的,可随时被终止或重启。由于这种行为,我们不能依赖于它们的IP地址,因为它们总是在变。这就是Service

java - 将 yamr 作业提交到远程集群时出现 ClassNotFoundException

我有一个伪分布式hadoop集群,作为docker容器运行dockerrun-d-p50070:50070-p9000:9000-p8032:8032-p8088:8088--namehad00psequenceiq/hadoop-docker:2.6.0/etc/bootstrap.sh-d它的配置在这里:https://github.com/sequenceiq/docker-hadoop-ubuntu/我可以成功处理hdfs,访问ui,但坚持从java提交作业,我得到了ClassNotFoundException:Classcom.github.mikhailerofeev.ha

python - Hadoop 集群 : Permission denied 中的 mrjob virtualenv 错误

我在一家拥有Hadoop集群的大型企业组织工作。我让管理员在所有Hadoop工作节pip上安装virtualenv,这样我就可以提交带有标准Python依赖项的mrjob,这些依赖项可能不存在工作节pip。根据文档here,这就是我的mrjob.conf文件的样子:runners:hadoop:setup:-virtualenvvenv-.venv/bin/activate-pipinstallnltk我有一个使用nltk包的简单工作。我可以验证此设置脚本是否在工作节pip上运行(我可以放置简单的命令,例如将一些数据写入/tmp中的文件并且它有效)。但是,我收到以下错误:Newpyth

hadoop - 如何使用远程hadoop集群

我部署了一个Hadoop集群,客户端MapReduce程序运行在另一台机器上。我该如何使用该集群? 最佳答案 如果您在客户端机器上安装了jars,请在该机器上安装hadoop-client包,并在conf文件夹中包含集群的配置详细信息,以便您可以将作业从客户端机器触发到远程集群 关于hadoop-如何使用远程hadoop集群,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/2985