草庐IT

start-all

全部标签

bash - Docker 上的 DataStax Enterprise : fails to start due to/hadoop/conf directory not being writable

我关注了DataStax'sguideonbestpracticesforusingDSEwithDocker,但我在使用DataStax提供的所有默认设置脚本和Dockerfile时遇到了以下错误。错误日志Causedby:java.lang.RuntimeException:FailedtosavecustomDSEHadoopconfigatcom.datastax.bdp.hadoop.mapred.CassandraJobConf.writeDseHadoopConfig(CassandraJobConf.java:310)~[dse-hadoop-5.0.3.jar:5.0

scala - 我可以在 Apache Spark 中捕获诸如 on Executor start 之类的事件吗?

我想做的是让执行器在启动时(即在开始执行任何任务之前)启动一个程序,例如分析工具。通过这种方式,可以监视诸如执行程序的CPU使用率之类的事情。Spark是否提供这样的钩子(Hook)/回调?我用过SparkListener,但那是驱动端用的。我们对执行者有类似的东西吗? 最佳答案 这应该可以满足您的要求。http://spark.apache.org/developer-tools.html#profiling设置yourkit以与驱动程序和从属程序(执行程序)一起工作。除非您告诉它,否则它不会开始分析。连接到master或slav

hadoop - Spark : Spark not using the all the executors configured

我们正在运行一个spark流应用程序,它有批处理排队..但它没有使用为其配置的所有执行程序..它被配置为使用24个执行器,但实际上它只使用了16并且批处理正在排队我们怎样才能让它使用所有24个执行器而不让它排队批处理 最佳答案 it'sconfiguredtouse24executorsbutactuallyit'sonlyusing16您的作业期望分配给它24个容器/执行器,但它只收到16个。这可能是由于以下原因:集群未配置为提供预期数量的资源资源可以是由底层集群管理器(yarn/mesos)配置的内存或vcores。您可以通过检

hadoop - 使用 start-dfs.sh 的问题

我使用此链接创建了一个4节点集群:https://blog.insightdatascience.com/spinning-up-a-free-hadoop-cluster-step-by-step-c406d56bae42,但是一旦我到达启动hadoop集群的部分,我就会收到如下错误:$HADOOP_HOME/sbin/start-dfs.shStartingnamenodeson[namenode_dns]namenode_dns:mkdir:cannotcreatedirectory‘/usr/local/hadoop/logs’:Permissiondeniednamenode

hadoop 3.1.2 ./start-all.sh 错误,意外标记附近的语法错误 `<'

我在mac上运行hadoop3.1.2,当执行./start-all.sh时,出现错误提示Startingnamenodeson[localhost]/usr/local/Cellar/hadoop/3.1.2/libexec/bin/../libexec/hadoop-functions.sh:line398:syntaxerrornearunexpectedtoken`我打开hadoop-functions.sh并在第398行找到以下信息:done知道如何解决这个问题吗? 最佳答案 您发现了一个错误,但它不太可能很快得到解决。M

ubuntu - java.io.IOException : All directories in dfs. datanode.data.dir 无效

我试图让hadoop和hive在我的linux系统上本地运行,但是当我运行jps时,我注意到数据节点服务丢失了:vaughn@vaughn-notebook:/usr/local/hadoop$jps2209NameNode2682ResourceManager3084Jps2510SecondaryNameNode如果我运行bin/hadoopdatanode,会出现以下错误:17/07/1319:40:14INFOdatanode.DataNode:registeredUNIXsignalhandlersfor[TERM,HUP,INT]17/07/1319:40:14WARNut

hadoop - Hive UNION ALL 上的订单

假设我有两个包含以下数据的表:A1|c1|c2||a|b|A2|c1|c2||c|d|我想运行一个选择返回两个表的数据,A1数据在A2数据之上:A1UA2|c1|c2||a|b||c|d|所以在Hive上我可以做类似的事情:SELECT*FROMA1UNIONALLSELECT*FROMA2但这不会产生正确的结果。我如何执行UNIONALL发生的命令?还是产生此输出的另一种解决方案? 最佳答案 在您的配置单元输出中有一个额外的列会扰乱您的工作流程吗?如果没有,您可以使用:selectsort_char,c1,c2from(selec

Hadoop 异常 : All specified directories are failed to load

当我启动Hadoop集群时,抛出了以下异常。我没有解决它的想法。任何人帮助我。谢谢2017-07-1009:40:58,960WARNorg.apache.hadoop.hdfs.server.common.Storage:java.io.IOException:IncompatibleclusterIDsin/tools/hadoop/hadoop_storage/hdfs/datanode:namenodeclusterID=CID-47191263-b5b7-4a4d-b8b5-a78b782e66bb;datanodeclusterID=CID-79a53373-9652-4c

bash - 无法在 Cloudera VM for Hadoop 上找到并执行 start-all.sh 和 Stop-all.sh

如何从命令行CDH4--启动/停止服务。我是Hadoop的新手。从Cloudera安装的VM。找不到start-all.sh和stop-all.sh。如果需要,如何停止或启动任务跟踪器或数据节点。这是我在Centos上使用的单节点集群。我没有做任何修改。除此之外,我还看到所有版本的目录结构都发生了变化。我无法在安装的VM上找到这些sh​​文件。[cloudera@localhost~]$stop-all.shbash:stop-all.sh:commandnotfound非常感谢您的支持。 最佳答案 使用Sudosuhdfs启动和停

hadoop - start-all.sh 无法在从属节点上运行进程

我正在尝试在我的笔记本电脑上配置一个主从的多节点集群。当我从master运行start-all.sh时,所有守护进程都在主节点上运行,但Datanode和tasktracker没有在从节点上启动。启用了无密码ssh,我可以在没有pwd的情况下从我的主节点为主节点和从节点执行ssh,但是如果我尝试从从节点执行ssh主节点,它会要求输入密码。这是在从节点中不启动守护进程的问题吗?我们是否需要在主站和从站上使用无密码ssh?从属节点的sshslave不要求pwd只要求master它要求。请给我一些解决方案,为什么我无法从主节点启动从节点中的进程? 最佳答案