草庐IT

WINUTILS_FAILURE

全部标签

java - 配置单元顶点失败 : killed/failed due to:ROOT_INPUT_INIT_FAILURE Caused by: java. lang.NullPointerException

我正在查询一个表,一个简单的计数(*)并收到以下错误:Vertexfailed,vertexName=Map1,vertexId=vertex_1486982569467_0809_3_00,diagnostics=[Vertexvertex_1486982569467_0809_3_00[Map1]killed/faileddueto:ROOT_INPUT_INIT_FAILURE,VertexInput:table_nameinitializerfailed,vertex=vertex_1486982569467_0809_3_00[Map1],java.lang.RuntimeE

java - 如何设置 winutils.exe 的确切路径以使用 Java 访问 HDFS?

在我的系统变量中,HADOOP_HOME设置为C:\hadoop-2.7.2\bin我尝试使用以下代码访问HDFS:FileSystemhdfs=FileSystem.get(newConfiguration());PathhomeDir=hdfs.getHomeDirectory();运行时错误:17/03/1310:49:39ERRORutil.Shell:Failedtolocatethewinutilsbinaryinthehadoopbinarypathjava.io.IOException:CouldnotlocateexecutableC:\hadoop-2.7.2\bi

hadoop - Windows 上的 Spark - winutils 到底是什么,我们为什么需要它?

我很好奇!据我所知,HDFS需要数据节点进程才能运行,这就是它只在服务器上运行的原因。Spark可以在本地运行,但需要winutils.exe,它是Hadoop的一个组件。但它到底做了什么?为什么我不能在Windows上运行Hadoop,但是我可以运行基于Hadoop构建的Spark? 最佳答案 我至少知道一种用法,它用于在Windows操作系统上运行shell命令。你可以在org.apache.hadoop.util.Shell中找到它,其他模块依赖于这个类并使用它的方法,例如getGetPermissionCommand()方法

python - "Failed to locate the winutils binary"但我的 pyspark 仍然有效

在Windows中,当我启动pysparkshell时,出现错误:2019-04-2008:11:34ERRORShell:397-Failedtolocatethewinutilsbinaryinthehadoopbinarypathjava.io.IOException:Couldnotlocateexecutablenull\bin\winutils.exeintheHadoopbinaries.但是,在那个错误之后,我的pysparkshell可以正常启动,并且我可以毫无问题地运行pyspark并在其上运行代码。但是,我每次都会收到此错误,但我不确定如何摆脱它。我已经正确设置了

Hadoop reducer 错误 : "Shuffle Error: Exceeded the abort failure limit; bailing-out"

我有一个hadoop0.20map/reduce作业,过去运行得很好。最近几天卡在reduce阶段16.66%,我在jobtracker查看reduce任务时看到如下错误;ShuffleError:Exceededtheabortfailurelimit;bailing-out.谁能告诉我这是什么意思,也许能给我指出正确的方向,这样我就能弄清楚如何解决这个问题? 最佳答案 此错误对应于reducer在报告它并映射到属性mapreduce.reduce.shuffle.maxfetchfailures之前尝试获取映射输出的最大次数。您

hadoop - hive ,直线 : Peer indicated failure: GSS initiate failed

我正在使用在Kerberos中添加的帐户启动beeline来测试Sentry:beeline-u"jdbc:hive2://IP:10000/;principal=test_table/domain_name@HADOOP.COM"但是JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=512M;supportwasremovedin8.0JavaHotSpot(TM)64-BitServerVMwarning:ignoringoptionMaxPermSize=512M;supportwasremovedin8

windows - windows上Hadoop+HBase集群 : winutils not found

我正在尝试在Windows上使用Hadoop2.20和HBase0.98设置一个完全分布式的4节点开发集群。我在Windows上成功构建了Hadoop,最近还在Windows上构建了HBase。我们已成功运行Hadoop安装指南中的wordcount示例,以及自定义WebHDFS作业。由于尚不支持在Windows上完全分发的HBase,因此我在cygwin下运行HBase。当尝试从我的主服务器(./bin/start-hbase.sh)启动hbase时,出现以下错误:2014-04-1716:22:08,599ERROR[main]util.Shell:Failedtolocateth

scala - Spark : Executor Lost Failure (After adding groupBy job)

我正在尝试在Yarn客户端上运行Spark作业。我有两个节点,每个节点都有以下配置。我收到“ExecutorLostFailure(执行程序1丢失)”。我已经尝试了大部分Spark调优配置。我已经减少到一个执行器丢失,因为最初我遇到了6个执行器故障。这些是我的配置(我的spark-submit):HADOOP_USER_NAME=hdfsspark-submit--classgenkvs.CreateFieldMappings--masteryarn-client--driver-memory11g--executor-memory11G--total-executor-cores16

java - org.apache.maven.plugin.MojoExecutionException : protoc failure

我在使用maven从源代码编译hadoop时遇到了一些问题。这是错误,任何人都可以帮助我吗?谢谢。[ERROR]Failedtoexecutegoalorg.apache.hadoop:hadoop-maven-plugins:3.0.0-SNAPSHOT:protoc(compile-protoc)onprojecthadoop-c[Help1]org.apache.maven.lifecycle.LifecycleExecutionException:Failedtoexecutegoalorg.apache.hadoop:hadoop-maven-plugins:3.0.0-SN

Hadoop 名称节点 : Single point of failure

Hadoop架构中的Namenode是单点故障。拥有大型Hadoop集群的人如何应对这个问题?是否有一个行业认可且运行良好的解决方案,其中辅助Namenode接管以防主Namenode发生故障? 最佳答案 雅虎有certainrecommendations用于不同集群大小的配置设置,以将NameNode故障考虑在内。例如:ThesinglepointoffailureinaHadoopclusteristheNameNode.Whilethelossofanyothermachine(intermittentlyorpermanen