草庐IT

yarn-error

全部标签

hadoop - 错误 2999 : Unexpected internal error. java.net.URISyntaxException:绝对 URI 中的相对路径

pig-paramCURR_TS=`date"+%F%H:%M:%S"`-fpig_script.pig运行后出现错误-错误2999:意外的内部错误。java.net.URISyntaxException:绝对URI中的相对路径:04:36:33我知道问题出在“:”冒号上,但我想要的是使用由参数传递给pig的相同时间戳格式,以便我可以使用它来执行某些操作。谢谢 最佳答案 1)尝试声明变量给exportdateFormat=`date"+%F%H:%M:%S"`然后通过传递参数值运行pig脚本。pig-xlocal-fread_tes

hadoop - Spark + yarn 簇: how can i configure physical node to run only one executor\task each time?

我的环境包含4个物理节点和少量RAM,每个节点有8个CPU内核。我注意到spark会自动决定为每个CPU分配RAM。结果是发生了内存错误。我正在处理大数据结构,我希望每个执行程序都将在物理节点上拥有整个RAM内存(否则我会遇到内存错误)。我尝试在“yarn-site.xml”文件上配置“yarn.nodemanager.resource.cpu-vcores1”或在spark-defaults.conf上配置“spark.driver.cores1”但没有成功。 最佳答案 尝试设置spark.executor.cores1

python - 为什么 Windows7 中的 hadoop 会引发 RuntimeException : Error in configuring object

我试图在windows7中以伪分布式模式运行hadoop程序,但出现了RuntimeException。我不知道为什么以及如何解决它。我使用python进行mapreduce工作,而不是使用hadoop-streaming实用程序(https://hadoop.apache.org/docs/current/hadoop-streaming/HadoopStreaming.html)的java。我运行了hadoopjar%HADOOP_HOME%\share\hadoop\tools\lib\hadoop-streaming-2.6.2.jar-mappermapper.py-redu

hadoop - 使用 yarn 的 hive 问题

我在yarn上运行hivesql,它在连接条件下抛出错误,我能够创建外部表和内部表但是在使用命令时无法创建表createtableasASSELECTnamefromstudent.当通过hivecli运行相同的查询时它工作正常但是使用springjog它会抛出错误2016-03-2804:26:50,692[Thread-17]WARNorg.apache.hadoop.hive.shims.HadoopShimsSecure-Can'tfetchtasklog:TaskLogServletisnotsupportedinMR2mode.Taskwiththemostfailures

解决bash syntax error near unexpected token from

目录解决bashsyntaxerrornearunexpectedtokenfrom原因分析解决方法什么是Bash脚本Bash脚本的特点编写和运行Bash脚本Bash脚本示例解决bashsyntaxerrornearunexpectedtokenfrom在编写Bash脚本时,如果遇到类似​​syntaxerrornearunexpectedtoken'from'​​的错误,这意味着脚本中的某个语法有问题。本篇博客文章将介绍如何解决这个错误。原因分析该错误通常是因为在Bash脚本中存在语法错误或错误的引号使用方式导致的。以下是一些常见的可能原因:在脚本中使用了未正确闭合的引号。比如,双引号或单引

hadoop - 在 yarn 集群模式 AccessControlException 上执行 Spark

我有一些Spark代码可以分析CSV文件中的输入数据集。当我在集群模式下运行它时,出现以下错误(在本地模式下它到目前为止工作正常)。我的问题是:局部变量是否会影响不同worker的并行执行?我使用本地文件作为输入。我必须使用HDFS文件吗?我相信RDD是并行化的,输入文件可以存储在本地文件系统中。Exceptioninthread"main"org.apache.hadoop.security.AccessControlException:Permissiondenied:user=xxx,access=WRITE,inode="/":hdfs:supergroup:drwxr-xr-

linux - yarn 节点管理器未启动。没有错误

我在Ubuntu16.04上安装了Hadoop2.7.4。我正在尝试以伪模式运行它。我为所有hadoop文件、NameNode和DataNode文件安装了一个“/hadoop”分区。我的core-site.xml是:fs.defaultFShdfs://localhost:9000我的hdfs-site.xml是:dfs.replication1dfs.name.dir/hadoop/nodes/namenodedfs.data.dir/hadoop/nodes/datanode我的mapred-site.xml是:Map-Reduce.framework.nameyarn我的yarn

hadoop - 将 LD_PRELOAD 与 Apache Spark(或 YARN)结合使用

我们在ApacheHadoopYARN上运行Spark作业。我特别需要在这些作业上使用“LD_PRELOAD技巧”。(在任何人panic之前,它不是用于生产运行;这是自动化作业测试的一部分)。我知道如何在作业中提交额外的文件,我知道如何在节点上设置环境变量,所以将这些设置添加到spark-defaults.conf几乎提供了一个解决方案:spark.files=/home/todd/pwn_connect.sospark.yarn.appMasterEnv.LD_PRELOAD=pwn_connect.sospark.executorEnv.LD_PRELOAD=pwn_connect

hadoop - docker 中的 yarn - __spark_libs__.zip 不存在

我浏览了thisStackOverflow帖子,但它们对我帮助不大。我正在尝试让Yarn在现有集群上运行。到目前为止,我们一直在使用sparkstandalonemanger作为我们的资源分配器,它一直按预期工作。这是我们架构的基本概述。白框中的所有内容都在docker容器中运行。从master-machine我可以从yarn资源管理器容器中运行以下命令并运行一个使用yarn的spark-shell:./pyspark--masteryarn--驱动程序内存1G--executor-memory1G--executor-cores1--conf"spark.yarn.am.memory

java - 鉴于我正在将 DataBag 溢出到磁盘,为什么这个 Pig UDF 会导致 "Error: Java heap space"?

这是我的UDF:publicDataBagexec(Tupleinput)throwsIOException{AggregateaggregatedOutput=null;intspillCount=0;DataBagoutputBag=BagFactory.newDefaultBag();DataBagvalues=(DataBag)input.get(0);for(Iteratoriterator=values.iterator();iterator.hasNext();){Tupletuple=iterator.next();//spillCount++;...if(someco