草庐IT

run_metadata

全部标签

hadoop - Spark + yarn 簇: how can i configure physical node to run only one executor\task each time?

我的环境包含4个物理节点和少量RAM,每个节点有8个CPU内核。我注意到spark会自动决定为每个CPU分配RAM。结果是发生了内存错误。我正在处理大数据结构,我希望每个执行程序都将在物理节点上拥有整个RAM内存(否则我会遇到内存错误)。我尝试在“yarn-site.xml”文件上配置“yarn.nodemanager.resource.cpu-vcores1”或在spark-defaults.conf上配置“spark.driver.cores1”但没有成功。 最佳答案 尝试设置spark.executor.cores1

Hadoop 独立安装 - java.net.ConnectException : Connection refused error while running jar

我是Hadoop的新手,我试图在Ubuntu14.04中安装单节点独立Hadoop。我正在关注ApacheHadoopDocument正如那里给出的那样,当我尝试运行时$bin/hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jargrepinputoutput'dfs[a-z.]+'我收到了java.net.ConnectException消息:CallFroma1409User/127.0.0.1tolocalhost:9000failedonconnectionexception:java.net.C

java - Docker 和 Cloudera 快速入门 : How to run own jar-file?

我安装了Docker容器并进行了后续步骤:dockerpullcloudera/quickstart:latestdockerimages#notethehashoftheimageandsubstituteitbelowdockerrun--privileged=true\--hostname=quickstart.cloudera\-t-i${HASH}\/usr/bin/docker-quickstart所以,现在我知道了:Cloudera正在运行。但是我看不到任何本地文件,那么如何加载我自己的文件,尤其是jar文件以使用Hadoop运行它? 最佳答案

hadoop - 运行时异常 : Error in configuring object with null pointer exception while running my UDAF?

我一直在尝试编写一个UDAF来计算加权平均值。我用类似于现有UDAF的方式编写它来计算平均值,但它似乎只适用于我的本地机器。我不确定出了什么问题....有人遇到过类似的问题吗以下是生成的错误:java.lang.RuntimeException:Errorinconfiguringobjectatorg.apache.hadoop.util.ReflectionUtils.setJobConf(ReflectionUtils.java:93)atorg.apache.hadoop.util.ReflectionUtils.setConf(ReflectionUtils.java:64)

hadoop - 得到错误的 FS : file while running hive query

在hive上运行一个简单的选择查询时我遇到了这个奇怪的错误java.lang.IllegalArgumentException:WrongFS:file://usr/lib/hive/lib/CustomUDFint.jar,expected:file:///atorg.apache.hadoop.fs.FileSystem.checkPath(FileSystem.java:410)atorg.apache.hadoop.fs.RawLocalFileSystem.pathToFile(RawLocalFileSystem.java:56)atorg.apache.hadoop.fs

hadoop - Hbase 错误 java.lang.RuntimeException : Unable to run quorum server

我无法启动Hbase,每当我启动时,我只会在jps中获得Hmaster和Hregionserver。Hquorompeer不断丢失。我检查了日志,但出现以下错误:java.lang.RuntimeException:Unabletorunquorumserveratorg.apache.zookeeper.server.quorum.QuorumPeer.loadDataBase(QuorumPeer.java:454)atorg.apache.zookeeper.server.quorum.QuorumPeer.start(QuorumPeer.java:409)atorg.apac

[报错]记录IDEA远程开发报错:java: Cannot run program.....

报错内容IDEA在进行远程开发的时候报错,内容如下:java:Cannotrunprogram"/usr/lib/jvm/java-1.8.0-openjdk-amd64/bin/java"(indirectory"/home/jim/.cache/JetBrains/RemoteDev-IU/_home_jim_DevCodes_Github_zfile/compile-server"):error=0,Failedtoexecspawnhelper:pid:3049929,exitvalue:1表现如下:解决办法在IDEA设置Build,Execution,Deployment--Comp

python - Hadoop 流 : PYTHONPATH not working when mapper runs

我在其中设置了PYTHONPATH,它也能正常工作,除非我运行map-reduce作业它没有说追溯(最近的调用最后):文件“/work/app/hadoop/tmp/mapred/local/taskTracker/hduser/jobcache/job_201203091218_0006/attempt_201203091218_0006_m_000020_0/work/./mapper.py”,第57行,在从src.utilities导入实用程序导入错误:没有名为src.utilities的模块java.lang.RuntimeException:PipeMapRed.waitOu

hadoop - Oozie 和 Hadoop 2,作业卡在 "RUNNING"

我有一个带有java操作节点的工作流作业。使用Hadoop2.1.0.2.0.4.0-38和Oozie3.3.2.2.0.4.0运行当我提交作业时,我在Hadoop资源管理器屏幕中看到2行。1.原职称2.使用Oozie作业名称。Ooziejobname的任务卡在“RUNNING”状态原名称的任务处于“已接受”状态。我在日志中看到的是:>>>InvokingMainclassnow>>>HeartbeatHeartbeatHeartbeatHeartbeat...谢谢 最佳答案 似乎可以并行运行的maptasks的数量是有限的。将以下

hadoop - pig : Container is running beyond physical memory limits in cdh 5 using oozie

我正在尝试运行一个简单的pig脚本,该脚本在gruntshell中运行f9但不使用oozie,出现如下错误:容器[pid=2617,containerID=container_1438923434512_12103_01_000002]正在超出物理内存限制运行。当前使用情况:已使用1.0GB的1GB物理内存;使用了2.9GB的2.1GB虚拟内存。杀死容器。container_1438923434512_12103_01_000002..的进程树转储..实际上我正在通过oozie调用一个shell脚本,实习生调用pig脚本并得到这样的错误。我怎样才能让它在oozie中可用