草庐IT

Property

全部标签

hadoop - 在 Oozie 中为 Map-Reduce 作业指定驱动程序

${jobTracker}${nameNode}mapred.input.dir${inputDir}mapred.output.dir${outputDir}mapred.job.queue.name${queueName}mapred.reduce.tasks${numberofReducers}mapred.reducer.new-apitruemapred.mapper.new-apitrueMap/Reducefailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]我正在尝试使用Oozie运行map-reduce作

hadoop - 无法让日志聚合在 Amazon-Hadoop 集群上工作

我尽我所能使日志聚合,但我做不到。所以我需要你的帮助来解决这个问题:我将其添加到yarn-site.xml并重新启动但没有任何乐趣。yarn.log-aggregation-enabletrueWheretoaggregatelogsto.yarn.nodemanager.remote-app-log-dir/tmp/logsyarn.log-aggregation.retain-seconds259200yarn.log-aggregation.retain-check-interval-seconds3600当我尝试通过以下方式进行聚合时:yarnlogs-applicationI

hadoop - 在 Hadoop 2.7.2(CentOS 7) Cluster 中,Datanode 启动但没有连接到 namenode

我安装了一个三节点hadoop集群。master和slave节点单独启动,但datanode没有显示在namenodewebUI中。datanode的日志文件显示以下错误:2016-06-1821:23:53,980INFOorg.apache.hadoop.ipc.Client:Retryingconnecttoserver:namenode/192.168.1.100:9000.Alreadytried0time(s);retrypolicyisRetryUpToMaximumCountWithFixedSleep(maxRetries=10,sleepTime=1000MILLI

hadoop - 每次重新启动集群时都无法访问 HDFS 中的文件?

我刚刚配置了一个克隆hadoop版本2.7.3,我加载了我的数据大小从1g到20go,我使用这个数据(可以操作它们......)但是当我重新启动集群时这个数据没有不会被接受。我将收到此消息:警告:大约有xx个缺失block。请检查日志或运行fsck,这意味着您的HDFS安装中的某些block在任何事件DataNode上都没有单个副本。这是hdfs-site.xml:dfs.namenode.name.dirfile:///home/hduser/hadoop-2.7.3/namenodeNameNodedirectoryfornamespaceandtransactionlogssto

hadoop nodemanager 未启动,slave 不满足最小分配

当运行start-all.sh我的slave1和slave2在jps中找不到nodemanager使用VMvirtualbox在Ubuntu16.04上工作主人yunchi@master:~$jps15920Jps15505SecondaryNameNode15659ResourceManager15293NameNode奴隶1yunchi@slave1:~$jps7587DataNode7945Jps奴隶2yunchi@slave2:~$jps7138DataNode7374Jps这是我的nodemanager-slave1.log2017-10-1217:26:59,662错误or

hadoop - docker 中的 yarn - __spark_libs__.zip 不存在

我浏览了thisStackOverflow帖子,但它们对我帮助不大。我正在尝试让Yarn在现有集群上运行。到目前为止,我们一直在使用sparkstandalonemanger作为我们的资源分配器,它一直按预期工作。这是我们架构的基本概述。白框中的所有内容都在docker容器中运行。从master-machine我可以从yarn资源管理器容器中运行以下命令并运行一个使用yarn的spark-shell:./pyspark--masteryarn--驱动程序内存1G--executor-memory1G--executor-cores1--conf"spark.yarn.am.memory

hadoop - LZO-就地在 HDFS 上压缩和索引文件?

通常我会执行以下操作来使用LZO:使用lzop命令将数据文件压缩到本地磁盘。放入HDFS。使用分布式lzo索引器生成.index文件。我想知道有没有办法同时对HDFS上的原始文件进行压缩和索引? 最佳答案 是的,你可以:在客户端和服务器上的core-site.xml中,将com.hadoop.compression.lzo.LzopCodec添加到以逗号分隔的编解码器列表中:io.compression.codecsorg.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoo

hadoop - 在 Hive 中授予权限

我正在尝试使用HortonworksSandboxHDP2.2作为单节点系统在Hive14.0上设置授予权限。这个问题类似于3月份未回答的问题:grantpermissionsinhivedoesnotworkonhdp2.2.我遵循了aHive-Wiki的配置步骤.登录到hiveshell(使用root的ssh)后,我尝试了:CREATEROLEtesting;FAILED:ExecutionError,returncode1fromorg.apache.hadoop.hive.ql.exec.DDLTask.Failedtoretrieverolesforroot:Metastor

hadoop - Hmaster 未使用 hadoop 2.7.1 启动 hbase 1.1.2

我安装了hadoop2.7.1并且运行成功。我尝试通过引用此链接安装hbase1.1.2:https://archanaschangale.wordpress.com/2013/08/31/installing-pseudo-distributed-hbase-on-ubuntu/配置:hbase-env.sh:exportJAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386exportHBASE_REGIONSERVERS=/usr/lib/hbase/hbase-1.1.2/conf/regionserversexportHBASE_MANAGES_

Hadoop 集群。 Map reduce 作业停留在 map 100% 和 reduce 0%

我是Hadoop新手。我尝试根据ApacheHadoopsite上给出的示例创建一个hadoop集群。.但是,当我运行mapreduce示例时,应用程序卡在map100%和reduce0%。请帮忙我已经使用Vagrant和Virtualbox设置了环境。创建了两个实例。我在一个实例中运行名称节点和数据节点,在另一个实例中运行资源管理器和节点管理器。mapred-siet.xml配置mapreduce.framework.nameyarnmapreduce.map.memory.mb1536mapreduce.map.java.opts-Xmx1024Mmapreduce.reduce.