job_local

hadoop - 如何选择${mapred.local.dir}？

如果我配置了几个${mapred.local.dir}目录来存储MapTask的即时结果，这些目录挂载在不同的磁盘上。我的问题是:1.LocalDirAllocator.java是否用于管理${mapred.local.dir}目录？2.LocalDirAllocator.java的方法getLocalPathForWrite()是用来选择一个${mapred.local.dir}目录的？最佳答案 1.WhetherLocalDirAllocator.javaisusedtomanage${mapred.local.dir}dir

shell - Oozie Job 仍处于 RUNNING 状态

我正在尝试在HDP集群上运行简单的oozie作业。执行oozie后，job保持Running状态。这是我的Workflow.xml${jobTracker}${nameNode}sqoopimport--connectjdbc:mysql://localhost:3306/test--tabletesting--split-byerr_dt--hive-import--hive-tabletesting-m1hive-site.xmlmysql-connector-java.jarActionfailed以下是正在生成的日志..2015-04-0714:33:32,792INFOAct

处于 RUNNING oozie 150407125731126 oozie-oozi-W shell hadoop hive sqoop

hadoop - HDFS 联邦 : Submission of Map Reduce jobs among multiple Name nodes

根据HdfsFederation上的Apache文档,系统可通过多个名称节点的联合进行隔离扩展。多个名称节点/namespace为了横向扩展名称服务，联邦使用多个独立的名称节点/namespace。名称节点是联合的；Namenodes是独立的，不需要相互协调。Datanodes被所有Namenodes用作block的公共(public)存储。我唯一的疑问:我没有看到名称节点之间有任何中央协调器，因为所有节点都在运行隔离。对如何提交和处理作业感到困惑。1)如果我提交一个map-reduce作业，哪个名称节点将处理它？或者2)客户端是否应该知道必须为其提交作业的名称节点？如果客户端不知道哪

Submission multiple section hadoop Federation hdfs hadoop2

hadoop - MrJob 花费大量时间 Copy local files into hdfs

我遇到的问题是:已经将我的input.txt(50MBytes)文件放入HDFS，我正在运行python./test.pyhdfs:///user/myself/input.txt-rhadoop--hadoop-bin/usr/bin/hadoopMrJob似乎花了很多时间将文件复制到hdfs(又是？)Copyinglocalfilesintohdfs:///user/myself/tmp/mrjob/test.myself.20150927.104821.148929/files/这符合逻辑吗？它不应该直接从HDFS使用input.txt吗？(使用Hadoop版本2.6.0)

hadoop MrJob code section myself hdfs

c# - MapReduce.SDK : How to wait for MapReduce job?

我正在使用MicrosoftMapReduceSDK启动仅Mapper作业。调用hadoop.MapReduceJob.ExecuteJob立即抛出“响应状态代码不表示成功:404(未找到)”异常。检查HDInsight查询控制台时，作业成功启动并稍后完成。它还会写入正确的输出文件。我的猜测是，ExecuteJob试图在作业完成之前访问输出数据。处理这种情况的正确方法是什么？usingSystem;usingSystem.Linq;usingSystem.Security.Cryptography.X509Certificates;usingMicrosoft.WindowsAzure

MapReduce c#34 section Constants hadoop azure-hdinsight cortana-intelligence

amazon-web-services - 亚马逊 S3 错误代码 : 400 while running mr-job on EMR

在EMR上运行自定义jar时出现此错误。Exceptioninthread"main"com.amazon.ws.emr.hadoop.fs.shaded.com.amazonaws.services.s3.model.AmazonS3Exception:BadRequest(Service:AmazonS3;StatusCode:400;ErrorCode:400BadRequest;RequestID:B042BB0B40A75966),S3ExtendedRequestID:vr/DUr8HD3xjomauyzqvVdGuW3fHBP8PDUmTIAoVLUxrmsxh9H+OS

amazon-web-services services hadoop java apache mapreduce elastic-map-reduce

hadoop - 批处理模式中的 livy 抛出错误 Error : Only local python files are supported: Parsed arguments

我尝试通过提交python文件以批处理模式执行livy但它不起作用，我尝试了两种方法-从本地文件系统运行py文件，同时通过将它复制到那里在hdfs上运行它......但它不工作......请帮忙hduser@tarun-ubuntu:/home/tarun/spark/examples/src/main/python$curl-XPOST-H"Content-Type:application/json"tarun-ubuntu:8998/batches--data'{"file":"file:///home/tarun/spark/examples/src/main/python/pi

arguments supported 34 spark null hadoop apache-spark pyspark hadoop-yarn

hadoop - 使用 tera gen 时从 kv.local/172.20.12.168 调用 localhost :8020 failed on connection exception,

我正在使用hadoopteragen检查hadoopmapreduce与terasort的基准测试。但是当我运行以下命令时，hadoopjar/Users/**/Documents/hadoop-2.6.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jarteragen-Dmapreduce.job.maps=1001trandom-data我得到以下异常，17/06/0115:09:21WARNutil.NativeCodeLoader:Unabletoloadnative-hadooplibraryforyourp

connection exception java hadoop apache mapreduce hdfs hadoop2 namenode

java - mapreduce 中线程 "main"java.io.IOException : Job failed! 中的异常

我是Hadoop的新用户。我从Hadoop初学者指南(GarryTurkington)运行此示例代码，但遇到作业失败的问题。我在我的输出文件夹中没有看到输出文件(部分文件)。我在mapred-site.xml文件中做了很多更改，但我无法解决作业失败的问题。我该怎么办？importjava.io.IOException;importorg.apache.hadoop.conf.*;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.*;importorg.apache.hadoop.mapred.*;importorg.a

java IOException hadoop apache mapreduce

AWS EMR 中的 Hadoop : Will closing terminal kill hadoop job?

在不终止我的Hadoop作业的情况下关闭我的终端或关闭我的计算机是否安全？我正在通过AmazonElasticMapReduce上的集群运行Hadoop作业。我打开了我的终端，在那里我通过ssh进入了我的主节点。当我尝试关闭终端时，我收到一条警告，提示所有进程都将被终止。这也会扼杀我的Hadoop工作吗？或者我可以关闭我的计算机并稍后再次使用ssh吗？我是否需要特殊工具(如tmux)来执行此操作？如果重要的话，我在Ubuntu13.10中使用默认的(bin/bash)终端。我从Pig脚本开始这项工作。最佳答案不，你可以愉快地杀死

terminal closing section code Hadoop amazon-web-services ssh

124 125 126127128 129 130