草庐IT

mapred-default

全部标签

hadoop - default.fs.name 和 hive.metastore.warehouse.dir 不冲突

嗨,当我尝试运行以下命令时LoaddataInpath'/data'intoTableTablename;在hiveshell中抛出以下错误Movefrom:hdfs://hadoopcluster/datato:file:/user/hive/warehouse/Tablenameisnotvalid.Pleasecheckthatvaluesforparams"default.fs.name"and"hive.metastore.warehouse.dir"donotconflict.我的default.fs.name属性在哪里fs.defaultFShdfs://hadoopcl

java - Hadoop:从 o.a.h.mapred 实现接口(interface),还是从 o.a.h.mapreduce 扩展类?

我正在学习Hadoop(0.20.205),我有点困惑。推荐哪种方式:A)从org.apache.hadoop.mapred实现Mapper和Reducer接口(interface),并使用JobConf,如PiEstimator示例中所示。B)从org.apache.hadoop.mapreduce扩展Mapper和Reducer类,并使用Job,如WordCount示例中所示。哪一个更有可能在未来被淘汰?Hbase(0.90.4)似乎更喜欢第二种方式,因为o.a.h.h.mapred中的TableOutputFormat已被弃用,而中的TableOutFormat>o.a.h.h.

hadoop mapred 作业 - 初始化尝试 mapred 任务时出错

我不小心删除了hadoop.tmp.dir,在我的例子中是/tmp/{user.name}/*。现在每次当我从CLI运行配置单元查询时,mapred作业将在任务尝试时失败,如下所示:Errorinitializingattempt_201202231712_1266_m_000009_0:org.apache.hadoop.util.DiskChecker$DiskErrorException:Couldnotfindanyvalidlocaldirectoryforttprivate/taskTracker/hdfs/jobcache/job_201202231712_1266/jo

hadoop - org.apache.hadoop.mapred.YarnChild : Error running child : java. lang.OutOfMemoryError: Java 堆空间

我有一个90MB的snappy压缩文件,我试图将其用作AWSEMR中AMI3.0.4上的Hadoop2.2.0的输入。我的记录阅读器在尝试读取文件时立即收到以下异常:2014-05-0614:25:34,210FATAL[main]org.apache.hadoop.mapred.YarnChild:Errorrunningchild:java.lang.OutOfMemoryError:Javaheapspaceatorg.apache.hadoop.io.compress.BlockDecompressorStream.getCompressedData(BlockDecompre

hadoop - 什么是 Mapr Warden?

我正在玩MaprSandbox,我不明白MaprWarden应用程序的作用是什么。Mapr网站包含对配置文件的引用,但没有程序本身的描述。 最佳答案 Warden是一个轻型Java应用程序,它在集群中的所有节点上运行并协调集群服务。Warden在每个节点上的工作是启动、停止或重新启动适当的服务,并为它们分配正确数量的内存。Warden广泛使用本指南ZooKeeper部分中讨论的znode抽象来监视集群服务的状态。Warden配置包含在warden.conf文件中,它以::的形式列出服务三元组。此三元组的节点数元素控制可以在集群上运行

Hadoop : java. io.IOException : No valid local directories in property: mapred. local.dir

当我运行hadoop作业时,它失败并显示以下堆栈跟踪:11/10/0613:12:49INFOmapred.FileInputFormat:Totalinputpathstoprocess:111/10/0613:12:49INFOmapred.JobClient:Cleaningupthestagingareahdfs://localhost:54310/app/hadoop/tmp/mapred/staging/Har/.staging/job_201110051450_000711/10/0613:12:49ERRORstreaming.StreamJob:ErrorLaunch

Hadoop Spark (Mapr) - AddFile 它是如何工作的

我想了解hadoop是如何工作的。假设我在hdfs上有10个目录,它包含100个我想用spark处理的文件。在书中-使用Spark进行快速数据处理这要求文件在集群中的所有节点上都可用,这并不是什么大问题本地模式的问题。在分布式模式下,你会想要使用Spark的addFile功能,用于将文件复制到集群中的所有机器。我无法理解这一点,将在每个节点上创建文件副本。我想要的是它应该读取该目录中存在的文件(如果该目录存在于该节点上)抱歉,我有点困惑,如何在spark中处理上述情况。问候 最佳答案 Thesectionyou'rereferrin

Hue 中的 hadoop.hdfs_clusters.default.webhdfs_url 错误

任何人都可以帮我解决这个色调错误。Currentvalue:http://localhost:50070/webhdfs/v1Failedtocreatetemporaryfile"/tmp/hue_config_validation.15785472045199379485"仅供引用,我使用的是ClouderaManager5.1.3和Hue3.6。 最佳答案 好的,我自己解决问题。错误原因是NameNode处于安全模式。此命令将使您的Namenode离开安全模式。sudo-uhdfshdfsdfsadmin-safemodele

java - 错误 :(63, 40) java : incompatible types: org. apache.hadoop.mapreduce.Job 无法转换为 org.apache.hadoop.mapred.JobConf

我只是在intelljIDE中运行一个简单的hadooop程序。但是当我尝试编译时出现错误$Error:(63,40)java:incompatibletypes:org.apache.hadoop.mapreduce.Jobcannotbeconvertedtoorg.apache.hadoop.mapred.JobConf这是我的这个小程序的代码:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;impor

hadoop - pig 忽略 maxReducers 并使用 mapred.reduce.tasks 代替

我的pig脚本生成了大约5个MR作业。当它开始执行时,pig打印:BytesPerReducer=1000000000maxReducers=999并继续创建一个只有一个reducer的MR作业:NeitherPARALLELnordefaultparallelismissetforthisjob.Settingnumberofreducersto1但是,对于从同一脚本生成的后续作业,它不会打印此行,并且在其中一个中创建mapred.reduce.tasksreducers,在我的集群中是4992.这是一个已知错误吗?或者我在这里遗漏了什么? 最佳答案