mapred_tmp_草庐IT

java - 为什么 Hive 和 HiveServer2 需要 mapred.InputFormat？

我只是想确保我没有遗漏任何东西。我正在为Hive开发一个InputFormat来处理我们特定的hdfs文件格式。我刚刚意识到它需要扩展mapred.InputFormat而不是mapreduce.InputFormat这样对吗？或者我错过了什么？我可以使用mapreduce包中的FileInputFormat吗？最佳答案您将不得不使用mapred.InputFormatHive尚未完全迁移到新包。如果您出于任何原因需要/想要使用mapreduce.InputFormat包，您始终可以包装mapreduce.InputFormat

java - Hadoop - 如何从 mapred.JobConf 中提取 taskId？

是否可以从*mapred*.JobConf创建一个有效的*mapreduce*.TaskAttemptID？背景我需要为ExistingFileInputFormat编写一个FileInputFormatAdapter。问题是适配器需要扩展mapred.InputFormat而现有格式扩展mapreduce.InputFormat。我需要构建一个mapreduce.TaskAttemptContextImpl，以便我可以实例化ExistingRecordReader。但是，我无法创建有效的TaskId...taskId为null。那么如何从mapred.JobConf获取taskId、

JobConf Hadoop code TaskAttemptContextImpl section java mapreduce hive

hadoop distcp异常无法重命名tmp文件

我正在尝试使用distcp命令将数据从一个cdh(CDH4.7.1)集群移动到另一个cdh(cdh5.4.1)集群:hadoopdistcp-Dmapred.task.timeout=60000000-updatehdfs://namenodeIpofsource(CDH4):8020/user/admin/distcptest1webhdfs://namenodeIpoftarget(CDH5):50070/user/admin/testdir使用此命令，目录和子目录从源集群cdh4复制到目标集群cdh5，但源集群中的文件未复制到目标集群，失败并出现以下错误:无法将tmp文件(=we

命名 hadoop apache java cloudera cloudera-cdh distcp

java - 从数据帧 'java.lang.IllegalArgumentException: Wrong FS: file:/tmp/spark expected: hdfs://nameservice1' 创建 Hive 表时出错

我是spark的新手。我正在尝试开发一个使用Spark1.6将json数据保存到Hive表的应用程序。这是我的代码:valrdd=sc.parallelize(Seq(arr.toString))//arristheJsonarrayvaldataframe=hiveContext.read.json(rdd)dataframe.registerTempTable("RiskRecon_tmp")hiveContext.sql("DROPTABLEIFEXISTSRiskRecon_TOES")hiveContext.sql("CREATETABLERiskRecon_TOESasse

时出 IllegalArgumentException apache spark scala java hadoop apache-spark hive

scala - 监听器异常 : Mkdirs failed to create/tmp/temporary ( full permission given to the dir. )

当我编写流数据时显示此错误时，我正在学习结构化流CountQuery:org.apache.spark.sql.streaming.StreamingQuery=org.apache.spark.sql.execution.streaming.StreamingQueryWrapper@604770e3org.apache.spark.sql.streaming.StreamingQueryException:QueryCount[id=4ce8572a-24c9-4cde-97e4-051426cbb15e,runId=59c60d53-73ee-43a4-8792-d5907a88

监听器 permission apache section ThreadPoolExecutor scala apache-spark hadoop spark-structured-streaming

hadoop - 无法启动 Hive CLI Hadoop(MapR)

我正在尝试访问HiveCLI。但是，由于以下AccessControl问题无法启动。奇怪的是，我能够在没有AccessControl问题的情况下从Hue查询配置单元数据。但是，配置单元CLI不工作。我在MapR集群上。非常感谢任何帮助。[@~]$hiveSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/opt/mapr/hive/hive-2.1/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.clas

hadoop hive apache mapr

hadoop - SparkR 错误 : The root scratch dir:/tmp/hive on HDFS should be writable

我正在尝试初始化SparkR，但出现权限错误。我的Spark版本是spark-2.2.1-bin-hadoop2.6。我搜索了这个错误以及如何解决它，我发现了几个相关的主题。但是，我无法使用与这些主题相同的方法来解决它，他们提供的解决方案(以及我尝试过的解决方案)是使用以下命令授予/tmp/hive目录权限:sudo-uhdfshadoopfs-chmod-R777/tmp/hive有足够知识的人可以给我另一种可能的解决方案吗？错误堆栈跟踪如下:$sudo./bin/sparkRRversion3.4.2(2017-09-28)--"ShortSummer"Copyright(C)20

writable scratch scala AbstractChannelHandlerContext apache hadoop apache-spark hive hdfs sparkr

hadoop - 在 MapR 集群之间切换

我在mapr-clusters.conf中指定了两个集群cluster1secure=truecldb1:7222cldb2:7222cldb3:7222cluster2secure=truecldb4:7222cldb5:7222cldb6:7222在某些情况下，我想将数据加载到cluster1中。在其他场合，我想在cluster2中加载数据。默认情况下，MapR客户端将第一个指定为默认客户端。如何告诉MapR客户端使用第二个指定的集群？这样hadoopfs-put目标集群2？最佳答案通常，MapR支持HDFSAPI的/map

hadoop MapR section cldb 7222

hadoop - org.apache.hadoop.mapred.Mapper 中的 'key K1' 有什么用？

我正在学习ApacheHadoop并且正在查看WordCount示例org.apache.hadoop.examples.WordCount.我已经理解这个例子，但是我可以看到变量LongWritablekey没有在中使用(...)publicvoidmap(LongWritablekey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{Stringline=value.toString();StringTokenizeritr=newStringTokenizer(line);while(itr.h

hadoop amp section apache mapreduce

java - 即使在命令行上告诉为 -D mapred.reduce.tasks=0 后，hadoop reduce 任务仍在运行

我有一个MapReduce编程为publicstaticclassMapClassextendsMapReduceBaseimplementsMapper{privatefinalstaticIntWritableuno=newIntWritable(1);privateIntWritablecitationCount=newIntWritable();publicvoidmap(Textkey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{citationCount.set(Integer.par

上告 reduce IntWritable JobClient java hadoop mapreduce