mapred-site_草庐IT

java - Hadoop - 如何从 mapred.JobConf 中提取 taskId？

是否可以从*mapred*.JobConf创建一个有效的*mapreduce*.TaskAttemptID？背景我需要为ExistingFileInputFormat编写一个FileInputFormatAdapter。问题是适配器需要扩展mapred.InputFormat而现有格式扩展mapreduce.InputFormat。我需要构建一个mapreduce.TaskAttemptContextImpl，以便我可以实例化ExistingRecordReader。但是，我无法创建有效的TaskId...taskId为null。那么如何从mapred.JobConf获取taskId、

scala - 使用 Hivecontext，在本地系统 metastore_db 而不是 Cluster 中本地创建 Hive 表，在哪里放置我的 hive-site.xml

我已经创建了一个SparkContext对象，并尝试从hadoop服务器(不在我的本地)上的文本文件中检索文本，我能够检索到它。当我尝试检索Hive表(位于独立机器、集群上)时，我无法做到，当我创建一个Hive表时，它是在metastore_db中本地创建的objHiveContext.sql("createtableyahoo_orc_table(dateSTRING,open_priceFLOAT,high_priceFLOAT,low_priceFLOAT,close_priceFLOAT,volumeINT,adj_priceFLOAT)storedasorc")我尝试设置Me

metastore_db Hivecontext section hive warehouse scala hadoop apache-spark

java - 在 mac os 上配置 hadoop namenode 时出现 yarn-site.xml 错误

我正在尝试将我的mac配置为hadoop名称节点。输入此命令后:bin/hdfsnamenode-format我收到这个错误:[FatalError]yarn-site.xml:3:4:Commentmuststartwith"但是yarn-site.xml文件有那个注释。这是该文件的内容:yarn.nodemanager.aux-servicesmapreduce_shuffle任何建议将不胜感激。最佳答案这里有个小错误:这应该是(注意第二个“-”。您需要将“—”替换为“-”):所以更正后的文档是(我使用XMLValidato

时出 yarn-site License lt the java xml macos hadoop

hadoop - Hive:SHOW CONF 不遵守 hive-site.xml

我有以下配置单元站点配置:[hadoop@ip-10-102-201-205~]$cat/etc/hive/conf.dist/hive-site.xmlhbase.zookeeper.quorumip-10-102-201-205.ec2.internalhttp://wiki.apache.org/hadoop/Hive/HBaseIntegrationhive.execution.enginemrfs.defaultFShdfs://ip-10-102-201-205.ec2.internal:8020hive.metastore.uristhrift://ip-10-102-2

hive-site hadoop DEBUG main hive

hadoop - 无法启动 Hive CLI Hadoop(MapR)

我正在尝试访问HiveCLI。但是，由于以下AccessControl问题无法启动。奇怪的是，我能够在没有AccessControl问题的情况下从Hue查询配置单元数据。但是，配置单元CLI不工作。我在MapR集群上。非常感谢任何帮助。[@~]$hiveSLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/opt/mapr/hive/hive-2.1/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBinder.clas

hadoop hive apache mapr

hadoop - 如何使用 Ambari 通过浏览器访问 hdfs-site.xml 和 core-site.xml？

我需要文件hdfs-site.xml和core-site.xml可以通过url访问，因为我正在安装的服务需要在安装时检索这些文件。我正在使用Ambari来管理我的hdfs和我的hadoop/堆栈。最佳答案看起来Ambari本身没有能力直接这样做。下载配置的一种方法是使用“服务操作”下的“下载客户端配置”菜单选项，它会为您提供配置，但在必须解压缩的tar.gz存档中。API调用的例子是:http://c6401:8080/api/v1/clusters/cl1/services/HDFS/components/HDFS_CLIEN

site core-site section hdfs-site hadoop hdfs ambari

hadoop - 在 MapR 集群之间切换

我在mapr-clusters.conf中指定了两个集群cluster1secure=truecldb1:7222cldb2:7222cldb3:7222cluster2secure=truecldb4:7222cldb5:7222cldb6:7222在某些情况下，我想将数据加载到cluster1中。在其他场合，我想在cluster2中加载数据。默认情况下，MapR客户端将第一个指定为默认客户端。如何告诉MapR客户端使用第二个指定的集群？这样hadoopfs-put目标集群2？最佳答案通常，MapR支持HDFSAPI的/map

hadoop MapR section cldb 7222

hadoop - org.apache.hadoop.mapred.Mapper 中的 'key K1' 有什么用？

我正在学习ApacheHadoop并且正在查看WordCount示例org.apache.hadoop.examples.WordCount.我已经理解这个例子，但是我可以看到变量LongWritablekey没有在中使用(...)publicvoidmap(LongWritablekey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{Stringline=value.toString();StringTokenizeritr=newStringTokenizer(line);while(itr.h

hadoop amp section apache mapreduce

java - 即使在命令行上告诉为 -D mapred.reduce.tasks=0 后，hadoop reduce 任务仍在运行

我有一个MapReduce编程为publicstaticclassMapClassextendsMapReduceBaseimplementsMapper{privatefinalstaticIntWritableuno=newIntWritable(1);privateIntWritablecitationCount=newIntWritable();publicvoidmap(Textkey,Textvalue,OutputCollectoroutput,Reporterreporter)throwsIOException{citationCount.set(Integer.par

上告 reduce IntWritable JobClient java hadoop mapreduce

xml - 改变 mapred.reduce.tasks

我应该在哪个文件中设置reducer的数量和设置mapred.reduce.tasks参数？我的conf文件夹中只有以下文件，没有一个有这个参数:ubuntu@group-3-vm1:~/conf$lscapacity-scheduler.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xmlcore-site.xmlhive-site.xmltez-site.xml 最佳答案所有Hadoop配置属性都分为以下几组。Hadoop-1.X.X:核心-core-site.xmlhdfs-hdfs-si

mapred reduce site xml section hadoop mapreduce hive hdfs