草庐IT

HADOOP_NAMENODE_OPTS

全部标签

hadoop - hdfs-site.xml 上的配置属性是否适用于 hadoop 中的 NameNode?

最近搭建了一个hadoop的测试环境集群-一主两从Master不是dataNode(尽管有些使用master节点作为主节点和从节点)。所以基本上我有2个数据节点。复制的默认配置是3。最初,我没有更改conf/hdfs-site.xml上的任何配置。我遇到错误couldonlybereplicatedto0nodesinsteadof1。然后我在我的主从中更改了conf/hdfs-site.xml中的配置,如下所示:dfs.replication3瞧!一切正常。我的问题是:尽管我更改了所有数据节点和名称节点中的hdfs-site.xml,但此配置是否适用于名称节点或数据节点。如果我的理解

hadoop - Apache Oozie 3.3.2 构建错误 |插件解析异常

我一直在尝试在Centos6.4上安装带有ApacheHadoop版本1.2.1的OozieMaven3.2.1已安装。在尝试使用以下命令构建发行版时,出现以下错误mkdistro.sh-e-DskipTests[警告]为org.apache.oozie:oozie-main:pom:3.3.2构建有效模型时遇到了一些问题[警告]com.atlassian.maven.plugins:maven-clover2-plugin的“build.plugins.plugin.version”丢失。@第742行,第21列[警告]org.codehaus.mojo:findbugs-maven-

java - 如何在 mapreduce Hadoop 中执行类似于 SQL 的 Between Operator

我正在尝试编写一个mapreduce作业,它将模拟sql查询的between运算符我的情况是我有2个hdfs文件:HDFS文件1包含开始日期、结束日期和更改日期:StartDate|EndDate|ChangedDatedd/MM/yyyy|dd/MM/yyyy|dd/MM/yyyydd/MM/yyyy|dd/MM/yyyy|dd/MM/yyyydd/MM/yyyy|dd/MM/yyyy|dd/MM/yyyy........HDFS文件2包含需要执行betweenoperator的数据Data1|Data2|DATEdata|otherdata......Data1|Data2|DAT

hadoop - 在 Map reduce 中每次修改代码都需要创建一个 jar 文件

我正在Hadoop单节点集群中运行一个程序(MapReduce)。经常对MapReduce逻辑进行一些修改。我正在使用EclipseIDE。每次修改逻辑后,我都会创建一个jar文件来检查Hadoop中的Mapreduce作业。每次修改MapReduce逻辑后都创建一个jar文件有点繁琐。有没有更简单的方法来在每次进行更改时创建jar文件?请指教。 最佳答案 不清楚是您必须制作jar文件这一事实还是制作jar的过程似乎太困难的问题。首先,您必须制作一个jar文件才能将作业提交到Hadoop。没有办法解决这个问题。其次,为了简化创建ja

hadoop - HBase MapReduce 作业加载配置(hbase-site.xml),但实际上并没有

我正在编写一个从(a)HBase表读取的MapReduce作业。除了Configuration类之外,几乎所有的东西都按预期工作。所以我这样做了,Configurationconfig=HBaseConfiguration.create();GenericOptionsParserparser=newGenericOptionsParser(config,args);//Thisshouldworkbutisnotworking.config.addResource(newPath(parser.getCommandLine().getOptionValue("conf",DEFAUL

hadoop - 为什么hadoop格式给出 "java.net.UnknownHostException"异常

正在学习hadoop,尝试按照网上的资料搭建环境。我已经配置了ssh(sshlocalhost不需要密码),配置了“core-site.xml”、“hdfs-site.xml”、“mapred-site.xml”和“yarn-site.xml”但是当我尝试“hadoopnamenode-format”时,它给出了“java.net.UnknownHostException”和host=java.net.UnknownHostException:我尝试搜索联机帮助,但几乎都是:更改etc/hosts中的网络配置。但是我使用的是hadoop2.4,没有这样的文件夹。有什么建议吗?谢谢!

hadoop - hive-hbase 集成错误

我使用的是hive版本0.12.0,hadoop版本2.4.0和hbase版本0.98.3我在hbase中创建了一个表信息,用一行数据填充它,为hive提供访问权限(使用外部表)运行查询时selectcount(*)frominfo;我明白了TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksdeterminedatcompiletime:1Inordertochangetheaverageloadforareducer(inbytes):sethive.exec.reducers.bytes.per.reducer=In

hadoop - 使用正则表达式的配置单元查询

您好,我正在寻找一种查询配置单元表(user_acc_detl)的方法其中一列(ACC_DETAILS)数据如下所示,COUNTRY[0]_unitedstaes~DATE[0]_6/10/2014~AMOUNT[0]_200~ID[0]_20140509065052159324~COUNTRY[1]_unitedkingdom~DATE[1]_6/17/2014~AMOUNT[1]_125~ID[1]_20140516075156389761~COUNTRY[2]_Canada~DATE[2]_6/26/2014~AMOUNT[2]_200~ID[2]_201405150940134

hadoop - 将参数从 coordinator.xml 传递到 workflow.xml oozie

我有一个要求,我需要在oozie中获取从协调员到工作流的日期。为此,我开发了示例协调器和工作流程,如下所示。但是,启动协调器作业后,所有工作流作业都失败,错误代码为E0701。表示xml解析错误。我很努力地尝试了,我哪里做错了?我找不到问题?请帮忙。workflow.xml${jobTracker}${nameNode}Actionfailed,errormessage[${wf:errorMessage(wf:lastErrorNode())}]协调器.xml${wf_application_path}DATE${coord:formatTime(coord:nominalTime(

hadoop - 在 Amazon S3 中创建由 Avro 文件支持的 Hive 表时出现问题

我一直在尝试在S3中创建一个由Avro文件支持的Hive表。最初,我认为这可能相对简单,但我遇到了以下错误。这是创建表的命令:setfs.s3.awsAccessKeyId=ACCESS_KEY_ID;setfs.s3.awsSecretAccessKey=SECRET_ACCESS_KEY;usesome_database;CREATEEXTERNALTABLEexperiment_with_s3_backed_dataROWFORMATSERDE'org.apache.hadoop.hive.serde2.avro.AvroSerDe'WITHSERDEPROPERTIES('av