草庐IT

java - 借助log4j输出hadoop程序的变量

我用log4j写了hadoop程序(只有Map步骤,操作不符合我的等待)packageorg.myorg;importjava.io.*;importjava.util.*;importorg.apache.hadoop.fs.*;importorg.apache.hadoop.conf.*;importorg.apache.hadoop.io.*;importorg.apache.hadoop.mapred.*;importorg.apache.hadoop.util.*;importorg.apache.log4j.Logger;importorg.apache.log4j.Log

logging - 使用 Flume Avro 的日志数据未正确存储在 Hive 中

我使用Flume1.5.0从应用程序服务器收集日志。假设我有三个App服务器,App-A、App-B、App-C。运行配置单元的一个HDFS服务器。现在水槽代理在所有3个应用服务器上运行,并将日志消息从应用服务器传递到Hdfs服务器,其中另一个水槽代理正在运行,最后日志存储在hadoop文件系统中。现在我已经创建了一个外部Hive表来映射这些日志数据。但是除了hive无法正确解析日志数据并存储在表中之外,一切都运行顺利。这是我的Flume和Hive配置:虚拟日志文件格式(|分隔):ClientId|AppRequest|URL应用服务器上的Flumeconf:app-agent.sou

hadoop - Cloudera CDH 上的 Impala "Could not create logging file: Permission denied"

我在CDH4.2.0-1.cdh4.2.0.p0.10集群上的ClouderaManager4.5中通过包裹安装了Impala。当我尝试启动服务时,它在所有节点上都失败并显示此消息perl-pi-e's#{{CMF_CONF_DIR}}#/run/cloudera-scm-agent/process/800-impala-IMPALAD#g'/run/cloudera-scm-agent/process/800-impala-IMPALAD/impala-conf/impalad_flags'['impalad=impalad']'exec/opt/cloudera/parcels/I

logging - Hadoop 守护进程日志

这听起来像是一个非常简单的问题,但是有人知道如何访问hadoop上的守护程序日志吗?我的ResourceManager没有连接,所以我试图找出错误。我在网上做了一些调查,发现hadoop---.log但这对我不起作用。我怀疑我输入的主机名不正确;我的主机名是“Macintosh.local”,但这没有效果。或者我应该在运行此命令时位于特定目录中?感谢您的帮助。 最佳答案 运行hadoop守护进程时,应设置HADOOP_HOME环境变量。您应该检查$HADOOP_HOME/logs目录中的日志以确定问题。

hadoop - namenode.NameNode : Could not initialize shared edits dir

您好,我在HA集群配置时间遇到了所有这些错误。请帮助我哪里错了。14/09/0811:13:38INFOnamenode.AclConfigFlag:ACLsenabled?false14/09/0811:13:38INFOcommon.Storage:Lockon/usr/local/hadoop/dfs/tmp/dfs/name/in_use.lockacquiredbynodename1170@n314/09/0811:13:38WARNnamenode.FSNamesystem:Encounteredexceptionloadingfsimagejava.io.IOExcept

hadoop - Sqoop增量导入 "Cannot append files to target dir"

我在使用Sqoop将数据从MySQL导入Hive时遇到问题...这个查询:sqoopimport--connectjdbc:mysql://xx.xx.xx.xx/database\--usernamesqoop--passwordsqoop--tabledatatable\--target-dir/home/cloudera/user/hive/warehouse/database.db/datatable\--as-parquetfile-m1--append返回这个错误:15/01/1416:27:28WARNutil.AppendUtils:Cannotappendfilest

java - 如何更改 org.apache.commons.logging.Log.info ("massage") 将写入日志文件

我正在java平台上开发hadoop的开源。我添加了类(在yarntimelineserver中)除了打印信息,还做各种事情,我用两个库写信息importorg.apache.commons.logging.Log;importorg.apache.commons.logging.LogFactory;示例:privatestaticfinalLogLOG=LogFactory.getLog(IntermediateHistoryStore.class);LOG.info("massage");为了查看我的更改,我通过hadoop的cmd或通过任务管理器运行时间线服务:**C:\hdp

hadoop - Sqoop 中拆分 <column> --target-dir 的目的是什么

当我们在sqoop中编写--split-by时,内部发生了什么?例子:sqoopimport--connectjdbc:mysql://localhost/test--usernameroot--passwordtraining123--query'select*fromtransactionwhere$CONDITIONS'--split-byTxnid--target-dirinput/transaction 最佳答案 HadoopMAPReduce就是分而治之。为了将数据分割成多个独立的切片并行传输,Sqoop需要找到--sp

hadoop - sqoop2 没有从 hadoop 中找到 log4j2

我正在尝试在我的ubuntu服务器上安装sqoop2(1.99.7)。我正在尝试按照apache网站上提供的说明进行操作here.我有一个有效的hadoop安装,我已经下载sqoop文件并将其解压缩到/usr/local/sqoop位置。tar-xvfsqoop-1.99.7-bin-hadoop200.tar.gzmvsqoop-1.99.7-bin-hadoop200/usr/local/sqoop我相信我已经定义了所有环境变量,特别是HADOOP_HOME,我认为它是用来指示sqoop查找jar文件的位置。但是,当我尝试使用sqoop2-toolverify验证安装时,我得到以下

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时,我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案 报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下,您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反,它应该是:. 关于hadoop