binary-log

linux - kafka logs + 如何限制日志大小

在我的ambari集群中(版本2.6)我们有master机器和workers机器而kafka安装在master机器上分区/data只有15Gkafka日志文件夹是-/data/var/kafka/kafka-logs/data/var/kafka/kafka-logs下的大部分文件夹大小都是4K-40K但是两个文件夹非常大-5G-7G，这导致/data为100%例子:在/data/var/kafka/kafka-logs/mmno.aso.prpl.proces-90下12K00000000000000000000.index1.0G00000000000000000000.log16

java - hadoop flume log4j 配置

如果您运行hadoopflume节点，默认情况下它会使用log4j在/var/log/flume下生成日志。这些文件看起来像/var/log/flume/flume-$FLUME_IDENT_STRING-$command-$HOSTNAME.log根据水槽用户指南here，更改flume日志配置的唯一方法是通过flume-daemon.sh，它使用Flume环境变量运行flume节点，例如:exportFLUME_LOGFILE=flume-$FLUME_IDENT_STRING-$command-$HOSTNAME.logexportFLUME_ROOT_LOGGER="INFO,

hadoop flume section log java hdfs

java - 借助log4j输出hadoop程序的变量

我用log4j写了hadoop程序(只有Map步骤，操作不符合我的等待)packageorg.myorg;importjava.io.*;importjava.util.*;importorg.apache.hadoop.fs.*;importorg.apache.hadoop.conf.*;importorg.apache.hadoop.io.*;importorg.apache.hadoop.mapred.*;importorg.apache.hadoop.util.*;importorg.apache.log4j.Logger;importorg.apache.log4j.Log

hadoop log4j apache 2013 java linux mapreduce

logging - 使用 Flume Avro 的日志数据未正确存储在 Hive 中

我使用Flume1.5.0从应用程序服务器收集日志。假设我有三个App服务器，App-A、App-B、App-C。运行配置单元的一个HDFS服务器。现在水槽代理在所有3个应用服务器上运行，并将日志消息从应用服务器传递到Hdfs服务器，其中另一个水槽代理正在运行，最后日志存储在hadoop文件系统中。现在我已经创建了一个外部Hive表来映射这些日志数据。但是除了hive无法正确解析日志数据并存储在表中之外，一切都运行顺利。这是我的Flume和Hive配置:虚拟日志文件格式(|分隔):ClientId|AppRequest|URL应用服务器上的Flumeconf:app-agent.sou

logging Flume agent hdfs hdfs-agent hadoop hive avro

hadoop - Cloudera CDH 上的 Impala "Could not create logging file: Permission denied"

我在CDH4.2.0-1.cdh4.2.0.p0.10集群上的ClouderaManager4.5中通过包裹安装了Impala。当我尝试启动服务时，它在所有节点上都失败并显示此消息perl-pi-e's#{{CMF_CONF_DIR}}#/run/cloudera-scm-agent/process/800-impala-IMPALAD#g'/run/cloudera-scm-agent/process/800-impala-IMPALAD/impala-conf/impalad_flags'['impalad=impalad']'exec/opt/cloudera/parcels/I

Permission amp cloudera impala section hadoop

logging - Hadoop 守护进程日志

这听起来像是一个非常简单的问题，但是有人知道如何访问hadoop上的守护程序日志吗？我的ResourceManager没有连接，所以我试图找出错误。我在网上做了一些调查，发现hadoop---.log但这对我不起作用。我怀疑我输入的主机名不正确；我的主机名是“Macintosh.local”，但这没有效果。或者我应该在运行此命令时位于特定目录中？感谢您的帮助。最佳答案运行hadoop守护进程时，应设置HADOOP_HOME环境变量。您应该检查$HADOOP_HOME/logs目录中的日志以确定问题。

logging Hadoop section strong daemon

java - 如何更改 org.apache.commons.logging.Log.info ("massage") 将写入日志文件

我正在java平台上开发hadoop的开源。我添加了类(在yarntimelineserver中)除了打印信息，还做各种事情，我用两个库写信息importorg.apache.commons.logging.Log;importorg.apache.commons.logging.LogFactory;示例:privatestaticfinalLogLOG=LogFactory.getLog(IntermediateHistoryStore.class);LOG.info("massage");为了查看我的更改，我通过hadoop的cmd或通过任务管理器运行时间线服务:**C:\hdp

amp commons hadoop INFO 2557 java hadoop-yarn

hadoop - sqoop2 没有从 hadoop 中找到 log4j2

我正在尝试在我的ubuntu服务器上安装sqoop2(1.99.7)。我正在尝试按照apache网站上提供的说明进行操作here.我有一个有效的hadoop安装，我已经下载sqoop文件并将其解压缩到/usr/local/sqoop位置。tar-xvfsqoop-1.99.7-bin-hadoop200.tar.gzmvsqoop-1.99.7-bin-hadoop200/usr/local/sqoop我相信我已经定义了所有环境变量，特别是HADOOP_HOME，我认为它是用来指示sqoop查找jar文件的位置。但是，当我尝试使用sqoop2-toolverify验证安装时，我得到以下

hadoop sqoop2 sqoop code

hadoop - 在配置单元 "Unable to retrieve URL for Hadoop Task logs. Does not contain a valid host:port authority: local"上出现错误

在涉及mapreduce的hive上执行任何查询时，我收到此错误。“UnabletoretrieveURLforHadoopTasklogs.Doesnotcontainavalidhost:portauthority:local” 最佳答案报告的异常出现在旧版本的Hadoop中(即YARN之前)。大多数情况下，您使用的是旧版本的Hadoop。当mapred.job.tracker的值出现异常参数在local中设置为“mapred-site.xml”相反，它应该是:. 关于hadoop

配置单 amp section code Hadoop hive

hadoop - spark2-shell 中的 Log4j

我正在通过spark2-shell-i选项运行其中一个spark脚本。我想使用log4j框架将生成的日志重定向到一个文件。我曾经运行的命令:spark2-shell--masteryarn--deploy-modeclient-iaudit.scala--confspark.driver.args="PRODsample.txt"--files/bigdata/datalakes/app/log/log4j.properties#log4j.properties--confspark.driver.extraJavaOptions='-Dlog4j.configuration=file

spark2-shell hadoop log log4j log4 apache-spark apache-spark-sql spark-streaming bigdata

201 202 203204205 206 207