草庐IT

hadoop - Hmaster 未使用 hadoop 2.7.1 启动 hbase 1.1.2

我安装了hadoop2.7.1并且运行成功。我尝试通过引用此链接安装hbase1.1.2:https://archanaschangale.wordpress.com/2013/08/31/installing-pseudo-distributed-hbase-on-ubuntu/配置:hbase-env.sh:exportJAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386exportHBASE_REGIONSERVERS=/usr/lib/hbase/hbase-1.1.2/conf/regionserversexportHBASE_MANAGES_

logging - Hadoop 作业中的日志记录如何工作?

登录Hadoop作业如何工作?使用SLF4J和Logback,我需要什么样的配置才能在一个地方看到所有日志输出?JobTracker会整理Hadoop作业的STDOUT吗? 最佳答案 每个数据节点上的日志目录包含一个子目录userlogs。这包含最近maptask尝试的子目录。那是针对maptask的每个实例。由于任务尝试在其名称中包含作业ID,因此您可以找出特定作业在何处创建的日志。任务尝试目录包含文件:标准错误标准输出系统日志这些包含各自的输出。您可以通过从列出的作业导航到其任务、单击任务并选择其输出来从JobTrackerWe

.net - CRUD 应用程序日志记录

我正在尝试彻底检查我的CRUD应用程序的日志架构。它是一个带有SQLServer2008R2后端的.NETWinforms应用程序。在当前设置中,只要用户按下“保存按钮”,就会调用数据库日志。变更集是使用.NET反射在代表我们存储在SQL中的表的类上确定的。日志存储在名为ActionLogHeader和ActionLogDetail的两个表中。header架构:ActionLogHeader_id|表名|主键|Action类型|用户|Action日期详细架构:ActionLogDetail_id|ActionLogHeader_id|专栏已更改|预值|后值一个Header可以有多个De

hadoop屏幕上的日志太多

我最近开始使用hive学习hadoop。作为初学者,我不太熟悉屏幕上显示的所有日志。所以最好查看所有重要日志的干净版本。我根据Rutberglen的“ProgrammingHive”一书学习了Hive。刚刚开始,我在第一个命令后收到了大量日志。而在书上,它只是“好的,所用时间:3.543秒”。有人有减少这些日志的解决方案吗?PS:下面是我从命令“createtablex(aint);”得到的日志WARNING:org.apache.hadoop.metrics.jvm.EventCounterisdeprecated.Pleaseuseorg.apache.hadoop.log.met

logging - Chukwa 和 Scribe 哪个更好?

我正在使用Hadoop,但为了记录我需要一些东西。但是我不知道在Scribe和Chukwa之间登录系统哪个更好。你们能告诉我吗?如果有任何易于与Hadoop混合的替代方案,请告诉我。 最佳答案 我有一个替代方案:ApacheFlume由Cloudera构建,主要用于将数据输入/输出HDFS。https://cwiki.apache.org/confluence/display/FLUME/Index每个系统都有利有弊,它们在大规模运行时都存在一定的可靠性问题,但我可以说Flume是用java构建的,因此可以使用主要的HDFS库。我们

regex - 使用正则表达式匹配日志文件行时的可选字段

我正在尝试使用RegexSerDe通过正则表达式解析网络日志.它通过将每个正则表达式组与表中的列匹配来工作,如果正则表达式组为空,它会为该列分配一个空值。我在匹配缺少字段的日志行时遇到问题。此日志中有两种行:2016-10-23T23:59:59Zcache-iad2134fastly[502801]:52.55.94.131"-""-"Sun,23Oct201623:59:59GMTGET/apps/events/2016/10/11/3062653/?REC_ID=3062653&id=02002016-10-23T23:59:59Zcache-dfw1835fastly[5028

java - hadoop 覆盖每个作业的 log4j.properties

是否可以覆盖每个作业的log4j属性?我有一个运行一些hadoop作业的多步骤程序(管道)但在它之前和之后还执行一些其他步骤。如果我使用java命令运行我的程序(java-jarmy_program.jar)然后它运行正常但我收到警告:无法为您的平台加载nativehadoop库...在适用的情况下使用内置java类如果我使用hadoop命令运行我的程序(hadoopjarmy_program.jar)然后加载默认的hadooplog4j.properties在我的程序中,我将有关步骤执行的信息记录到特定文件中。我不需要来自hadoopmap/reduce任务的日志。我需要来self的

logging - HBase 适合存储和查询日志数据吗?

我正在考虑使用HBase来存储日志(网络日志数据),每个日志将有大约20个不同的值(比方说列),我想运行基于这些列过滤结果的查询。我最初的想法是在每个列下多次保存每个日志(单元格),这是日志中每个字段的值。这将导致数据大小增加约20倍,但我认为这可以很好地提高性能。Row-key将是时间戳,前缀是源ID。每个源将生成大约40-100M日志行(可能有数万个源)。我还需要低延迟,可能低于10秒(因此目前无法选择像Hive这样的解决方案)您认为这是正确的模式设计吗?如果不是,您认为哪个是正确的,或者我应该使用其他东西(什么)?感谢您的所有回答。 最佳答案

java - 如何更改 Hadoop 2 中用户日志的日志级别?

我一直在尝试更改用户日志的日志级别,即出现在/var/log/hadoop-yarn/userlogs/application_/container_下的文件在CDH5.2.1上。但是,无论我尝试什么,都只有INFO级别日志将出现。我想启用TRACE用于调试的级别日志。到目前为止我尝试过的事情:在/etc/hadoop/conf/log4j.properties中将所有记录器设置为TRACE级别.设置mapreduce.map.log.level和mapreduce.reduce.log.level在mapred-site.xml.设置mapreduce.map.log.level和m

java - EMR - 在 Hadoop(和 YARN)中使用自定义日志记录附加程序

在我们的EMR集群中,我们使用自定义log4j-appenders和log4j.properties来允许我们将日志转发到Splunk并让我们做一些提供的库和配置不知道如何做的魔术。在EMR3.x中,我们使用引导操作来做到这一点:从s3下载我们的自定义log4jappenderjar,log4j.properties,我们自定义的container-log4j.properties。将我们自定义的log4jappenderjar放入yarnlib目录中/home/hadoop/share/hadoop/yarn/lib/.更新Hadoop类路径以使用我们的自定义log4j附加器将我们修