这可能是一个非常高级的问题,需要大量解释,但我需要大量解释。基本上,我正在开发一个需要大量日志记录和跟踪的PHP应用程序。跟踪点击、交互、性能等。阳光下的任何事情。Facebook的Scribe和雅虎的Chukwa都是很好的实现。我对log4php知之甚少。我想要的是对这种日志记录如何工作的高级概述,特别是与PHP应用程序结合使用。您可以在处理日志的地方停止;我已经知道我要使用Hadoop/Hive来处理和存储。我还想对应用程序本身发生的情况进行一些相当低级别的了解。例如,如何获取点击行为并将其发送到记录器?我也很感激任何可以帮助我入门的阅读Material。
我正在使用Hadoop,但为了记录我需要一些东西。但是我不知道在Scribe和Chukwa之间登录系统哪个更好。你们能告诉我吗?如果有任何易于与Hadoop混合的替代方案,请告诉我。 最佳答案 我有一个替代方案:ApacheFlume由Cloudera构建,主要用于将数据输入/输出HDFS。https://cwiki.apache.org/confluence/display/FLUME/Index每个系统都有利有弊,它们在大规模运行时都存在一定的可靠性问题,但我可以说Flume是用java构建的,因此可以使用主要的HDFS库。我们
Apache的开源项目hadoop,作为一个分布式存储和计算系统,已经被业界广泛应用。很多大型企业都有了各自基于hadoop的应用和相关扩展。当1000+以上个节点的hadoop集群变得常见时,集群自身的相关信息如何收集和分析呢?针对这个问题,Apache同样提出了相应的解决方案,那就是chukwa。述chukwa的官方网站是这样描述自己的:chukwa是一个开源的用于监控大型分布式系统的数据收集系统。这是构建在hadoop的hdfs和map/reduce框架之上的,继承了hadoop的可伸缩性和鲁棒性。Chukwa还包含了一个强大和灵活的工具集,可用于展示、监控和分析已收集的数据。在一些网站
Apache的开源项目hadoop,作为一个分布式存储和计算系统,已经被业界广泛应用。很多大型企业都有了各自基于hadoop的应用和相关扩展。当1000+以上个节点的hadoop集群变得常见时,集群自身的相关信息如何收集和分析呢?针对这个问题,Apache同样提出了相应的解决方案,那就是chukwa。述chukwa的官方网站是这样描述自己的:chukwa是一个开源的用于监控大型分布式系统的数据收集系统。这是构建在hadoop的hdfs和map/reduce框架之上的,继承了hadoop的可伸缩性和鲁棒性。Chukwa还包含了一个强大和灵活的工具集,可用于展示、监控和分析已收集的数据。在一些网站