草庐IT

flume_test

全部标签

hadoop - 如何在故障转移模式下配置 Flume 1.x (flume-ng)?

有大量关于在CDH3中以故障转移模式配置Flume(0,9x)节点的信息。但是CDH4中Flume(1.x)配置的配置格式完全不同。如何在故障转移模式下配置Flume1.x(flume-ng)? 最佳答案 在flume-ng中,您可以定义一组所谓的“接收器”(事件消费者),它们都连接到一个channel,并为该组指定“故障转移”策略,因此如果其中一个接收器发生故障,事件将被重定向到另一个。假设我们有两个接收器-ma​​in_sink和backup_sink,并且都配置为使用来自一个channel的事件并将事件传送到某个目的地。我们将

java - 如何从 java 代码启动 Flume 代理

我在centos6.5中使用hadoop1.2.1稳定版并使用apacheflume1.x我正在运行flume代理并在hdfs中收集推文我的flume.conf是TwitterAgent.sources=TwitterTwitterAgent.channels=MemChannelTwitterAgent.sinks=HDFSTwitterAgent.sources.Twitter.type=com.cloudera.flume.source.TwitterSourceTwitterAgent.sources.Twitter.channels=MemChannelTwitterAgen

hadoop - Apache flume 和 Apache storm 有什么区别?

Apacheflume和Apachestorm有什么区别?是否可以使用storm将日志数据提取到Hadoop集群中?两者都用于流式数据,那么可以使用storm来替代flume吗? 最佳答案 ApacheFlume是一项用于收集大量流数据(尤其是日志)的服务。Flume使用称为数据接收器的机制将数据推送给消费者。Flume可以立即将数据推送到许多流行的接收器,包括HDFS、HBase、Cassandra和一些关系数据库。ApacheStorm涉及流数据。它是批处理和流处理之间的桥梁,而Hadoop本身并不是为处理流处理而设计的。Sto

hadoop - Flume NG 和 HDFS

我是hadoop的新手,所以请原谅这些愚蠢的问题。我有以下知识Hadoop的最佳用例是大文件,因此有助于在运行mapreduce任务时提高效率。牢记以上几点,我对FlumeNG感到有些困惑。假设我正在拖尾一个日志文件并且每秒生成一次日志,当日志获得新行时,它将通过Flume传输到hdfs。a)这是否意味着flume在我拖尾的日志文件中记录的每一行上创建一个新文件,或者它是否附加到现有的hdfs文件?b)首先在hdfs中允许追加吗??c)如果b的答案为真?即内容不断附加,我应该如何以及何时运行我的mapreduce应用程序?以上问题听起来可能很愚蠢,但非常感谢能回答相同的问题。PS:我还

java - 如何使用MRUnit Test做Mapper测试?

我是Hadoop新手。我想使用MRUnitTest单独测试我的映射器部分。我已经尝试了很多。但我不知道如何解决以下错误-“MapDriver类型中的方法setMapper(Mapper)不适用于参数(Recommand.IdIndexMapper)”。我正在使用Hadoop-1.2.1、EclipseJuno、mrunit-1.0.0-hadoop1.jar、junit-4.11、mockito-all-1.9.5.jar。下面是我的代码,我的映射器类:类名:推荐,publicstaticclassIdIndexMapperextendsMapReduceBaseimplementsM

前端开发中的单元测试(unit testing)和端到端测试(end-to-end testing)

聚沙成塔·每天进步一点点⭐专栏简介前端入门之旅:探索Web开发的奇妙世界欢迎来到前端入门之旅!感兴趣的可以订阅本专栏哦!这个专栏是为那些对Web开发感兴趣、刚刚踏入前端领域的朋友们量身打造的。无论你是完全的新手还是有一些基础的开发者,这里都将为你提供一个系统而又亲切的学习平台。在这个专栏中,我们将以问答形式每天更新,为大家呈现精选的前端知识点和常见问题解答。通过问答形式,我们希望能够更直接地回应读者们对于前端技术方面的疑问,并且帮助大家逐步建立起一个扎实的基础。无论是HTML、CSS、JavaScript还是各种常用框架和工具,我们将深入浅出地解释概念,并提供实际案例和练习来巩固所学内容。同时

unit-testing - Hadoop:如何对文件系统进行单元测试

我想运行单元测试,但我需要一个org.apache.hadoop.fs.FileSystem实例。是否有用于创建文件系统的任何模拟或任何其他解决方案? 最佳答案 如果您使用的是hadoop2.0.0及更高版本-考虑使用hadoop-miniclusterorg.apache.hadoophadoop-minicluster2.5.0test有了它,你可以在你的本地机器上创建一个临时的hdfs,并在上面运行你的测试。setUp方法可能如下所示:baseDir=Files.createTempDirectory("test_hdfs")

unit-testing - mrunit的继承者是什么?

今天我发现ASF停用了mrunit(参见https://blogs.apache.org/foundation/entry/the_apache_news_round_up85和https://issues.apache.org/jira/browse/HADOOP-3733以及homepageitself)。除了“不活动”之外没有给出任何理由,所以我想必须有其他选择吗?将来应该使用什么来代替mrunit来对mapreduce作业进行单元测试? 最佳答案 我相信这次退休的原因是意识到Mockito已经可以处理您对映射器/缩减器进行单

hadoop - Flume 和 Sqoop 有什么区别?

Flume和Sqoop都是做数据移动的,那么它们有什么区别呢?什么情况下应该使用Flume还是Sqoop? 最佳答案 来自http://flume.apache.org/Flumeisadistributed,reliable,andavailableserviceforefficientlycollecting,aggregating,andmovinglargeamountsoflogdata.Flume有助于从各种来源收集数据,例如日志、jms、目录等。可以配置多个flume代理来收集大量数据。它水平缩放。来自http://s

2023_Spark_实验三十:测试Flume到Kafka

实验目的:测试Flume采集数据发送到Kafka实验方法:通过centos7集群测试,将flume采集的数据放到kafka中实验步骤:一、 kafka可视化工具介绍KafkaTool是一个用于管理和使用ApacheKafka集群的GUI应用程序。KafkaTool提供了一个较为直观的UI可让用户快速查看Kafka集群中的对象以及存储在topic中的消息,提供了一些专门面向开发人员和管理员的功能,主要特性包括:-快速查看所有Kafka集群信息,包括其brokers,topicsandconsumers-查看分区中的消息内容并支持添加新消息-查看消费者偏移量,支持查看ApacheStormKafk