草庐IT

Flume-ng

全部标签

azure - HDFS ls 在 Flume 写入文件时显示文件大小为 0

我们目前正在设置一个ApacheFlume系统,该系统收集事件数据并将其写入我们的HDInsightHDFS集群中的文件。在验证初始设置时,hdfsls在Flume写入文件时显示文件大小为0,但是当文件滚动(并且删除了.tmp文件扩展名)时,文件大小突然跳起来。在Flume写入文件时,HDFS或HDInsight(或WASB)是否有某种原因导致文件的文件大小为0。 最佳答案 这可能是由于HDFS一致性模型。在向HDFS执行写入时,一旦写入了超过一个block的数据,第一个block将对新读者。后续block也是如此:它始终是当前bl

hadoop - 如何在故障转移模式下配置 Flume 1.x (flume-ng)?

有大量关于在CDH3中以故障转移模式配置Flume(0,9x)节点的信息。但是CDH4中Flume(1.x)配置的配置格式完全不同。如何在故障转移模式下配置Flume1.x(flume-ng)? 最佳答案 在flume-ng中,您可以定义一组所谓的“接收器”(事件消费者),它们都连接到一个channel,并为该组指定“故障转移”策略,因此如果其中一个接收器发生故障,事件将被重定向到另一个。假设我们有两个接收器-ma​​in_sink和backup_sink,并且都配置为使用来自一个channel的事件并将事件传送到某个目的地。我们将

java - 如何从 java 代码启动 Flume 代理

我在centos6.5中使用hadoop1.2.1稳定版并使用apacheflume1.x我正在运行flume代理并在hdfs中收集推文我的flume.conf是TwitterAgent.sources=TwitterTwitterAgent.channels=MemChannelTwitterAgent.sinks=HDFSTwitterAgent.sources.Twitter.type=com.cloudera.flume.source.TwitterSourceTwitterAgent.sources.Twitter.channels=MemChannelTwitterAgen

hadoop - Apache flume 和 Apache storm 有什么区别?

Apacheflume和Apachestorm有什么区别?是否可以使用storm将日志数据提取到Hadoop集群中?两者都用于流式数据,那么可以使用storm来替代flume吗? 最佳答案 ApacheFlume是一项用于收集大量流数据(尤其是日志)的服务。Flume使用称为数据接收器的机制将数据推送给消费者。Flume可以立即将数据推送到许多流行的接收器,包括HDFS、HBase、Cassandra和一些关系数据库。ApacheStorm涉及流数据。它是批处理和流处理之间的桥梁,而Hadoop本身并不是为处理流处理而设计的。Sto

hadoop - Flume NG 和 HDFS

我是hadoop的新手,所以请原谅这些愚蠢的问题。我有以下知识Hadoop的最佳用例是大文件,因此有助于在运行mapreduce任务时提高效率。牢记以上几点,我对FlumeNG感到有些困惑。假设我正在拖尾一个日志文件并且每秒生成一次日志,当日志获得新行时,它将通过Flume传输到hdfs。a)这是否意味着flume在我拖尾的日志文件中记录的每一行上创建一个新文件,或者它是否附加到现有的hdfs文件?b)首先在hdfs中允许追加吗??c)如果b的答案为真?即内容不断附加,我应该如何以及何时运行我的mapreduce应用程序?以上问题听起来可能很愚蠢,但非常感谢能回答相同的问题。PS:我还

hadoop - Flume 和 Sqoop 有什么区别?

Flume和Sqoop都是做数据移动的,那么它们有什么区别呢?什么情况下应该使用Flume还是Sqoop? 最佳答案 来自http://flume.apache.org/Flumeisadistributed,reliable,andavailableserviceforefficientlycollecting,aggregating,andmovinglargeamountsoflogdata.Flume有助于从各种来源收集数据,例如日志、jms、目录等。可以配置多个flume代理来收集大量数据。它水平缩放。来自http://s

如何使用NG-Show在NG重复中显示特定的Divs?

我有一个基于动态列表的DIV标签的NG重复DIV,每个项目都有一个唯一的ID,类型和“标题”值,这既是字符串又有单击功能分配给他们每个人。当我想单击以下部门之一时,我想显示与单击div关联的单独的div,我想使用一个NG-show做到这一点,目前有一个条件,该项目/div的ID应该与我在与HTML关联的控制器中定义的范围变量相等/等效,以显示要显示的新DIV。我遇到的问题是,这些单独的divs都在显示,并假设所有ng-shows都是正确的,不应该这样,我不确定为什么会发生这种情况,因为这些项目的所有ID是独一无二的。我已经打印到了控制台,但分配变量,但不确定我是否错过了有关NG-Show条件的

2023_Spark_实验三十:测试Flume到Kafka

实验目的:测试Flume采集数据发送到Kafka实验方法:通过centos7集群测试,将flume采集的数据放到kafka中实验步骤:一、 kafka可视化工具介绍KafkaTool是一个用于管理和使用ApacheKafka集群的GUI应用程序。KafkaTool提供了一个较为直观的UI可让用户快速查看Kafka集群中的对象以及存储在topic中的消息,提供了一些专门面向开发人员和管理员的功能,主要特性包括:-快速查看所有Kafka集群信息,包括其brokers,topicsandconsumers-查看分区中的消息内容并支持添加新消息-查看消费者偏移量,支持查看ApacheStormKafk

2023_Spark_实验二十八:Flume部署及配置

实验目的:熟悉掌握Flume部署及配置实验方法:通过在集群中部署Flume,掌握Flume配置实验步骤:一、Flume简介Flume是一种分布式的、可靠的和可用的服务,用于有效地收集、聚合和移动大量日志数据。它有一个简单灵活的基于流数据流的体系结构。它具有健壮性和容错性,具有可调可靠性机制和多种故障转移和恢复机制。它使用了一个简单的可扩展数据模型,允许在线分析应用程序。其体系结构如下:二、Flume安装与配置下载Flumehttps://archive.apache.org/dist/flume/1.9.0/apache-flume-1.9.0-bin.tar.gz安装Flume将下载好的Fl

当NGIF为false时,Angular4 ng-content将建立

我有新的问题ng-content传输。假设我有一个组件my-component那在它的ngOnInit()功能对负载进行一些重型操作(目前,只有一个console.log()).我有一个包装器,可以通过transclusion显示内容(my-wrapper.component.html).如果我这样设置周围环境,日志语句不会显示:我认为,my-wrapper组件不会构建,因此内容被忽略。但是,如果我试图将逻辑移至my-wrapper这样的组件(my-wrapper.component.html):我总是看到console.log()输出。我想,my-component建造然后存放到*ngIf变