草庐IT

Flume-ng

全部标签

hadoop - 使用flume将数据存储到linux本地目录

是否可以使用flume从oracle获取数据并将其存储在Linux本地文件夹中,而不是hdfs中? 最佳答案 使用“FileRollSink”,您可以将流式数据存储到本地系统。但是Flume不能用于从任何RDMS工具中摄取数据。 关于hadoop-使用flume将数据存储到linux本地目录,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/17718778/

hadoop - Flume--找不到主类 : org. apache.flume.tools.GetJavaProperty

我正在使用clouderaCDH4.4。当我运行flumecmd时-"bin/flume-ngagent-nagentA-fconf/MultipleFlumes.properties-Dflume.root.logger=INFO,console"我遇到了一个错误:[cloudera@localhostFlume]$bin/flume-ngagent-nagentA-fconf/MultipleFlumes.properties-Dflume.root.logger=INFO,consoleWarning:Noconfigurationdirectoryset!Use--confto

hadoop - 如何将事件拆分为多个事件以将它们发送到多路复用扇出流

我们计划使用kafkaflume-ng集成(Flafka),其中flume是kafka队列的消费者。Flume代理将接收文件列表命令及其输出,如下所示:root@host>[Command1][Output1]root@host>[Command2][Output2]该文件可能包含多个命令,并且一个命令的输出可能很大。我们需要拦截事件(也就是文件数据),根据命令将事件拆分成多个事件。然后源会将流扇出到多个channel,将每个子事件发送到一个channel(使用多路复用),每个接收器将命令信息存储到各自的Hive表。是否可以使用扇出流将一个事件拆分为多个事件?或者换句话说,我们可以在拦

anugularjs ng disableD无法按预期的按钮元素工作

我已经创建了一个新按钮,该按钮应在页面上的加载时启用,并且在保存页面上的数据时应被禁用(有一个保存按钮)。因此,基本上,每当启用保存按钮时,都应禁用此新按钮。角度代码:在控制器中,它附着在范围上:$scope.isSaveButtonDisabled=isSaveButtonDisabled;$scope.isCreateButtonDisabled=isCreateButtonDisabled;并且有两个函数定义了此属性的值:functionisSaveButtonDisabled(){$scope.isSaveButtonDisabled=true;}functionisCreateBut

hadoop - 在 HDFS 中创建文件但不附加任何内容

我正在使用HTTP源将JSON文件放入HDFS(单节点SANDBOX)。文件在正确的目录中创建,但没有任何内容附加到文件中。在我开始调试HTTP源之前,你能验证我的flume.conf吗?##################################################################Namethecomponentsonthisagent#################################################################hdfs-agent.sources=httpsourcehdfs-agent.sin

java - Apache Flume/var/log/flume-ng/flume.log(权限被拒绝)

我正在尝试从/home/cloudera/Documents/flume/读取日志文件并使用apacheflume将其写入hdfs。我使用以下命令在hdfs中创建flumeLogTest文件夹:sudo-uhdfshadoopfs-mkdirflumeLogTestsudo-uhdfshadoopfs-chownflume:flumeflumeLogTest我的配置文件是:agent.sources=srcagent.channels=chagent.sinks=snkagent.sources.src.type=execagent.sources.src.command=tail-f

hadoop - 使用 flume 读取 IBM MQ 数据

我想从IBMMQ读取数据并将其放入HDF。查看了flume的JMS源,似乎它可以连接到IBMMQ,但我不明白所需属性列表中的“destinationType”和“destinationName”是什么意思。有人可以解释一下吗?此外,我应该如何配置我的水槽代理flumeAgent1(跑在和MQ一样的机器上)读取MQ数据----flumeAgent2(跑在Hadoop集群上)写入Hdfs或者在Hadoop集群上只有一个代理就足够了谁能帮助我理解如何将MQ与flume集成引用https://flume.apache.org/FlumeUserGuide.html谢谢,查雅

hadoop - 使用水槽的kafka channel 中的动态主题

是否有可能有一个带有动态主题的kafkachannel-比如可以在其中指定主题header的kafka接收器,或者可以在其中使用header中的值的HDFS接收器?我知道我可以多路复用以使用多个channel(具有一堆channel配置),但这是不可取的,因为我希望有一个动态HDFS接收器,而不是每个kafkachannel都有一个HDFS接收器。 最佳答案 我的理解是FlumeKafkachannel只能映射到单个主题,因为它同时生成和使用该特定主题的日志。查看Flume1.6.0的KafkaChannel.java中的代码,我可

hadoop - Flume-NG:如何使用 Flume-ng 自动读取目录中新添加的文件(Flume 代理的来源)

spooldir选项用于流式传输特定目录的所有文件。完成整个目录读取后,作业将暂停/停止。但是,如果我想将新文件添加到同一目录中,会发生什么??我的要求是在任何新文件添加到该特定spooldir文件夹时流式传输该目录。请指教!!!提前致谢。 最佳答案 假脱机目录源将在文件出现在目录中时继续读取文件,它不会在处理flume启动时存在于目录中的文件集后暂停。这就是文档所说的“此源允许您通过将要摄取的文件放入磁盘上的“假脱机”目录来摄取数据。此来源将监视指定目录中的新文件,并在新文件出现时解析事件。”

hadoop - 使用 Flume 获取推文时出现问题

我可以使用flume获取推文,但是,流式传输所使用的语言不是我想要的。下面是flume.conf文件我收到的推文如下所示:任何人都可以建议我需要进行的更改吗? 最佳答案 ApacheFlume中的TwitterSource目前不支持语言过滤。这个先前的问题描述了一个过程(公认的复杂),您可以通过该过程部署您自己的具有语言支持的代码补丁版本:Flume-TwitterSourcelanguagefilter我认为ApacheFlume支持语言过滤将是一个有值(value)的增强。我鼓励您在FLUME中的ApacheJIRA中提交请求项