草庐IT

hadoop - Flume-ng hdfs 安全

我是hadoop和FlumeNG的新手,我需要一些帮助。我不明白hdfs安全性是如何实现的。以下是Flume用户指南中的配置行:#hdfs-Cluster1-sink的属性agent_foo.sinks.hdfs-Cluster1-sink.type=hdfsagent_foo.sinks.hdfs-Cluster1-sink.hdfs.path=hdfs://namenode/flume/webdata这是否意味着任何知道我的hdfs路径的人都可以向我的hdfs写入任何数据? 最佳答案 这个问题是很久以前的,但我会尝试为任何其他处

hadoop - 配置 Flume 时出现 MissingArgumentException

我安装了Flume并尝试运行这个命令flume-ngagent-n$agent_name-cconf-f/home/gautham/Downloads/apache-flume-1.5.0.1-bin/conf/flume-conf.properties.template我得到了这个异常ERRORnode.Application:Afatalerroroccurredwhilerunning.Exceptionfollows.org.apache.commons.cli.MissingArgumentException:Missingargumentforoption:natorg.a

hadoop - Flume - Twitter源语言过滤器

在以下情况下,我想请求您的帮助。我目前正在使用ClouderaCDH5.1.2,我尝试使用Flume收集Twitter数据,如下面的端口(Cloudera)中所述:http://blog.cloudera.com/blog/2012/10/analyzing-twitter-data-with-hadoop-part-2-gathering-data-with-flume/github.com/cloudera/cdh-twitter-example在更新pom.xml中的版本后,我下载了源代码并重建了flume-sources:1.5.0-cdh5.1.22.3.0-cdh5.1.2

apache - 是否可以将 Apache Flume 作为守护进程运行?

我想问-我怎样才能将ApacheFlume作为Linux守护进程服务运行?我知道CDH中的Cloudera和HDH中的Hortonworks正在使用他们的第三方发行版Hadoops来做这件事。但是我如何使用Apache的普通Hadoop和Flume来做到这一点? 最佳答案 使用nohup运行flume代理,例如:-nohupbin/flume-ngagent-nagent_name-cconf-fconf/flume-conf.properties.template& 关于apache-

hadoop - 如何使用 Flume 将事件从运行在 Windows 10 IoT 上的 Raspberry Pi 记录到 HDFS

我想将我的LED闪烁(开/关)和不同的室温记录到HDFS。我找到了这个http://flume.apache.org/FlumeDeveloperGuide.html.它说“Flume目前支持Avro、log4j、syslog和HttpPOST(带有JSON主体)作为从外部源传输数据的方式”。我的问题是,如果我想将RaspberryPi生成的数据记录到HDFS,我应该使用什么。请给我一些教程链接或指导我。或者请让我知道最好的方法吗?希望我问的问题很简单。 最佳答案 免责声明-我不熟悉Flume。只是阅读你关于Flume支持日志记录的

facebook - Flume 阅读 facebook 页面/提要/帖子

有谁知道如何使用flume以便它从Facebook页面读取数据?实际上我想要一个flumeagent来读取特定的Facebook页面并提取所有信息,例如帖子/提要,并将数据推送到Hadoop数据库中。 最佳答案 如FlumeStreamingDatafromFacebook中所述.sentiment_analysisproject包含以下内容的概述:1)SamplePHPcodefortheFacebookHTTPgetsandposts2)FlumeconfigurationforaFacebookHTTPSource3)Thef

hadoop - flume-kite-morphline : com. fasterxml.jackson.core.JsonParseException:意外的输入结束:OBJECT 的预期关闭标记

在使用flume(1.6&1.7)时遇到以下错误2016-12-0200:57:11,634(pool-3-thread-1)[WARN-org.apache.flume.serialization.LineDeserializer.readLine(LineDeserializer.java:143)]Linelengthexceedsmax(2048),truncatingline!2016-12-0200:57:11,777(pool-3-thread-1)[ERROR-org.apache.flume.source.SpoolDirectorySource$SpoolDirec

hadoop - 是否可以将 WebHDFS 与 Flume 一起使用?

我想让flume代理位于hadoop集群之外,并且想知道是否可以使用flume通过WebHDFS将消息发送到hadoop集群。如果没有,是否有使用WebHDFS的替代方案?使用多层水槽层仍然需要我在hadoop集群中运行水槽代理。 最佳答案 只要您指定“hdfs”作为它们的类型,flume代理就可以在它们自己的机器上运行,而无需在hadoop集群内。我有一个水槽代理将avro事件写入hdfs接收器,而不是在hadoop集群上或使用WebHDFS。这是它的设置:agent.sinks.sink1.channel=channel1age

hadoop - 为什么我的 Flume 代理没有启动?

我正在尝试设置一个基本的Kafka-Flume-HDFS管道。Kafka已启动并正在运行,但是当我通过启动水槽代理时bin/flume-ngagent-nflume1-cconf-fconf/flume-conf.properties-Dflume.root.logger=INFO,console似乎代理没有出现,因为我得到的唯一控制台日志是:Info:Sourcingenvironmentconfigurationscript/opt/hadoop/flume/conf/flume-env.shInfo:IncludingHivelibrariesfoundvia()forHivea

windows - 在 windows 10 上安装 flume agent

我想在我的windows10上安装flume代理,以便将日志记录到安装在虚拟机上的hortonworks沙箱中。我引用此链接进行了所有设置-https://gudisevablog.wordpress.com/2016/12/08/apache-flume-windows-10/但是当我运行这个时出现了一些问题命令——“flume-ngagent–conf%FLUME_CONF%–conf-file%FLUME_CONF%/flume-conf.properties.template–nameagent”ERROR-Sourcing环境配置脚本C:\flume\apache-flume