草庐IT

flume_test

全部标签

java - 启动flume agent显示jdk路径错误,是目录,无法执行

我在安装flume时遇到错误。由于jdk路径显示为目录且无法执行,我无法启动flumeagent。请帮我解决这个问题,以便在我的hdfs中获取JSON数据hadoop1@ubuntu:~/Downloads/apache-flume-1.6.0-bin$bin/flume-ngagent-conf./conf/-fconf/flume.conf-Dflume.root.logger=DEBUG,console-nTwitterAgentWarning:Noconfigurationdirectoryset!Use--conftooverride.Info:IncludingHadoop

java - 如何管理flume agent之间的并发。

我正在从事大数据项目。我们正在使用flume将文件从sftp下载到HDFS。然后,我们配置了3个代理。他们从同一个来源阅读。结果,我们将3个重复文件放入HDFS,这并不好。然而,我们必须只有一个文件。但是,我们需要对处理过的文件保持可追溯性,并管理代理之间的并发性。例如,我们有3个主要代理A1、A2和A3。如果代理A2正在处理或正在处理文件xxx.csv。其他人不会处理它,并会寻找未处理的文件。因此,每个文件只能由一个代理处理。有没有人处理过类似的问题? 最佳答案 使用loadbalancingsinkprocessor可以有1个源

hadoop - 编写 Flume 配置,将不断增长的文件上传到 HDFS

我是Flume的新手,在配置方面遇到了一些问题。我在OracleVirtualBox上使用HortonworksSandboxHDP2.6.5(如果这很重要)。我的VM中有一个文本文件input_data.txt:input_data.txt的内容如下所示:我使用以下命令来创建并逐渐增加输入:catinput_data.txt|whilereadline;doecho"$line";sleep0.2;done>output.txt我想要实现的目标:1)编写一个Flume配置,将不断增长的output.txt文件上传到HDFS2)如果可能-HDFS中的目标文件必须在每次源文件(/usr/

Vue3+element-plus+vite 组件的二次封装-- 添加vue项目单元测试(vitest+happy-dom+testing-library)

本人是一个web前端开发工程师,主要是vue框架,整理了一些Vue常用的技术,一方面是分享,一方面是做总结,今后也会一直更新,有好建议的同学欢迎评论区分享;-)序号文章0组件库展示1通过JSON配置–头部搜索条件的封装组件2通过JSON配置–表单Table的封装组件3页脚的封装组件4通过JSON配置–Form表单的封装组件5生成npm组件库6发布到npm7vitest为组件库添加单元测试8vuepress为组件库生成文档9通过github或者giteepages将组件库文档发布到线上,免费!10源码地址文章目录组件库开发流程0.简介1.安装依赖2.配置Vitest2.1添加三斜线指令2.2在d

hadoop - 使用flume将数据存储到linux本地目录

是否可以使用flume从oracle获取数据并将其存储在Linux本地文件夹中,而不是hdfs中? 最佳答案 使用“FileRollSink”,您可以将流式数据存储到本地系统。但是Flume不能用于从任何RDMS工具中摄取数据。 关于hadoop-使用flume将数据存储到linux本地目录,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/17718778/

hadoop - Flume--找不到主类 : org. apache.flume.tools.GetJavaProperty

我正在使用clouderaCDH4.4。当我运行flumecmd时-"bin/flume-ngagent-nagentA-fconf/MultipleFlumes.properties-Dflume.root.logger=INFO,console"我遇到了一个错误:[cloudera@localhostFlume]$bin/flume-ngagent-nagentA-fconf/MultipleFlumes.properties-Dflume.root.logger=INFO,consoleWarning:Noconfigurationdirectoryset!Use--confto

unit-testing - 如何让 HBaseTestingUtility 在 map reduce 作业中查找类?

我们正在使用cdh3u4、Hadoop和HBase。在启动HBaseTestingUtility提供的miniMapReduceCluster之后,我正在尝试运行一个单元测试以启动MapReduce作业。作业失败并在map和reducer任务stderr日志中显示:Exceptioninthread"main"java.lang.NoClassDefFoundError:org/apache/hadoop/mapred/ChildCausedby:java.lang.ClassNotFoundException:org.apache.hadoop.mapred.Childatjava.

linux - 克服 HDFS-2556 : unit tests directory and permissions

我正在尝试在hadoop上进行JUnit测试,我使用MiniDFSCluster、MiniMRCluster和JUnit编写了一个在本地mini-hadoop环境中运行的测试用例。但是我收到了这个错误:WARNING:Metricssystemnotstarted:Cannotlocateconfiguration:triedhadoop-metrics2-datanode.properties,hadoop-metrics2.propertiesDec18,20124:42:29PMorg.apache.hadoop.hdfs.server.datanode.DataNodemake

java - Apache Flume/var/log/flume-ng/flume.log(权限被拒绝)

我正在尝试从/home/cloudera/Documents/flume/读取日志文件并使用apacheflume将其写入hdfs。我使用以下命令在hdfs中创建flumeLogTest文件夹:sudo-uhdfshadoopfs-mkdirflumeLogTestsudo-uhdfshadoopfs-chownflume:flumeflumeLogTest我的配置文件是:agent.sources=srcagent.channels=chagent.sinks=snkagent.sources.src.type=execagent.sources.src.command=tail-f

hadoop - 使用 flume 读取 IBM MQ 数据

我想从IBMMQ读取数据并将其放入HDF。查看了flume的JMS源,似乎它可以连接到IBMMQ,但我不明白所需属性列表中的“destinationType”和“destinationName”是什么意思。有人可以解释一下吗?此外,我应该如何配置我的水槽代理flumeAgent1(跑在和MQ一样的机器上)读取MQ数据----flumeAgent2(跑在Hadoop集群上)写入Hdfs或者在Hadoop集群上只有一个代理就足够了谁能帮助我理解如何将MQ与flume集成引用https://flume.apache.org/FlumeUserGuide.html谢谢,查雅