草庐IT

java - 使用 camel 从 FTP 动态重命名文件

我正在尝试使用camel将一些文件从FTP路由到HDFS。总的来说,我的路线似乎工作正常,但是只要有一个名称中有空格的文件,路线就会失败。尝试将文件复制到HDFS失败。这些文件是动态的,每天都在变化,所以我无法通过.setHeader进行特定的包含和更改文件名,也无法在FTP上重命名文件。在将文件路由到HDFS之前,是否可以使用camel动态重命名名称中有空格的文件? 最佳答案 存储在名为“CamelFileName”的消息header中的文件名,您可以这样使用:from("sftp:...").process(newProcess

Hadoop:hadoop fs -put error MSG:[ 有 2 个数据节点正在运行,2 个节点被排除在该操作中。]

enterimagedescriptionhere我已经安装了hadoop2.6.5,当我尝试将文件从本地放到hdfs时,出现了这个异常,我不知道如何解决这个问题!!需要帮助... 最佳答案 这将是一个网络问题。客户端进程(您运行hdfsdfs-put命令的位置)无法连接到DataNode主机。我可以从堆栈跟踪中看出,此时,您已经通过了与NameNode交互的点,因此从客户端到NameNode的连接很好。我建议将此作为客户端和所有DataNode主机之间的基本网络连接故障排除问题来处理。使用ping或nc或telnet等工具来测试连

hadoop - FileInputFormat.setInputPath 中的 FTP 文件名

我有一个代码可以使用mapreduce代码从FTP服务器读取数据。我们用来连接ftp服务器的代码如下`StringinputPath=args[0];StringoutputPath=args[1];Configurationconf1=newConfiguration();String[]otherArgs=newGenericOptionsParser(conf1,args).getRemainingArgs();Patharg=newPath(inputPath);FTPFileSystemftpfs=newFTPFileSystem();Patharg1=newPath(out

java - 无法从 Java 执行 hadoop fs -put 命令

我正在尝试执行hadoopfs-put来自Java代码。当我直接从终端执行这个命令时,它工作正常但是当我尝试使用从Java代码中执行这个命令时String[]str={"/usr/bin/hadoop","fs-put",source,dest};Runtime.getRuntime().exec(str);我收到错误Error:Couldnotfindorloadmainclassfs.我尝试执行一些非hadoop命令,例如来自Java的ls、mkdir命令,它们运行良好,但hadoop命令没有被执行,即使它们在终端上运行良好。这可能是什么原因,我该如何解决?JAVAAPITRY:我

hadoop - 如何通过 FTP 下载 Hadoop 文件(在 HDFS 上)?

我想实现一个SSIS作业,该作业能够下载位于远程Hadoop集群上的大型CSV文件。当然,在Hadoop系统上只有一个常规的FTP服务器不会暴露HDFS文件,因为它使用本地文件系统。我想知道是否有一个位于HDFS之上的FTP服务器实现。我更喜欢这种方法,而不是必须将文件从HDFS复制到本地FS,然后让FTP服务器为其提供服务,因为我将需要分配更多存储空间。 最佳答案 我从一个按预期工作的开源项目派生:https://github.com/jamesattard/maroodi 关于had

hadoop - 如何从 FTP 服务器增量复制文件到 Hadoop HDFS

我们有一个FTP服务器,每天都有很多文件上传到FTP服务器,我需要把这些文件都拷贝到HDFS中。每次它应该只下载增量文件,即如果第一次下载了10个文件,然后FTP上传了5个新文件;在下一次工作迭代中,它应该只在HDFS中下载新的5个文件。我们没有使用Nifi或Kafka连接。我们有什么好的解决方案来完成这个任务。 最佳答案 您可以使用LFTP作业中的touch文件实现此目的,下面是我的解释和代码。查看每一步的评论。#!bin/bash#SomeConfigsTOUCHFILE='/somepath/inYourLocal/someF

hadoop fs –put 未知命令

使用以下命令创建了一个文件夹[LOAN_DATA]hadoopfs-mkdirhdfs://masterNode:8020/tmp/hadoop-hadoop/dfs/LOAN_DATA现在使用WebUI,当我列出目录/tmp/hadoop-hadoop/dfs的内容时,它显示LOAN_DATA。但是当我想使用put或copyFromLocal将一些数据从TXT文件存储到LOAN_DATA目录时,我得到了put:未知命令使用的命令:hadoopfs–put'/home/hadoop/my_work/Acquisition_2012Q1.txt'hdfs://masterNode:802

hadoop - Datanode 重新启动 Hadoop fs -put 以获取大量数据(30 GB)

我有一个包含3个节点的hadoop集群。1个主人和2个奴隶。他们每个人都有24GB的内存。当我执行hadoopfs-put将数据从本地文件系统传输到hdfsdome数据被传输然后我得到一个异常12/11/0619:01:39WARNhdfs.DFSClient:DFSOutputStreamResponseProcessorexceptionforblockblk_-2646313249080465541_1002java.net.SocketTimeoutException:603000millistimeoutwhilewaitingforchanneltobereadyforre

hadoop - 如何从ftp服务器导入csv文件到hadoop(HDFS/HIVE/HBASE)?

我的源文件以csv格式位于ftp服务器中。我想将这些文件导入HDFS进行进一步处理。我不知道如何获取这些csv文件。谁能帮我解决这个问题? 最佳答案 您可以将此过程分为两步并将文件上传到hdfs。第一步:从ftp服务器下载文件并存储在本地。这应该有所帮助:TransferfilesfromFTPservertolocalunixserver第2步:在本地拥有文件后,您可以使用hadoopfs-put将文件传输到hdfs。例子。如果你的文件名是temp.csv你可以这样做:hadoopfs-puttemp.csv$hadoop_pat

hadoop - HBase 批量写入 : which one better on performance, 还是 put(List<Put>)?

开始学习HBase写数据流。我使用HTableInterface并且在性能上有问题。仅插入500行就花费了很多时间,我插入的每个批处理List将近500,000毫秒。关于使用HTableInterface批量写入HTable的任何示例或建议?我正在使用HBase0.94谢谢 最佳答案 它们本质上是一样的:batch(Listactions,Object[]results)不仅允许放置,还允许获取、删除、递增...put(Listputs)只需做一批put(它还会在客户端验证它们)。您还可以通过禁用table.setAutoFlush