草庐IT

ftp-simple

全部标签

java - 使用Java从FTP下载文件到本地导致文件不可读-编码问题

我开发了一个代码,可以从FTP读取非常大的文件并使用Java将其写入本地机器。执行它的代码如下。这是CustomInputFormat的RecordReader中的next(Textkey,Textvalue)的一部分if(!processed){System.out.println("inprocessed");in=fs.open(file);processed=true;}while(bytesRead写入结束后,我看到传输完成,目标文件的大小与源文件的大小相同。但是我无法打开文件,编辑器给出了错误gedithasnotbeenabletodetectthecharacterco

RLive : Only simple `select` works?

我在CentOS(Linux2.6.32-431.5.1.el6.x86_64)上使用Hadoop2.2.0.2.0.6.0-101运行RHive(https://github.com/nexr/RHive)RHive可以进行基本的select查询:rhive.query("select*fromsimple")并且RHive无法执行带条件的查询。例如:rhive.query("select*fromsimpleorderbyrating")Error:java.sql.SQLException:Errorwhileprocessingstatement:FAILED:Executio

java - 使用 camel 从 FTP 动态重命名文件

我正在尝试使用camel将一些文件从FTP路由到HDFS。总的来说,我的路线似乎工作正常,但是只要有一个名称中有空格的文件,路线就会失败。尝试将文件复制到HDFS失败。这些文件是动态的,每天都在变化,所以我无法通过.setHeader进行特定的包含和更改文件名,也无法在FTP上重命名文件。在将文件路由到HDFS之前,是否可以使用camel动态重命名名称中有空格的文件? 最佳答案 存储在名为“CamelFileName”的消息header中的文件名,您可以这样使用:from("sftp:...").process(newProcess

java - SIMPLE 身份验证未启用。可用 :[TOKEN, KERBEROS] -Hbase Master 无法激活

我正在尝试设置一个具有3个节点的HBase集群。我已经尝试配置SecureHbase一周了,但我仍然遇到错误:ERROR[Thread-15]master.HMaster:Failedtobecomeactivemasterorg.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.AccessControlException):SIMPLEauthenticationisnotenabled.Available:[TOKEN,KERBEROS]我正在运行Hbase2.0.5和Hadoop3.1.2。Secureha

hadoop - FileInputFormat.setInputPath 中的 FTP 文件名

我有一个代码可以使用mapreduce代码从FTP服务器读取数据。我们用来连接ftp服务器的代码如下`StringinputPath=args[0];StringoutputPath=args[1];Configurationconf1=newConfiguration();String[]otherArgs=newGenericOptionsParser(conf1,args).getRemainingArgs();Patharg=newPath(inputPath);FTPFileSystemftpfs=newFTPFileSystem();Patharg1=newPath(out

java - 如何使用 MVN 构建 hortonworks/simple-yarn-app

我是Hadoop新手。最近我在研究Hadoop2.6.0(Yarn)。现在,我想研究一个简单的yarn应用程序。我找到了thissimpleyarnapp.但遗憾的是,当我运行mvnpackage时,它显示如下错误:[ERROR]Failedtoexecutegoalorg.apache.maven.plugins:maven-compiler-plugin:2.0.2:compile(default-compile)onprojectsimple-yarn-app:Compilationfailure:Compilationfailure:[ERROR]/home/user/simp

hadoop - 如何通过 FTP 下载 Hadoop 文件(在 HDFS 上)?

我想实现一个SSIS作业,该作业能够下载位于远程Hadoop集群上的大型CSV文件。当然,在Hadoop系统上只有一个常规的FTP服务器不会暴露HDFS文件,因为它使用本地文件系统。我想知道是否有一个位于HDFS之上的FTP服务器实现。我更喜欢这种方法,而不是必须将文件从HDFS复制到本地FS,然后让FTP服务器为其提供服务,因为我将需要分配更多存储空间。 最佳答案 我从一个按预期工作的开源项目派生:https://github.com/jamesattard/maroodi 关于had

hadoop - 如何从 FTP 服务器增量复制文件到 Hadoop HDFS

我们有一个FTP服务器,每天都有很多文件上传到FTP服务器,我需要把这些文件都拷贝到HDFS中。每次它应该只下载增量文件,即如果第一次下载了10个文件,然后FTP上传了5个新文件;在下一次工作迭代中,它应该只在HDFS中下载新的5个文件。我们没有使用Nifi或Kafka连接。我们有什么好的解决方案来完成这个任务。 最佳答案 您可以使用LFTP作业中的touch文件实现此目的,下面是我的解释和代码。查看每一步的评论。#!bin/bash#SomeConfigsTOUCHFILE='/somepath/inYourLocal/someF

hadoop - master.HMaster : Failed to become active master SIMPLE authentication is not enabled. 可用:[TOKEN]

我正在尝试在我的本地MAC机器上设置hbase。我通过brew安装了hadoop和hbase。hadoop和hbase的版本分别是2.7.1和1.1.2。我正在尝试以伪分布式模式运行并希望禁用身份验证,因此在以下文件中进行了以下更改。我正在使用hbase动物园管理员。以下是启用SIMPLE身份验证的更改/etc/hadoop/core-site.xmlhadoop.security.authenticationsimplehadoop.security.authorizationfalse还对libexec/conf/hbase-site.xml进行了以下更改hbase.rootdir

security - 如何从命令行向 Hadoop 进行身份验证?删除 `ls: SIMPLE authentication is not enabled` 错误

我正在Hadoop集群上设置Kerberos身份验证。在集群外的一台机器上,每当我执行hadoopfs-ls时,我都会收到以下消息:ls:SIMPLEauthenticationisnotenabled。可用:[TOKEN,KERBEROS],这很好,因为这就是我想要的。但现在我的问题是,我如何真正成功地执行该命令?我知道如果我不进行身份验证我将无法继续,但我如何从命令行进行身份验证? 最佳答案 尝试以下步骤服务器kadmin.localaddprincuser@realm.com客户端kinituser@realm.comklis