草庐IT

hdfs-agent

全部标签

hadoop - 如何删除上个月的 hdfs 文件?

我想删除上个月的hdfs文件。删除到垃圾箱或永久删除都没关系。也许正则表达式可以提供帮助? 最佳答案 我找到了一个使用正则表达式帮助我解决这个问题的答案:hadoopfs-rm-R-skipTrash/folderA/folderB/[0-9][0-9]82016*这样我将删除2016年8月以来的所有文件夹及其内容。没有-R我将跳过递归删除。-skipTrash将永久删除文件。 关于hadoop-如何删除上个月的hdfs文件?,我们在StackOverflow上找到一个类似的问题:

mysql - 如何将存储过程导入HDFS

有没有办法将mysql存储过程导入HDFS?我已经看到关于相同的导出linksqoopexport--connectjdbc:mysql://db.example.com/foo--callbarproc\--export-dir/results/bar_data但是当我使用--call和我的import语句时它不起作用sqoop-import--connectjdbc:mysql://localhost:3306/storedProc--calltabl_Proc--usernameroot--passwordpass--target-dirhdfs://:8020/procedur

hadoop - HDFS 以外的文件系统是否支持 Hadoop 序列文件

除HDFS外,其他文件系统是否支持序列文件格式?我特别感兴趣的是序列文件格式是否可以用于合并和存储文件系统上的小文件,例如HFS+或NTFS。非常感谢任何帮助。 最佳答案 序列文件在任何方面都不限于HDFS。您可以将SequenceFiles与任何通用文件系统一起使用,包括NTFS和HFS+。与其他二进制文件相比,它们在这方面没有任何特殊之处。 关于hadoop-HDFS以外的文件系统是否支持Hadoop序列文件,我们在StackOverflow上找到一个类似的问题:

hadoop wordcount并将文件上传到hdfs

大家好,我是hadoop的新手,我以伪模式安装hadoop。配置文件在这里核心站点.xmlfs.default.namehdfs://localhost:9000hdfs-site.xmldfs.replication1dfs.name.dirfile:///home/hadoop_usr/hadoopinfra/hdfs/namenodedfs.data.dirfile:///home/hadoop_usr/hadoopinfra/hdfs/datanode并且成功启动datanode和namenodeNowiwanttoputmyfileintohdfsbyusingfollowi

hadoop - 如何通过保留修改时间将 HDFS 文件从一个集群复制到另一个集群

我必须将一些HDFS文件从我的生产集群移动到开发集群。在根据文件修改时间移动到开发集群后,我必须测试对HDFS文件的一些操作。需要具有不同日期的文件才能在开发中对其进行测试。我试着用DISTCP做,修改时间正在更新当前时间。我使用在这里找到的许多参数检查了Distcpdistcpversion2guide有没有其他方法可以在不改变修改时间的情况下获取文件?或者我可以在将文件放入hdfs后手动更改修改时间吗?提前致谢 最佳答案 在hadoopdistcp命令中使用-pt标志。这将p保留distcp文件的timestamp(修改时间)。

hadoop - 当实际的事件名称节点关闭时,HDFS HA 集群备用节点不会变为事件节点

我已经在HA模式下配置了HDFS。我有一个“事件”节点和一个“备用”节点。我已经开始了ZKFC。如果我停止事件节点的zkfc,备用节点将更改状态并设置为“事件”节点。问题是当我关闭启动了zkfc的事件服务器以及一台“事件”服务器和一台“备用”服务器时,备用服务器不会更改其状态,始终保持备用状态。我的核心站点.xmlfs.default.namehdfs://auto-ha我的hdfs-site.xmldfs.namenode.rpc-bind-host0.0.0.0TheactualaddresstheRPCserverwillbindto.Ifthisoptionaladdressi

hadoop - 无法联系配置单元表分区,删除与分区相关的 hdfs 文件后

我的Hadoop集群在11:00对每个数据进行批处理。作业创建hive表分区(ex.p_date=201702,p_domain=0)并像ETL一样将rdbms数据导入到hive表分区....(hive表不是外部表)但是作业失败了,我删除了一些hdfs文件(分区位置=>p_date=20170228,p_domain=0)重新处理。这是我的错误,我只是在直线上键入查询删除分区...当我以这种方式查询“select*fromtable_namewherep_date=20170228,p_domain=0”时遇到挂起,但是“select*fromtable_namewherep_date

linux - HDFS文件权限问题

我在HDFS中创建了一个具有访问权限(400)的目录/tmp/ran-test。我试图将文件复制到目录,但出现权限被拒绝的错误。但是,我的同事可以毫无错误地将文件复制到目录中。我现在想知道它是如何工作的。如果有人给出他们的解释,我将不胜感激。谢谢,嘻嘻 最佳答案 有问题的目录设置了HDFSACL权限。请注意hdfsdfs-ls输出的权限字符串中的+字符。dr--------+-jkris03hdfs02017-03-2015:36/tmp/ranger_test这个+确定目录有一个ACL(访问控制列表),这为用户提供了额外的写入权限

hadoop - HDFS 中 Hive 代理用户的最佳解决方案是什么?

我对HDFS和Hive中的代理用户设置感到非常困惑。我在hive-site.xml中启用了doAs选项hive.server2.enable.doAstrue和core-site.xml中的代理用户hadoop.proxyuser.hdfs.hosts*hadoop.proxyuser.hdfs.groups*但这会导致:2017-03-2916:24:59,022INFOorg.apache.hadoop.ipc.Server:Connectionfrom172.16.0.239:60920forprotocolorg.apache.hadoop.hdfs.protocol.Clie

java - 在 Java 中尝试从 HDFS 复制 FromLocalFile 时出现 “Wrong FS… expected: file:///”

我正在尝试将abc.json从port/example_File/2017复制到HDFS中的另一个位置/port/example_File/2018,通过下面的代码StringexampleFile="hdfs://port/example_File/2017/abc.json"StringtargetFile="hdfs://port/example_File/2018"hdfs.copyFromLocalFile(newPath(exampleFile),newPath(targetFile))我正在低于异常org.jboss.resteasy.spi.UnhandledExcep