我想使用hadoopfsck命令跳过指定路径上的文件检查。我们能做到吗?我正在使用以下命令:hadoopfsck>/output.txt我也检查了hdfs指南,但是没有什么可以从上面的命令中排除路径。请帮忙。 最佳答案 从Hadoop2.9.0开始,无法在hadoopfsck命令中指定排除路径。但是您可以使用WebHDFSRESTAPI获取与fsck相同的文件系统健康信息。使用此API,我们可以使用LISTSTATUSapi获取目录内所有文件的信息,或使用GETFILESTATUSapi获取单个文件的信息。对于目录:curl-i"h
我认为这很简单,但非常感谢您的帮助。我的Windows桌面上有一个zip文件“RECEIPTS_LAB.zip”,我在vmware上运行一个hadoop沙箱。沙箱是我用mapr注册的培训类(class)的一部分,但我是初学者,不确定如何将zip文件从Windows移动到沙箱中的目录“/user/user01/3”手册使用如下代码scpRECEIPTS_LAB.zipuser01@node-ip:/user/user01/3node-ip是我在启动沙箱时得到的ip地址,假设它是192.168.88.128当我编写以下命令时:scpRECEIPTS_LAB.zipuser01@192.16
我正在尝试使用Hive变量。如果我登录Hive并使用:hive>seta=test_table;hive>describe${hiveconf:a};但是如果从Shell尝试相同的命令,它会给出:ParseError1:1cannotrecognizeinputnear...$>hive-e"seta=test_table;describe${hiveconf:a};"ParseError1:1cannotrecognizeinputnear 最佳答案 ParameterExpansionThe`$'characterintrodu
我已经安装了带有mfs(基于hadoopfs)的mapr和一些使用df、dfisk和nmon日志文件从文件系统获取信息的脚本。root@spbswgvml10:/opt/nmon#df-hFilesystemSizeUsedAvailUse%Mountedon/dev/sda18.8G4.4G4.0G53%/none4.0K04.0K0%/sys/fs/cgroupudev2.0G4.0K2.0G1%/devtmpfs396M464K395M1%/runnone5.0M05.0M0%/run/locknone2.0G02.0G0%/run/shmnone100M0100M0%/run/
我只想从hadoop中的目录中获取文件名并将其保存到hadoop或本地计算机中的不同位置。我的文件夹中有超过1000个文件,我想知道文件的名称。我尝试了以下命令,但无法将其保存到某个位置。中的文件名hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n''';回声$文件名;完成 最佳答案 hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n'''>somefile.txt 关
我正在寻找一个支持类似于sql查询的分布式数据库的解决方案。更准确地说,它应该有一个JDBC连接器和与sql语法相同或相似的语法。通过谷歌搜索,我发现了HIVEwithhadoop。您还知道哪些其他选择? 最佳答案 ClouderaImpala是一个支持类SQL查询并与HiveQL兼容的框架。虽然Hive已经存在一段时间并且面向批处理,但Impala是新的并且适合实时处理。不确定JDBC是否与Impala一起工作。 关于java-"sqllike"apache配置单元的替代品,我们在St
我正在使用shell脚本,它执行以下命令hadoopfs-cat/input-path/*|grep"text"|tail-1我想在此命令后退出,以便我的shell脚本将执行另一个命令。 最佳答案 您可以使用此sed而不是在找到text后立即退出:sed'/text/q' 关于bash-想在unix中执行tail命令后退出,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/27010
如何在hadoop的目录中找到最新创建的子目录?例如在hadoop中,如果我有一个名为mgm的目录,它有2个子目录1和2,如下所示:/user/mgm/1/user/mgm/2我想知道1或2中哪一个是先创建的。hadoopfs-ls-t/user/mgm/|head-1对我不起作用。它说“非法选项-t” 最佳答案 hdfsdfs-ls的-t选项是针对ApacheHadoop2.8.0的新功能,目前尚未发布。这在JIRA问题HADOOP-8934中进行了跟踪.我不确定为什么该选项在ls中可见已有文档。与此同时,另一种选择是使用hdfs
我正在从hadoop命令运行一个java类test.java:$hadooptest我正在使用一个stringBuilder,它的大小快要超出内存了:Exceptioninthread"main"java.lang.OutOfMemoryError:Javaheapspaceatjava.util.Arrays.copyOf(Arrays.java:2882)atjava.lang.AbstractStringBuilder.expandCapacity(AbstractStringBuilder.java:100)atjava.lang.AbstractStringBuilder.a
我在一个集群上工作,数据集以分布式方式保存在hdfs中。这是我所拥有的:[hmi@bdadev-5~]$hadoopfs-ls/bdatest/clm/data/Found1840items-rw-r--r--3bdasupergroup02015-08-1100:32/bdatest/clm/data/_SUCCESS-rw-r--r--3bdasupergroup344043902015-08-1100:32/bdatest/clm/data/part-00000-rw-r--r--3bdasupergroup344040622015-08-1100:32/bdatest/clm/