unix-like_草庐IT

unix - 我们可以在 linux 中使用 hadoop fsck 命令时跳过文件检查吗？

我想使用hadoopfsck命令跳过指定路径上的文件检查。我们能做到吗？我正在使用以下命令:hadoopfsck>/output.txt我也检查了hdfs指南，但是没有什么可以从上面的命令中排除路径。请帮忙。最佳答案从Hadoop2.9.0开始，无法在hadoopfsck命令中指定排除路径。但是您可以使用WebHDFSRESTAPI获取与fsck相同的文件系统健康信息。使用此API，我们可以使用LISTSTATUSapi获取目录内所有文件的信息，或使用GETFILESTATUSapi获取单个文件的信息。对于目录:curl-i"h

hadoop linux 34 section modificationTime unix hdfs

unix - 使用 SCP 将文件从 Windows 桌面移动到 vmware 上的 hadoop 沙箱

我认为这很简单，但非常感谢您的帮助。我的Windows桌面上有一个zip文件“RECEIPTS_LAB.zip”，我在vmware上运行一个hadoop沙箱。沙箱是我用mapr注册的培训类(class)的一部分，但我是初学者，不确定如何将zip文件从Windows移动到沙箱中的目录“/user/user01/3”手册使用如下代码scpRECEIPTS_LAB.zipuser01@node-ip:/user/user01/3node-ip是我在启动沙箱时得到的ip地址，假设它是192.168.88.128当我编写以下命令时:scpRECEIPTS_LAB.zipuser01@192.16

沙箱 Windows section user unix hadoop mapr

unix - Hive 变量替换在 hive -e 命令中不起作用

我正在尝试使用Hive变量。如果我登录Hive并使用:hive>seta=test_table;hive>describe${hiveconf:a};但是如果从Shell尝试相同的命令，它会给出:ParseError1:1cannotrecognizeinputnear...$>hive-e"seta=test_table;describe${hiveconf:a};"ParseError1:1cannotrecognizeinputnear 最佳答案 ParameterExpansionThe`$'characterintrodu

unix Hive parameter section code hadoop

linux - 如何通过 unix utils 或 nmon 使用 hadoop fs 获取磁盘信息？

我已经安装了带有mfs(基于hadoopfs)的mapr和一些使用df、dfisk和nmon日志文件从文件系统获取信息的脚本。root@spbswgvml10:/opt/nmon#df-hFilesystemSizeUsedAvailUse%Mountedon/dev/sda18.8G4.4G4.0G53%/none4.0K04.0K0%/sys/fs/cgroupudev2.0G4.0K2.0G1%/devtmpfs396M464K395M1%/runnone5.0M05.0M0%/run/locknone2.0G02.0G0%/run/shmnone100M0100M0%/run/

hadoop linux cgroup type bytes unix mapr

unix - 如何将hadoop命令的搜索结果写入文件

我只想从hadoop中的目录中获取文件名并将其保存到hadoop或本地计算机中的不同位置。我的文件夹中有超过1000个文件，我想知道文件的名称。我尝试了以下命令，但无法将其保存到某个位置。中的文件名hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n''';回声$文件名；完成最佳答案 hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n'''>somefile.txt 关

hadoop unix section code

java - "sql like"apache 配置单元的替代品

我正在寻找一个支持类似于sql查询的分布式数据库的解决方案。更准确地说，它应该有一个JDBC连接器和与sql语法相同或相似的语法。通过谷歌搜索，我发现了HIVEwithhadoop。您还知道哪些其他选择？最佳答案 ClouderaImpala是一个支持类SQL查询并与HiveQL兼容的框架。虽然Hive已经存在一段时间并且面向批处理，但Impala是新的并且适合实时处理。不确定JDBC是否与Impala一起工作。关于java-"sqllike"apache配置单元的替代品，我们在St

配置单替代品 section Impala stackoverflow java jdbc hadoop distributed hive

bash - 想在 unix 中执行 tail 命令后退出

我正在使用shell脚本，它执行以下命令hadoopfs-cat/input-path/*|grep"text"|tail-1我想在此命令后退出，以便我的shell脚本将执行另一个命令。最佳答案您可以使用此sed而不是在找到text后立即退出:sed'/text/q' 关于bash-想在unix中执行tail命令后退出，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/27010

bash unix section code stackoverflow shell hadoop

unix - hadoop命令从hadoop中的目录获取最新的子目录名称

如何在hadoop的目录中找到最新创建的子目录？例如在hadoop中，如果我有一个名为mgm的目录，它有2个子目录1和2，如下所示:/user/mgm/1/user/mgm/2我想知道1或2中哪一个是先创建的。hadoopfs-ls-t/user/mgm/|head-1对我不起作用。它说“非法选项-t” 最佳答案 hdfsdfs-ls的-t选项是针对ApacheHadoop2.8.0的新功能，目前尚未发布。这在JIRA问题HADOOP-8934中进行了跟踪.我不确定为什么该选项在ls中可见已有文档。与此同时，另一种选择是使用hdfs

子目 hadoop code user unix

java - 从 hadoop unix 运行时增加 jvm 堆空间

我正在从hadoop命令运行一个java类test.java:$hadooptest我正在使用一个stringBuilder，它的大小快要超出内存了:Exceptioninthread"main"java.lang.OutOfMemoryError:Javaheapspaceatjava.util.Arrays.copyOf(Arrays.java:2882)atjava.lang.AbstractStringBuilder.expandCapacity(AbstractStringBuilder.java:100)atjava.lang.AbstractStringBuilder.a

hadoop java JSONObject code unix exception

unix - 使用命令行查找 hdfs 分布式文件中的总行数

我在一个集群上工作，数据集以分布式方式保存在hdfs中。这是我所拥有的:[hmi@bdadev-5~]$hadoopfs-ls/bdatest/clm/data/Found1840items-rw-r--r--3bdasupergroup02015-08-1100:32/bdatest/clm/data/_SUCCESS-rw-r--r--3bdasupergroup344043902015-08-1100:32/bdatest/clm/data/part-00000-rw-r--r--3bdasupergroup344040622015-08-1100:32/bdatest/clm/

unix hdfs code section bdatest hadoop apache-spark