草庐IT

unix-timestamp

全部标签

unix - 我们可以在 linux 中使用 hadoop fsck 命令时跳过文件检查吗?

我想使用hadoopfsck命令跳过指定路径上的文件检查。我们能做到吗?我正在使用以下命令:hadoopfsck>/output.txt我也检查了hdfs指南,但是没有什么可以从上面的命令中排除路径。请帮忙。 最佳答案 从Hadoop2.9.0开始,无法在hadoopfsck命令中指定排除路径。但是您可以使用WebHDFSRESTAPI获取与fsck相同的文件系统健康信息。使用此API,我们可以使用LISTSTATUSapi获取目录内所有文件的信息,或使用GETFILESTATUSapi获取单个文件的信息。对于目录:curl-i"h

unix - 使用 SCP 将文件从 Windows 桌面移动到 vmware 上的 hadoop 沙箱

我认为这很简单,但非常感谢您的帮助。我的Windows桌面上有一个zip文件“RECEIPTS_LAB.zip”,我在vmware上运行一个hadoop沙箱。沙箱是我用mapr注册的培训类(class)的一部分,但我是初学者,不确定如何将zip文件从Windows移动到沙箱中的目录“/user/user01/3”手册使用如下代码scpRECEIPTS_LAB.zipuser01@node-ip:/user/user01/3node-ip是我在启动沙箱时得到的ip地址,假设它是192.168.88.128当我编写以下命令时:scpRECEIPTS_LAB.zipuser01@192.16

unix - Hive 变量替换在 hive -e 命令中不起作用

我正在尝试使用Hive变量。如果我登录Hive并使用:hive>seta=test_table;hive>describe${hiveconf:a};但是如果从Shell尝试相同的命令,它会给出:ParseError1:1cannotrecognizeinputnear...$>hive-e"seta=test_table;describe${hiveconf:a};"ParseError1:1cannotrecognizeinputnear 最佳答案 ParameterExpansionThe`$'characterintrodu

linux - 如何通过 unix utils 或 nmon 使用 hadoop fs 获取磁盘信息?

我已经安装了带有mfs(基于hadoopfs)的mapr和一些使用df、dfisk和nmon日志文件从文件系统获取信息的脚本。root@spbswgvml10:/opt/nmon#df-hFilesystemSizeUsedAvailUse%Mountedon/dev/sda18.8G4.4G4.0G53%/none4.0K04.0K0%/sys/fs/cgroupudev2.0G4.0K2.0G1%/devtmpfs396M464K395M1%/runnone5.0M05.0M0%/run/locknone2.0G02.0G0%/run/shmnone100M0100M0%/run/

hadoop - Hive - 以分钟为单位的时差为负

我需要以分钟为单位获取时差,以便在Hive查询中进行分析。我正在使用unix_timestamp()将日期转换为秒,然后减去以秒为单位的差异,然后乘以60以分钟为单位。我的问题是我最近的约会-较早的日期差异变为负值。这是我的查询和结果Hivequeryandresultscreenshotprocessed_tscreate_tsprocessed_unix_timestampcreate_unix_timestampminiueDiff2017-03-123:01:062017-03-122:58:3614893128651489316315-57.52017-03-123:01:3

unix - 如何将hadoop命令的搜索结果写入文件

我只想从hadoop中的目录中获取文件名并将其保存到hadoop或本地计算机中的不同位置。我的文件夹中有超过1000个文件,我想知道文件的名称。我尝试了以下命令,但无法将其保存到某个位置。中的文件名hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n''';回声$文件名;完成 最佳答案 hadoopfs-ls/base/base1|awk'{print$NF}'|grep.json$|tr'\n'''>somefile.txt 关

php - HBase - 如何根据key-timestamp-id查询?

全部-HBase的新手,我终于能够实际获取我曾经存储在MySQL中的数据(大约5000万行)并将其插入到我的HBase表中。我现在正尝试根据键查询此数据,但遇到了一些问题。基本上我有一个构造如下的key:objectname-createdtime-customerid现在我需要根据对象名称和创建时间的范围进行查询,有人知道我该怎么做吗?(我正在使用PHP/Thrift,但我不需要它作为对此的具体答案)我可以查询是否知道确切的行/键,我现在只需要知道如何为中间属性指定一个范围。提前致谢! 最佳答案 使用开始行是键为objectnam

bash - 想在 unix 中执行 tail 命令后退出

我正在使用shell脚本,它执行以下命令hadoopfs-cat/input-path/*|grep"text"|tail-1我想在此命令后退出,以便我的shell脚本将执行另一个命令。 最佳答案 您可以使用此sed而不是在找到text后立即退出:sed'/text/q' 关于bash-想在unix中执行tail命令后退出,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/27010

unix - hadoop命令从hadoop中的目录获取最新的子目录名称

如何在hadoop的目录中找到最新创建的子目录?例如在hadoop中,如果我有一个名为mgm的目录,它有2个子目录1和2,如下所示:/user/mgm/1/user/mgm/2我想知道1或2中哪一个是先创建的。hadoopfs-ls-t/user/mgm/|head-1对我不起作用。它说“非法选项-t” 最佳答案 hdfsdfs-ls的-t选项是针对ApacheHadoop2.8.0的新功能,目前尚未发布。这在JIRA问题HADOOP-8934中进行了跟踪.我不确定为什么该选项在ls中可见已有文档。与此同时,另一种选择是使用hdfs

java - 从 hadoop unix 运行时增加 jvm 堆空间

我正在从hadoop命令运行一个java类test.java:$hadooptest我正在使用一个stringBuilder,它的大小快要超出内存了:Exceptioninthread"main"java.lang.OutOfMemoryError:Javaheapspaceatjava.util.Arrays.copyOf(Arrays.java:2882)atjava.lang.AbstractStringBuilder.expandCapacity(AbstractStringBuilder.java:100)atjava.lang.AbstractStringBuilder.a