草庐IT

shell-mode

全部标签

hadoop - 处理 PIG 脚本中的 fs(hadoop shell)命令错误

我有一个包含几个语句的PIG脚本。示例脚本:registerx.jar;fs-rmr;LOAD'X'AS(uuid:chararray,value:chararray);我正在调用fsshell来删除HDFS上的文件:fs-rmr如果存在则删除,否则继续。如果文件/目录不存在,脚本将退出并抛出错误:Nosuchfileordirectory我使用以下命令运行它:pig-ffilename.pig-paramparameter1=value"-f"强制停止它。如果我避免使用“-f”,我会收到以下错误:2015-02-0202:50:15,388[main]ERRORorg.apache.

hadoop - 如何将一个或多个表从 Hbase shell 导出为文本格式?

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭5年前。Improvethisquestion我的Hbaseshell中有一个表,其中包含大量数据,我想将其以文本格式导出到本地文件系统。谁能建议我怎么做。我也想知道是否可以将Hbase表导出到hive或pig上。

hadoop - 如何使用 hadoop shell 命令列出死数据节点

我可以在端口50070的hadoopdfsnodelist页面上查看哪些数据节点已死,但是是否有任何命令行工具可以运行以返回相同的信息?我试过了hadoopdfsadmin-report|grep'Datanodes'这只能告诉我总共有多少个节点,有多少存活的节点和多少已死亡的节点,有什么方法可以返回死节点列表及其名称而不是IP? 最佳答案 添加“-dead”选项,然后为“Name:”添加grep。这将省略活节点的信息,只打印死节点的标识信息。$sudo-uhdfshdfsdfsadmin-report-dead|grepName:

hadoop - 如何在hbase shell中获取旧值

hbase(main):004:0>create'htable','cf'0row(s)in0.4790seconds=>Hbase::Table-htablehbase(main):005:0>alter'htable',NAME=>'id',VERSIONS=>100Updatingallregionswiththenewschema...0/1regionsupdated.1/1regionsupdated.Done.0row(s)in2.2790secondshbase(main):006:0>put'htable','row1','cf:id',20row(s)in0.156

linux shell - 检查今天的文件,如果今天没有就上传到hdfs 如果不是今天就不要上传。给出文件已存在的消息

我想检查一个目录是否在今天创建。如果是,则将其上传到HDFS,但如果目录的修改日期不同,则输出该目录已复制到HDFS。#!/bin/shexportDATA_PATH=/data/1/sanket#Wewillenterthedirectorywherewewanttocheckotherdirectoriescd$DATA_PATH#Detailsofdirectorieswillbetransferedintono_of_files.txtls-lh$DATA_PATH/>>temp/no_of_files.txt#Wewillextractnameofthefilefromabo

shell - pig 剧本永远卡在心跳

我已经在一台机器上安装了cloudera5的所有组件:namenode、datanode、hue、pig、oozie、yarn、hbase...我在shell中运行以下pig脚本:sudo-uhdfspig然后在pigshell里跑data=LOAD'/user/test/text.txt'as(text:CHARARRAY);DUMPdata;脚本运行良好但是当在hue浏览器查询编辑器/Pig编辑器上运行这个脚本时,它卡住了,下面是日志:2015-09-1414:07:06,847[uber-SubtaskRunner]INFOorg.apache.pig.backend.hadoo

shell - 如何在启动/关闭时手动启动/停止 hadoop 服务?

您好,有人知道如何使用脚本停止和启动CDH(clouderadistributionHadoop)服务,我们正在为生产服务器执行此操作。例如,如果服务器重新启动,那么在重新启动之前,所有Hadoop服务都会正常停止,并在启动时启动。我在RHEL上有一个8节点的Hadoop集群,上面安装了cloudera5.4.7。到现在为止,我已经确定了几种方法来做到这一点,一个在link上。它说我必须使用chkconfig在操作系统上注册服务,如下所示:sudochkconfighadoop-hdfs-namenodeon但是当我这样做的时候我得到了错误errorreadinginformation

java - 用 shell 编写的 Hadoop 命令未从 java 调用

已经从shell定义了hadoop命令并且只是试图进行正常处理:shell文件如下:#!/bin/bashsuccess=$?echo"Thehadoopexecutionstartedat"$(date);echo"Processingthefiles";echo"StartingtheprocessformappingfiletoHDFSandthentomysql"hadoopfs-rm-r-f/FileMappingData&&hadoopfs-put/home/nishant/data/mappingfile//FileMappingData&&mysql-uroot-pad

hadoop - Sqoop-2 在使用 sqoop shell 进行自定义查询时无法对单个节点进行大量导入

我正在对由计算量大的自定义查询生成的大型记录集进行原型(prototype)迁移。此查询大约需要1-2小时才能在SQLDeveloper中返回结果集我正在尝试将此查询传递给一个简单的Sqoop作业,其中包含JDBC到HDFS的链接我在日志中遇到了以下错误:2016-02-1210:15:50,690ERRORmr.SqoopOutputFormatLoadExecutor[org.apache.sqoop.job.mr.SqoopOutputFormatLoadExecutor$ConsumerThread.run(SqoopOutputFormatLoadExecutor.java:

hadoop - 当 spark-shell 启动时,它有 SimpleUserGroupsMapping 的 RuntimeException

我通过Ambari安装HDFS、YARN并尝试在yarn上部署spark。但是当我执行follow脚本时,Spark出现错误如何在yarn上部署spark。您介意解释一下如何逐步在yarn上部署spark吗?我在spark-env.sh中设置了HADOOP_CONF_DIR、YARN_CONF_DIR,在spark-defaults.conf中设置了spark.master。执行脚本./bin/spark-shell--masteryarn-client错误Exceptioninthread"main"java.lang.RuntimeException:java.lang.Runti