草庐IT

shell-mode

全部标签

shell - 告诉 Impala 忽略错误并继续

我正在尝试使用shellnohup运行一个长刷新脚本,脚本#!/bin/bashimpala-shell-fRefresh.sql-i"landingarea"但是每次遇到错误它都会停止,我必须进入脚本修复错误并从头开始重新运行,我喜欢它运行到最后,我可以找出错误,这可能吗?shellnohupshRefresh.shcatnohup.out 最佳答案 请使用-c查询失败继续。impala-shell-f-cRefresh.sql-i"landingarea"如果您不想捕获详细/错误消息,您可以包含--quiet选项impala-s

unix - 用于创建 HDFS 目录和配额设置的自动化 shell 脚本

我在具有ambari2.1和HDP2.3的hortonworks中设置了一个集群。我必须创建一个自动脚本来创建HDFS目录和配额设置。任何人有与此相关的任何类型的脚本或任何类型的建议,请在此处发布。 最佳答案 下面是我的脚本:#!/bin/bashread-p"EnterUserName:"usernameecho"Welcome$username!"read-s-p"EnterPassword:"pswdecho$pswdhdfsdfs-mkdir/$1hdfsdfs-mkdir/$2hdfsdfs-mkdir/$3hdfsdfs

shell - 从 shell 命令行将配置单元表导出到 CSV 时自定义分隔符?

我使用以下命令,我得到的CSV文件是制表符分隔的。hive-e"select*frommy_table_name">my_csv_file_received_daily.csv而且我每次都必须重新格式化文件。有没有一种简单的方法来更改此命令以获取逗号分隔文件而不是制表符。 最佳答案 insertoverwritelocaldirectory'my_csv_file_received_daily'rowformatdelimitedfieldsterminatedby','select*frommy_table_name;

shell - 如何在shell脚本中读取所需的文件

抱歉问题不清楚,我是Hadoop学习的新手。我再次编辑了问题。我用Python编写了两个HadoopMapReduce程序:map.py和red.py。然后在HDFS上写run.sh来进行使用Hadoop流的MapReduce。我需要在HDFS上读取半年的数据,文件名为:20170101-20170630。文件在HDFS中的路径:/user/name/20161231/user/name/20170101/user/name/20170102...../user/name/20170630/user/name/20170701如何编写run.sh来读取需要的文件?run.sh中脚本部分

hadoop - beeline 和 spark-shell 可以为同一个 apache spark 显示不同的数据库吗?

我在ubuntu上安装了hadoop2.8.1,然后在上面安装了spark-2.2.0-bin-hadoop2.7。首先,当我通过spark-shell创建数据库并尝试通过javaJDBC程序访问它时,我发现没有表存在。然后我使用直线并观察到这里也不存在数据库。我通过直线创建数据库。为什么spark-shell和beeline显示的DB不同?他们可能应该显示相同的内容。我尝试了连接hive2并获取表的普通JDBC程序,观察到有时它显示我通过spark-shell创建的表,有时显示通过直线创建的表...请帮助。有时直线也会发生同样的情况。 最佳答案

bash - 将配置单元查询输出存储在 shell 脚本变量中

当我尝试通过shell脚本执行以下2个查询时,我无法回显输出:查询:close_val=`hive-e"selectcount(1)fromtst_db.dim_calendarwherecalendar_id=20171102"`close_val=$(hive-S-e"USEcars_dev;selectcount(1)fromdim_calendarwherecalendar_id=20171103")echo$close_val错误:2017-11-0300:55:11,505INFO[main]Configuration.deprecation(Configuration.j

shell - 通过 Oozie 工作流提交的 shell 脚本中存在 Spark-submit 不起作用

通过OozieWorkflow,我提交了一个shell脚本,其中包含spark-submit命令。我通过oozie控制台在hdfs/user/admin/first.sh中上传了shell脚本。当我运行脚本直到spark-submit命令时,它运行良好。当它尝试运行spark-submitcmd时,它失败了。本地文件系统中存在spark-submit的原因,但我的脚本正在hadoop管理员用户的hadoop文件系统中运行。任何解决这个问题的方法。如何在hadoop文件系统中从hadoop用户运行本地文件系统(spark-submit)命令,或者我可以在Oozi的帮助下将脚本从hadoo

shell - 如何打开hdfs ://localhost:54310/user/hduser/

我尝试使用命令在hadoop中创建一个目录hadoopfs-mkdir计数那么如何在单节点集群上打开或查看hdfs://localhost:54310/user/hduser/count? 最佳答案 要查看文件夹及其内容,您可以执行如下操作:hadoopfs-lscount如果你想获取内容到你的本地文件系统,那么你可以使用gethadoopfs-getcount有关所有命令行选项的更多详细说明,请阅读here. 关于shell-如何打开hdfs://localhost:54310/use

hadoop - CDH4.4 : Restarting HDFS and MapReduce from shell

我正在尝试使用bash脚本在ClouderaHadoop4.4集群上自动停止、格式化和启动HDFS和MapReduce服务。使用“pkill-Uhdfs&&pkill-Umapred”可以很容易地终止HDFS和MapReduce进程,但是如何在不使用ClouderaManagerGUI的情况下再次启动这些进程? 最佳答案 好吧,显然CM有一个非常棒的AP​​I在这里查看http://cloudera.github.io/cm_api/ 关于hadoop-CDH4.4:Restarting

java - 从 Oozie shell 运行的 jar 写入文件

我有jar在运行我们的mapreduce过程之前需要运行的文件。这将处理稍后输入到mapreduce过程的数据。jar文件在没有oozie的情况下工作正常,但我喜欢自动化工作流程。jar如果运行应该接受两个输入:和并且应该期望输出两个文件,在下指定。这是工作流程:${jobTracker}${nameNode}java-jarRI-Sequencer.jarlog.csv/tmp/user/root/algo/RI-Sequencer.jar#RI-Sequencer.jar/user/root/algo/log.csv#log.csvActionfailed,errormessage