shell-mode_草庐IT

hadoop - Oozie shell 操作 - 运行 sqoop 命令并需要记录详细信息

我正在使用Oozie、shellaction和sqoop。我正在使用oozie来运行许多sqoop命令。我设置了一个shell操作，并在该shell中放置了许多sqoop命令。现在，shellAction被触发，甚至sqoop也在发生。但是，sqoop没有正确的日志记录。所以我将sqoop命令重定向到日志文件。我只看到以下几行。我的代码如下。在shell脚本中:*sqoopimport--connectjdbc:mysql://server:3306/test--verbose--usernameroot--passwordPassword--append--tablePeople--

hadoop - 为什么 oozie 向 yarn 提交 shell Action ？

我最近在学习oozie。我对shell的Action有点好奇。我正在执行包含类似shell命令的shell操作hadoopjar在运行此操作时，有两个yarn作业在运行，它们是一个用于hadoop作业一个用于shell操作我不明白为什么shellAction需要yarn来执行。我也试过电子邮件操作。它在没有yarn资源的情况下执行。最佳答案要回答这个问题，区别在于独立运行shell脚本(.sh文件或从CLI)作为oozie工作流程的一部分运行shell操作。(oozieshell操作中的shell脚本)第一种情况很明显。在第二种

shell - 列出目录中的所有文件夹名称 - unix shell 脚本

如何使用shell脚本获取所有文件夹的列表，目录存在于HDFS中。这是我尝试过的:#!/bin/kshecho"loadingfolders..."count=0forfolderin`hdfsdfs-ls-d/user/data/*`doif[-d"$folder"]thencount=`expr$count+1`echo${d}fidoneecho${count}程序结束时count变量的值为0。最佳答案你需要询问hdfs文件夹是否是一个目录，而不是bash。ifhdfsdfs-test-d"$folder";then

shell - 如何使用在 oozie 中执行的脚本访问本地目录？

我在我的机器上运行CDH4.5和virtualbox。在VM中，我有一个本地目录:/home/cloudera/logs/abc.log，我想做一件非常简单的事情，我在oozie中安排了一个非常简单的脚本来复制>abc.log到HDFS(/user/cloudera/logs/).计划的作业已执行，但在stderr中，它向我显示:无法访问/home/cloudera/logs/abc.log:没有那个文件或目录无论如何，有什么可以让这个工作的吗？因为我想用oozie安排一个脚本，每天将文件从本地复制到HDFS作为一项沐浴工作。谢谢!! 最佳答案

scala - 将几个变量从 scala/spark-shell 提供给配置单元表

我在scala/spark-shell中有4个变量。S1=(astring)="age"S2=(anotherstring)="school"D1=(adouble)=0.50D2=(anotherdouble)=0.75我需要像这样将其提供给配置单元表:因子系数0.50岁学校0.75我能够从scala/spark-shell创建表:valhiveContext=neworg.apache.spark.sql.hive.HiveContext(sc)//后续作品hiveContext.sql("createtablestudents_table(factorSTRING,coeffFL

hadoop - 在每个 EMR/Yarn 节点上运行 Unix shell 命令

我想在AmazonEMR集群中的每个节点上安装一个Python模块。看起来最明显的方法是通过ssh连接到每个节点并在命令行安装它。我将YARN视为在集群中的每个节点上运行相同JAR文件的一种方式，但YARN的“jar”命令似乎在本地系统上运行。最佳答案您可以使用bootstrap在启动集群时在每个EMR节点上安装第3方软件。如果您使用命令行，您可以传递保存在s3中的shell脚本作为引导操作的一部分。awsemrcreate-cluster--name"Testcluster"--ami-version3.3\--use-def

shell - Oozie shell 操作 - 从 shell 问题运行配置单元

基于条件为真，我在shell脚本中执行hive-e。它工作正常。当我将此脚本放入Oozie的Shell操作中并运行时，我得到一个scriptName.sh:第42行:hive:commandnot发现异常。我尝试在shell操作中传递PATH=/usr/lib/hive，但我想我在那里犯了一些错误，因为我得到了相同的错误scriptName.sh:第42行:配置单元:找不到命令已编辑:我在shell脚本中使用了whichhive。它的输出不一致。我得到两种输出变体:1./usr/bin/hive以及Delegationtokencanbeissuedonlywithkerberosor

hadoop - 在Hbase Shell中运行命令时的“The node/hbase is not in ZooKeeper”

我正在尝试以独立模式安装HBasev1.1.2(与Hadoopv2.7.2)，并尽可能严格地遵循ApacheHBasedocs，但是配置似乎有些棘手。不知道这是否与我使用自制软件安装HBase相对，而不是通过其镜像站点之一直接下载有关。我的目标是达到可以执行创建表，列出现有表等的目的。我已经安装了Java1.7.0，并且已经运行“brewinstallhbase”来安装hbase。在Homebrew的hbase目录中，我打开了/libexec/conf/hbase-env.sh，在第27行看到以下内容:exportJAVA_HOME="$(/usr/libexec/java_home)

shell - 为什么排序 k1,1 会改变输出？

我是hadoop世界的新手，我正在尝试学习使用mapreduce思维编写代码。所以，我正在学习michael-noll教程。我面临的挑战之一(除了理解一个新框架之外)是这个框架使用的终端技巧的数量。所以做什么。$echo"foofooquuxlabsfoobarquux"|/home/hduser/mapper.py|sort-k1,1|/home/hduser/reducer.py是什么意思？？？echo有什么作用？？此外，上述代码的输出是:bar1foo3labs1quux2现在如果我没有sort-k1,1东西foo2bar1labs1foo1quux2排序标志有什么作用？-k1,

hadoop - hbase shell 命令 : how to use the QualifierFilter

在hbaseshell中运行以下命令，尝试让QualifierFilter工作:importorg.apache.hadoop.hbase.filter.CompareFilterimportorg.apache.hadoop.hbase.filter.SingleColumnValueFilterimportorg.apache.hadoop.hbase.filter.SubstringComparatorimportorg.apache.hadoop.hbase.util.Bytesimportorg.apache.hadoop.hbase.filter.QualifierFilt