草庐IT

target-action

全部标签

java - Hadoop 在从 Spring 批处理管理员启 Action 业时获取连接被拒绝的异常

我正在尝试从springAdmin触发hadoopmapreduce作业,但出现以下错误。SpringAdmin在wasce上运行。作业配置:fs.defaultFS=hdfs://localhost:8020mapred.job.tracker=localhost:8021请指教。当我通过打包一个jar并使用hadoop命令运行此作业时,它工作正常但在通过Admin运行时出错。sudo-uhdfshadoopjartest.jarorg.MainCausedby:java.net.ConnectException:CallFrom/tolocalhost:8021failedonco

mysql - Hive 查询在启 Action 业并生成跟踪 URL 后不会开始 MapReduce 进程

我正在使用ApacheHive。我在Hive中创建了一个表(类似于外部表)并使用LOADDATALOCALINPATH'./Desktop/loc1/kv1.csv'OVERWRITEINTOTABLEadih;命令将数据加载到该表中。虽然我能够从配置单元表adih中检索简单数据(例如select*fromadih、selectc_codefromadihlimit1000等),但Hive给了我当我请求涉及轻微计算的数据时出现错误(例如selectcount(*)fromadih、selectdistinct(c_code)fromadih)。Hivecli输出如下链接所示-hive>

hadoop - hadoop 是否需要运行 mahout-in-action 示例?

运行MahoutInAction示例需要hadoop吗?我看到有一个hadoopjar提供了mahout。我一直在使用build-reuters.sh时遇到问题,想知道是否需要单独安装hadoop。谢谢!! 最佳答案 MahoutinAction一书的大部分内容都涉及将ApacheMahout与ApacheHadoop结合使用。所以是的,您最终将需要Hadoop。本书指导您下载并安装Hadoop。Hadoop本身不随Mahout提供,不。但是Mahout的构建系统引用了Hadoop,因此它会自动下载Hadoop之类的依赖项。这是另一

hadoop - 错误 : org. 找不到 apache.oozie.action.hadoop.PigMain

我正在尝试通过oozie工作流执行一个简单的pig脚本,该工作流导入一个pythonjar以及其他一些jar并最终得到如下错误:FailingOozieLauncher,Mainclass[org.apache.oozie.action.hadoop.PigMain],exceptioninvokingmain(),java.lang.ClassNotFoundException:Classorg.apache.oozie.action.hadoop.PigMainnotfoundjava.lang.RuntimeException:java.lang.ClassNotFoundExc

shell - 带有单引号的 Oozie Shell Action 参数被删除

我正在尝试通过一些子工作流配置来运行OozieShellAction作业。在编写配置文件(workflow.xml)时,我将一些变量(来自job.properties文件)用单引号括起来,如:myVar'${myVar}'但是,在Shell脚本中,接收到的参数没有有任何单引号?有什么想法吗? 最佳答案 尝试不加引号。我的变量${myVar} 关于shell-带有单引号的OozieShellAction参数被删除,我们在StackOverflow上找到一个类似的问题:

shell - Oozie——java : command not found - shell action

我正在通过Oozie从shell脚本运行java程序,但出现以下错误java:commandnotfound当我从边缘节点运行shell脚本时,我没有发现任何问题,java类运行时没有任何错误,我也得到了所需的输出。但是,无法运行java命令的是oozie作业。oozie中的所有其他操作都正常执行,但是当它遇到java行时,它会抛出上述错误。我知道Hadoop集群中的所有节点都会安装Java,那么为什么会出现此错误?下面是我的shell脚本中的java命令......java-cp$LOCAL_DIR/libs/integration-tools.jarcom.audit.report

hadoop - Sqoop增量导入 "Cannot append files to target dir"

我在使用Sqoop将数据从MySQL导入Hive时遇到问题...这个查询:sqoopimport--connectjdbc:mysql://xx.xx.xx.xx/database\--usernamesqoop--passwordsqoop--tabledatatable\--target-dir/home/cloudera/user/hive/warehouse/database.db/datatable\--as-parquetfile-m1--append返回这个错误:15/01/1416:27:28WARNutil.AppendUtils:Cannotappendfilest

hadoop - Oozie - 从 Hive Action 捕获输出

在Oozie中,我们如何捕获可以在后续HiveAction中进一步使用的第一个HiveAction的输出? 最佳答案 假设您有两个hive表A和B。这里您正在对表A的数据执行一些转换,并希望将数据存储在表B中。为此,您的表B应该在Metastore中定义为外部表。Oozie工作流将在表A中执行转换查询,其输出将作为表B的源存储在表B的表定义中定义的同一目录中。 关于hadoop-Oozie-从HiveAction捕获输出,我们在StackOverflow上找到一个类似的问题:

hadoop - Sqoop 中拆分 <column> --target-dir 的目的是什么

当我们在sqoop中编写--split-by时,内部发生了什么?例子:sqoopimport--connectjdbc:mysql://localhost/test--usernameroot--passwordtraining123--query'select*fromtransactionwhere$CONDITIONS'--split-byTxnid--target-dirinput/transaction 最佳答案 HadoopMAPReduce就是分而治之。为了将数据分割成多个独立的切片并行传输,Sqoop需要找到--sp

hadoop - 创建 SPARK RDD(HDFS 上的文件)和调用 Action 时出错

scala>valmanager=sc.textFile("hdfs://localhost:54310/user/training/employee_dir/employeeManager")scala>manager.first错误:java.io.EOFException:EndofFileExceptionbetweenlocalhostis:"localhost.localdomain/127.0.0.1";destinationhostis:"localhost":54310;:java.io.EOFException;Formoredetailssee:http://wi