executable-jar

java - 获取 ArrayIndexOutOfBoundsException : 3 while executing Hadoop Pragram on cloudera

在clouderalinux机器上我得到ArrayIndexOutOfBoundsException:3。我不明白为什么这个程序会出现这个异常，只有其他人对我来说很好。publicclassTransactionCountextendsConfiguredimplementsTool{@Overridepublicintrun(String[]arg0)throwsException{if(arg0.length 最佳答案我认为在if条件下你应该使用arg0.length而不是arg0.length

hadoop - 如何在未安装的系统中使用 jar 文件运行 drill？

我正在使用Apachedrill1.8制作程序。我正在尝试在未安装drill的HDFS中运行该程序。我认为的方法是使用jar文件，drill包含的jar文件可以运行这个程序，因为它是在虚拟机中运行的。但我对这种方式没有信心。能行吗？如果这种方式可行，如何在jar文件中包含drill？如果不是，那是什么方式？还有一个问题，如何使用Java代码更改存储配置？最佳答案 drill或hdfs是否在同一台机器上运行并不重要。为什么需要创建一个jar。如果您使用Maven作为构建工具，请添加DrillJDBC驱动程序依赖项:org.apach

何在 hadoop drill section 34 jar apache-drill

hadoop - pig 注册jar，文件不存在报错

我正在使用Hortonworks沙盒并尝试运行一个简单的pig脚本。似乎有与“文件不存在”相关的恼人错误。脚本如下:REGISTER'/piggybank.jar';inp=load'/my.csv'USINGorg.apache.pig.piggybank.storage.CSVExcelStorage..ERROR2997:EncounteredIOException.Filedoesnotexist:hdfs://sandbox.hortonworks.com:8020/tmp/udfs/'/piggybank.jar'但是，我的jar位于根目录(/)中，并且我也给予了适当的许可

hadoop pig section piggybank jar apache-pig hortonworks-sandbox

java - 我也可以使用 hadoop jar 命令来运行普通的 java 程序吗？

我的Java代码中有一些hadoop文件系统操作(例如:hdfsmkdir)。当我尝试使用java-cp运行java程序时，该目录在linux本地文件系统中创建。所以我用hadoopjar命令运行程序，目录在hdfs中创建。现在我打算使用hadoopjar命令运行整个java程序。我想知道使用hadoopjar命令会不会有任何问题，尤其是在从本地文件夹读取文件或执行Runtime.getRuntime().exec(somelinuxcommand);以下代码片段时我的hdfs文件操作Configurationconf=newConfiguration();FileSystemfs=F

java hadoop section code

hadoop - 我不明白这个示例代码中的 jar 和 class-name 是什么

我正在尝试使用sqoop合并hdfs上的增量数据，这是我在googlehttps://developer.ibm.com/hadoop/2017/02/28/typical-scenario-sqoop-incremental-import-merge/上找到的示例代码我不明白那里的jar文件和类名是什么，我应该提供哪个jar文件的路径以及什么类名？有人可以帮我理解吗？谢谢。sqoopmerge--new-data/apps/hive/warehouse/student/part-m-00000--onto/apps/hive/warehouse/student/part-m-0000

class-name hadoop 类名 sqoop section merge hdfs

hadoop - 使用 jar 命令执行 WordCount 程序时 hadoop 中出现 "No such file or directory"

我是Hadoop的新手，正在尝试执行WordCount问题。到目前为止我所做的事情-引用以下链接设置Hadoop单节点集群。http://www.bogotobogo.com/Hadoop/BigData_hadoop_Install_on_ubuntu_single_node_cluster.php引用下面的链接写出字数统计问题https://kishorer.in/2014/10/22/running-a-wordcount-mapreduce-example-in-hadoop-2-4-1-single-node-cluster-in-ubuntu-14-04-64-bit/问题

hadoop WordCount image noreferrer jar word-count

hadoop - Spark : Execute python script with Spark based on Hadoop Multinode

我正在寻找基于HadoopMultinodes的Spark使用，我对我的集群模式pythonic脚本有疑问。我的配置:我进入了我的Hadoop集群:1个名称节点(主节点)2个数据节点(从节点)所以我想在Python中执行我的脚本以使用这个集群。我知道Spark可以用作独立模式，但我想使用我的节点。我的python脚本:这是一个非常简单的脚本，可以用来计算文本中的字数。importsysfrompysparkimportSparkContextsc=SparkContext()lines=sc.textFile(sys.argv[1])words=lines.flatMap(lambda

Spark Multinode 2018 1521023754917 INFO hadoop apache-spark pyspark cluster-computing

java - 如何将第三方 jar 添加到 mapreduce 作业？

寻找将第三方jar添加到mapreduce作业中的解决方案。目前，我们正在将第三方jar捆绑到mapreduce作业中。似乎有时mapreduce作业jar的大小会变高。有没有另一种方法来克服这个问题最佳答案我相信“-libjarsjar1,jar2,...”是您在这里需要的关于java-如何将第三方jar添加到mapreduce作业？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/quest

mapreduce java section jar hadoop hadoop2

hadoop - 失败 : Execution Error, 在配置单元中的连接操作期间从 org.apache.hadoop.hive.ql.exec.mr.MapredLocalTask 返回代码 2

我正尝试在配置单元中对以下两个表运行连接查询-selectb.locationfromuser_activity_ruleainnerjoinuser_info_rulebwherea.uid=b.uidanda.cancellation=true;QueryID=username_20180530154141_0a187506-7aca-442a-8310-582d335ad78dTotaljobs=1OpenJDK64-BitServerVMwarning:ignoringoptionMaxPermSize=512M;supportwasremovedin8.0Executionl

配置单 hadoop section Execution username join hive hiveql

java - 在集群中启动 MapReduce 作业失败，退出代码为 : -1000 and job. jar 不存在

我正在尝试在Java代码中启动mapreduce作业并将作业提交给yarn。但出现以下错误:2018-08-2600:46:26,075WARN[main]util.NativeCodeLoader(NativeCodeLoader.java:(62))-Unabletoloadnative-hadooplibraryforyourplatform...usingbuiltin-javaclasseswhereapplicable2018-08-2600:46:27,526INFO[main]client.RMProxy(RMProxy.java:createRMProxy(92))-

MapReduce java 1535213323614 job hadoop hadoop-yarn

86 87 888990 91 92