草庐IT

java - 用于 hadoop mapreduce 的 jar

我正在关注thishadoopmapreducetutorial由Apache提供。那里给出的Java代码使用了这些Apache-hadoop类:importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable;importorg.apache.hadoop.io.Text;importorg.apache.hadoop.mapreduce.Job;importorg.apache.hadoop.mapreduce.Mappe

java - 什么相当于hadoop 2.7.1中的hadoop-core-xxx.jar

我正在研究用于图形分布式处理的斯坦福GPS(图形处理系统)框架。该框架使用hadoop。根据GPS文档,安装GPS需要将hadoop-core-xxx.jar文件复制到其libs目录中。但是,我发现hadoop-core-xxx.jar不存在于hadoop2.7.1中。2.7.1版本的hadoopcore文件相当于什么?提前致谢... 最佳答案 您正在寻找hadoop-common.这是hadoop-common-2.7.1. 关于java-什么相当于hadoop2.7.1中的hadoo

hadoop - 不应该在包安装期间配置 Oozie/Sqoop jar 位置吗?

我在CentOS6.7中使用HDP2.4。我已经用Ambari创建了集群,所以Oozie是由Ambari安装和配置的。我在运行与jar文件位置相关的Oozie/Sqoop时遇到两个错误。第一个涉及postgresql-jdbc.jar,因为Sqoop作业是从Postgres增量导入的。我将postgresql-jdbc.jar文件添加到HDFS并在workflow.xml中指向它:/user/hdfs/sqoop/postgresql-jdbc.jar问题解决了。但第二个错误似乎与kite-data-mapreduce.jar有关。然而,对这个文件做同样的事情:/user/hdfs/s

java - Hive ClassNotFoundException 即使所有 jar 都添加到 Maven 存储库中

我添加了该项目所需的所有jar,但我无法解决此异常。任何人都可以就此提出建议。你也能告诉我如何授予配置单元数据库访问权限吗?提前致谢。java.lang.ClassNotFoundException:org.apache.hadoop.hive.jdbc.HiveDriveratjava.net.URLClassLoader$1.run(URLClassLoader.java:366)atjava.net.URLClassLoader$1.run(URLClassLoader.java:355)atjava.security.AccessController.doPrivileged(

scala - 为什么我的jar 看不到环境中的HBase 配置?

我编写了一个试图创建默认HBaseConfiguration的应用程序,但是当我将应用程序打包为jar时,它无法正常工作,因为它正在尝试使用127.0.0.1的zookeeper而不是我在/etc/hbase/conf/hbase-site.xml。该应用程序可以简化为如下所示:objectTestUtilextendsApp{valhbaseTable=newHTable(HBaseConfiguration.create,"tableName")println(hbaseTable)}当我使用以下命令运行它时,它工作正常:CLASSPATH=`hbaseclasspath`java

hadoop - 在 Hadoop 中包含第三方 Jar

我是Hadoop新手。我已将GsonAPI添加到我的MapReducing程序中。当我运行程序时得到;Error:java.lang.ClassNotFoundException:com.google.gson.Gson谁能建议我如何将第三方库添加到Hadoop? 最佳答案 请务必在提交作业时向HADOOP_CLASSPATH和-libjars添加任何依赖项,如以下示例所示:使用以下命令添加当前目录和lib目录中的所有jar依赖项:exportHADOOP_CLASSPATH=$HADOOP_CLASSPATH:`echo*.jar

java - 使用 mahout 和 hadoop jar 运行 K-means 集群时出现 IO 异常

这个问题不太可能帮助任何future的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visitthehelpcenter.关闭9年前。我正在尝试使用Mahout运行集群程序。以下是我正在使用的java代码packagecom;importjava.io.File;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.hadoop.conf.Configuratio

java - hadoop streaming,使用-libjars 包含jar 文件

我正在学习hadoop,并编写了map/reduce步骤来处理我拥有的一些avro文件。我认为我遇到的问题可能是由于我的hadoop安装所致。我正在尝试在我的笔记本电脑上以独立模式进行测试,而不是在分布式集群上。这是我运行作业的bash调用:#!/bin/bashreducer=/home/hduser/python-hadoop/test/reducer.pymapper=/home/hduser/python-hadoop/test/mapper.pyavrohdjar=/home/hduser/python-hadoop/test/avro-mapred-1.7.4-hadoop

hadoop - 缺少 Hive 执行 Jar Hadoop

我知道这是一个重复的问题,但是thislink在stackoverflow上并没有解决我的问题。当我尝试运行Hive时出现以下错误:Pawandeep-Singh-2:apache-hive-1.1.1-binPawandeepSingh1$bin/hivereadlink:illegaloption--fusage:readlink[-n][file...]MissingHiveExecutionJar:/usr/local/Cellar/hive/apache-hive-1.1.1-bin/lib/hive-exec-*.jar我正在使用MacOSXYosemite。任何人都可以告

java - hadoop - Hadoop jar 输入路径问题

我遇到的问题是hadoopjar命令需要输入路径,但我的MapReduce作业从数据库获取输入,因此不需要/没有输入目录。我已将JobConf输入格式设置为DBInputFormat,但在干扰我的工作时如何表示这一点?//Hereisthecommandhadoopjar我有一个输出文件夹,但不需要输入文件夹。有没有办法规避这个?我是否需要编写第二个程序来将数据库数据提取到一个文件夹中,然后在MapReduce作业中使用它? 最佳答案 hadoopjar命令不需要命令行参数,可能主类除外。map/reduce作业的命令行参数将由程序