草庐IT

maven - Cloudera VM 上的 Apache Giraph - org.apache.hadoop 的 POM :hadoop-core:jar:2. 6.0 缺失,无依赖信息

我是Hadoop/Giraph和Java的新手。作为任务的一部分,我在其上下载了ClouderaQuickstartVM和Giraph。我正在使用这本书,名为“使用ApacheGiraph进行实用图形分析;作者:Shaposhnik、Roman、Martella、Claudio、Logothetis、Dionysios”,我尝试从中运行第111页上的第一个示例(TwitterFollowershipGraph)。尝试在集群2.6.0-mr1-cdh5.12.0上使用hadoop版本运行更改后的pom.xml文件时,请发现以下错误`[cloudera@quickstartfirst]$m

eclipse - sc.TextFile ("") 在 Eclipse 中工作但不在 JAR 中

我正在编写将在hadoop集群中的代码,但首先,我使用本地文件在本地对其进行测试。该代码在Eclipse中运行良好,但是当我使用SBT(使用sparklib等)制作一个巨大的JAR时,该程序一直运行到textFile(path)我的代码是:importorg.apache.spark.{SparkConf,SparkContext}importorg.apache.log4j.{Level,Logger}importorg.joda.time.format.DateTimeFormatimportorg.apache.spark.rdd.RDDimportscala.collectio

java - 在 EMR 上提交 JAR 时出现 ClassNotFoundException

我正在使用eclipse/Maven创建一个JAR并在EMR上运行它这是我的pom.xml文件4.0.0com.sudarshanSparkApplicationSQLjarSparkApplicationhttp://maven.apache.orgUTF-8clouderahttps://repository.cloudera.com/artifactory/cloudera-repos/junitjunit3.8.1testorg.scala-langscala-library2.11.1org.apache.sparkspark-core_2.112.2.0org.apache

hadoop - 在 Spring 云数据中运行 MapReduce Jar

我需要在springclouddataflow中运行一个mapreducespringboot应用程序。通常在scdf中注册的应用程序是使用“java-jarjar-name”命令执行的。但我的程序是一个mapreduce,它必须使用“hadoopjarjar-name”来执行。我如何实现这一目标?在scdf中运行mapreduce应用程序的更好方法是什么?是否可以直接注册mapreduce应用程序?我正在使用本地数据流服务器来注册应用程序。 最佳答案 在SCDF中,运行JAR文件的命令格式由部署者管理。比如有localdeploy

java - 在没有 jar 的情况下从 java 代码调用 hadoop 作业

我使用这段代码来运行字数统计hadoop作业。当我使用hadoopeclipse插件从eclipse内部运行它时,WordCountDriver运行。当我将mapper和reducer类打包为jar并将其放入类路径中时,WordCountDriver也会从命令行运行。但是,如果我尝试从命令行运行它而不将mapper和reducer类作为jar添加到类路径,尽管我将这两个类都添加到了类路径,但它会失败。我想知道hadoop是否有一些限制接受映射器和缩减器类作为普通类文件。创建一个jar总是强制性的吗?publicclassWordCountDriverextendsConfiguredi

maven - 如何在 Maven 中引用 hadoop v2.3.0 jar?

我只是想在我的Maven项目中引用hadoopmapreducejar。我看到这样做的方法发布在http://mvnrepository.com/artifact/org.apache.hadoop/hadoop-mapreduce/2.3.0.我的pom具有以下依赖性。org.apache.hadoophadoop-mapreduce2.3.0但是,在eclipse中,我看到以下错误。容器“MavenDependencies”引用了不存在的库C:\Users\root\.m2\repository\org\apache\hadoop\hadoop-mapreduce\2.3.0\ha

IDEA+Maven打JAR包的两种方法

一、使用IDEA自带打包插件(支持单个类也支持Maven类型Project)1.说明最终输出:输出目录在out目录下2.主要步骤(1)依次选择file->projecctstructure->artifacts->点击+(选择jar)->选择frommodulewithdependencies或者在我们的idea工程界面,点击右上角的projectstructure(2)弹出窗口中指定MainClass(3)点击Build–>BuildArtifacts–>选择bulid详细步骤请参考博文《IDEA用自带工具打jar包方法》二、使用IDEA的Maven工具(创建Project需是Maven类型

hadoop - 如何在 HDP 2.2 中安装 hadoop-examples* 和 hadoop-test* jar?

如何在HortonworksDataPlatform2.2上安装hadoop-examples*和hadoop-test*jar?这些jar在任何服务器上都不存在。我需要安装其他软件包吗?我找到了一个reference也就是说,它们应该位于/usr/share/hadoop,但该目录在我的集群中的任何节点上都不存在。 最佳答案 对于HDP2.2,大多数内容都移到了/usr/hdp下,所以这些可能就是您要找的内容。[hdpdemo@hdp-demo-mas5hdp]$pwd/usr/hdp[hdpdemo@hdp-demo-mas5h

java - 向我的 Storm 集群提交字数统计拓扑,使用 Eclipse 创建 jar,但它显示异常

我正在尝试向我的Storm集群提交一个字数统计拓扑。我使用Eclipse创建了一个jar,但它显示异常。谁能告诉我该怎么做。我在这里附上我的代码和异常。Spout创建-publicclassWordReaderimplementsIRichSpout{privateSpoutOutputCollectorcollecter;privateBufferedReaderbufferedreader;privateFileReaderfilereader;privateBooleancompleted=false;privateTopologyContextcontext;privatefi

hadoop - sqoop 导入无法定位 sqoop-1.4.6.jar

我正在使用sqoop从mysql表导入数据以与hadoop一起使用。导入时显示错误。Hadoop版本:2.5.0Sqoop版本:1.4.6用于导入的命令sqoopimport--connectjdbc:mysql://localhost/--usernameroot--passwordpass@123--table-m1显示错误15/05/2723:13:59ERRORtool.ImportTool:EncounteredIOExceptionrunningimportjob:java.io.FileNotFoundException:Filedoesnotexist:hdfs://l