local-class_草庐IT

java - 在运行一个简单的 MapReduce 程序时获取 java.lang.ClassCastException : class java. lang.String

我正在尝试执行一个简单的MapReduce程序，其中Map接受输入，将其分成两部分(key=>String和value=>Integer)reducer汇总相应键的值我每次都收到ClassCastException。我无法理解，代码中的什么导致了这个错误我的代码:importjava.io.IOException;importjava.util.Iterator;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.LongWritable;importorg.apache.hadoop.io.Text;importorg

sql - Hive: java.lang.OutOfMemoryError: Java heap space and Job running in-process (local Hadoop)

我的设置:运行NixOSLinux的GoogleCloudPlatform中的4节点集群(1个主节点，3个工作节点)。我一直在使用TPC-DS工具包来生成数据和查询都是标准的。在较小的数据集/更简单的查询上，它们工作得很好。我从这里获取的查询:https://github.com/hortonworks/hive-testbench/tree/hdp3/sample-queries-tpcds这是第一个，query1.sql:WITHcustomer_total_returnAS(SELECTsr_customer_skASctr_customer_sk,sr_store_skASct

OutOfMemoryError in-process Stage customer store sql hadoop hive mapreduce hdfs

java - Hadoop : java. io.IOException : Call to localhost/127. 0.0.1 :54310 failed on local exception: java. io.EOFException

我是hadoop的新手，今天才开始使用它，我想将文件写入hdfshadoop服务器，我正在使用服务器hadoop1.2.1，当我在cli中给出jps命令时，我能够看到所有节点都在运行，31895Jps29419SecondaryNameNode29745TaskTracker29257DataNode这是我将文件写入hdfs系统的示例客户端代码publicstaticvoidmain(String[]args){try{//1.GettheinstanceofCOnfigurationConfigurationconfiguration=newConfiguration();confi

java EOFException hadoop apache filesystems hdfs hadoop-streaming

scala - yarn 上的 Spark 提交没有将 jar 分发到 nm-local-dir

1、版本Spark:2.0.0标度:2.11.8java:1.8.0_91hadoop:2.7.22、问题:当我在yarn上提交scala程序到spark时，它抛出一个异常:Causedby:java.lang.IllegalStateException:Librarydirectory'/opt/hadoop/tmp/nm-local-dir/usercache/hadoop/appcache/application_1471514504287_0021/container_1471514504287_0021_01_000002/assembly/target/scala-2.11

分发 nm-local-dir INFO java 08 scala hadoop apache-spark hadoop-yarn

hadoop - Couchbase/hadoop 连接器 : sqoop job FAILED "Found interface org.apache.hadoop.mapreduce.TaskAttemptContext, but class was expected"

我的配置:CouchBase服务器2.0Sqoop1.4.2(为hadoop版本2.0.0编译)栈HadoopCDH4.1.2我想使用CouchBase/Hadoop连接器(http://www.couchbase.com/develop/connectors/hadoop)，但是当我启动导入时出现以下错误:sqoop-import--connecthttp://localhost:8091/pools--tableDUMP13/01/0711:00:34INFOtool.CodeGenTool:Beginningcodegeneration13/01/0711:00:34INFOor

hadoop TaskAttemptContext JobClient mapred INFO couchbase sqoop

hadoop - Sqoop 导入问题 - java.lang.IncompatibleClassChangeError : Found class org. apache.hadoop.mapreduce.JobContext，但接口(interface)是预期的

我正在使用Sqoop1.4.3与hadoop1.2.4和hive0.11.0当我尝试执行sqoop导入时:它抛出了IncompatibleClassChangeError。任何解决这个问题的建议..使用的Sqoop命令:sqoopimport--connectjdbc:mysql://localhost:3306/employees\--usernametest--passwordtest跟踪:Exceptioninthread"main"java.lang.IncompatibleClassChangeError:Foundclassorg.apache.hadoop.mapredu

hadoop IncompatibleClassChangeError apache java org sqoop

hadoop - kadmin 不能创建 principle 但 kadmin.local 可以

我正在Cloudera5beta上启用安全模式。使用cloudera管理器并在执行来自here的安全启用文档的第8步之后clouderamanager应该触发GenerateCredential命令，但事实并非如此。所以我正在做的是手动运行GenerateCredential，但它给我错误日志。KADMIN='kadmin-k-t/etc/cloudera-scm-server/cmf.keytab-pcloudera-scm/admin@IMP.CO.IN-rIMP.CO.IN'+kadmin-k-t/etc/cloudera-scm-server/cmf.keytab-pcloud

kadmin principle cloudera section hadoop kerberos cloudera-manager

python - pickle .PicklingError : args[0] from newobj args has the wrong class with hadoop python

我正在尝试通过spark删除停用词，代码如下fromnltk.corpusimportstopwordsfrompyspark.contextimportSparkContextfrompyspark.sql.sessionimportSparkSessionsc=SparkContext('local')spark=SparkSession(sc)word_list=["ourselves","out","over","own","same","shan't","she","she'd","what","the","fuck","is","this","world","too","w

python args 34 section word_list python-2.7 hadoop pyspark pickle

hadoop - 如何使用 oozie.launcher.action.main.class 将参数传递给 Oozie 操作？

Oozie有一个名为oozie.launcher.action.main.class的配置属性，您可以在其中为map-reduce操作(或shell操作)传入“主类”的名称，如下所示:oozie.launcher.action.main.classcom.company.MyCascadingClass但是我需要将参数传递给我的主类，但找不到实现它的方法。有什么想法吗？我问这个问题是因为我正尝试从Oozie中启动一个级联类/流，但到目前为止我尝试过的所有选项都失败了。如果有人从Oozie获得了Cascading功能，请告诉我，我会发布另一个问题来特别询问这个问题。

launcher 传递 gt lt section hadoop oozie cascading

hadoop - 从 s3 ://to local file system 复制文件

我是aws新手。我创建了一个集群并通过ssh连接到主节点。当我尝试将文件从s3://my-bucket-name/复制到pig中的本地file://home/hadoop文件夹时，使用:cps3://my-bucket-name/path/to/filefile://home/hadoop我得到错误:2013-06-0818:59:00,267[main]ERRORorg.apache.pig.tools.grunt.Grunt-ERROR2999:Unexpectedinternalerror.AWSAccessKeyIDandSecretAccessKeymustbespecifi

hadoop system apache pig amazon-web-services amazon-s3 apache-pig hdfs