草庐IT

local-class

全部标签

apache-spark - Spark 没有这个字段 METASTORE_CLIENT_FACTORY_CLASS

我正在尝试使用Java中的spark查询配置单元表。我的配置单元表位于EMR集群5.12中。Spark版本为2.2.1,Hive版本为2.3.2。当我通过ssh连接到机器并连接到spark-shell时,我能够毫无问题地查询配置单元表。但是当我尝试使用自定义jar进行查询时,出现以下异常:java.lang.IllegalArgumentException:Errorwhileinstantiating'org.apache.spark.sql.hive.HiveSessionStateBuilder':atorg.apache.spark.sql.SparkSession$.org$

linux - hadoop 配置 : couldn load or find main class org. apache.hadoop

我正在尝试学习hadoop,我正在学习pluralsight的“hadoop构建block”类(class),我正在尝试通过伪分布式模式运行hadoop,当我运行以下命令时:bin/hadoopjarshare/hadoop/mapreduce/hadoop-mapreduce-examples-3.0.3.jargrep输入输出'dfs[a-z.]+'我得到以下输出:Applicationapplication_1530031734419_0001failed2timesduetoAMContainerforappattempt_1530031734419_0001_000002ex

hadoop - 找到接口(interface) org.apache.hadoop.mapreduce.TaskAttemptContext,但 class 是 mapreduce 中的预期错误

我是hadoop的新手。我正在编写将文本文件转换为PDF的mapreduce代码,但出现上述错误。在网上搜索问题后,我发现问题是org.apache.hadoop.mapreduce.TaskAttemptContext在Hadoop1中是一个类,但在Hadoop2中变成了一个接口(interface)。但是,我没有找到如何解决这个问题。请帮我解决这个问题。我的POM中的依赖项是:org.apache.hadoophadoop-core1.2.1org.apache.hadoophadoop-common2.7.2org.apache.hadoophadoop-client3.1.1c

apache-spark - 亚马逊电子病历 : Spark - SparkException java IOException: Failed to create local dir in/tmp/blockmgr*

我有一个带有Spark的AWSEMR集群。我可以连接到它(spark):通过SSH连接到主节点后从主节点来自另一个AWSEMR集群但无法连接到它:从我的本地机器(macOSMojave)来自非emr机器,如Metabase和Redash我已阅读thisquestion的答案.我已经检查过所有节点上的文件夹权限和磁盘空间都没有问题。我的假设是我面临着类似的问题JamesWierzba在评论中提问。但是,我没有足够的声誉在那里添加评论。此外,考虑到它特定于AWSEMR,这可能是一个不同的问题。SSH连接到主节点后连接工作正常。#SSHedtomasternode$ssh-i~/identi

ubuntu - 安装hadoop时如何修复 "Error: Could not find or load main class ” -Djava.library.path=.usr.local.hadoop.lib”

我正在尝试在Ubuntu上安装Hadoop2.9.2。我在~/.bashrc和env.sh文件中设置了相同的JAVA_HOME路径。在hadoop_store下使用正确的路径为数据节点和名称节点创建了两个单独的目录。Java版本是“java-11-openjdk-amd64”。在hadoop文件系统中格式化namenode时,我仍然面临错误。请帮助我解决它。指向我一直遵循其说明的页面的链接。https://www.digitalvidya.com/blog/install-hadoop-on-ubuntu-and-run-your-first-mapreduce-program/这是错

Hadoop/MapReduce : Reading and writing classes generated from DDL

谁能带我了解使用从DDL生成的类读写数据的基本工作流程?我已经使用DDL定义了一些类似结构的记录。例如:classCustomer{ustringFirstName;ustringLastName;ustringCardNo;longLastPurchase;}我编译它以获得一个Customer类并将其包含到我的项目中。我可以很容易地看到如何将其用作映射器和缩减器的输入和输出(生成的类实现了可写),但看不到如何将其读取和写入文件。org.apache.hadoop.record包的JavaDoc谈到以二进制、CSV或XML格式序列化这些记录。我该怎么做呢?假设我的reducer生成In

java - Hadoop 新 API 的 Class Cast 异常

我尝试使用Mapreduce框架编写一些简单的代码。以前我已经使用mapred包实现并且我能够将输入格式类指定为KeyvalueTextInputFormat但是在使用mapreduce的新Api中不存在此类。我尝试使用TextInputFormat.class但我仍然遇到以下异常-job_local_0001java.lang.ClassCastException:org.apache.hadoop.io.LongWritablecannotbecasttoorg.apache.hadoop.io.Textatcom.hp.hpl.mapReduceprocessing.MapRed

hadoop - Pig local 与 mapreduce 模式性能比较

我已经使用Cloudera管理器CDH4设置了一个3节点Hadoop集群。当在mapreduce模式下运行Pig作业时,对于相同的数据集,它花费的时间是本地模式的两倍。这是预期的行为吗?另外,是否有任何文档可用于mapreduce作业的性能调整选项?非常感谢您的帮助! 最佳答案 这可能是因为您使用的是玩具数据集,并且mapreduce的开销大于并行化的好处 关于hadoop-Piglocal与mapreduce模式性能比较,我们在StackOverflow上找到一个类似的问题:

hadoop - 如何选择${mapred.local.dir}?

如果我配置了几个${mapred.local.dir}目录来存储MapTask的即时结果,这些目录挂载在不同的磁盘上。我的问题是:1.LocalDirAllocator.java是否用于管理${mapred.local.dir}目录?2.LocalDirAllocator.java的方法getLocalPathForWrite()是用来选择一个${mapred.local.dir}目录的? 最佳答案 1.WhetherLocalDirAllocator.javaisusedtomanage${mapred.local.dir}dir

hadoop - Spark on Yarn 作业失败,退出代码为 :1 and stderr says "Can' t find main class"

我们尝试将一个简单的SparkPI示例提交到SparkonYarn。bat写法如下:./bin/spark-submit--classorg.apache.spark.examples.SparkPi--masteryarn-cluster--num-executors3--driver-memory4g--executor-memory1g--executor-cores1.\examples\target\spark-examples_2.10-1.4.0.jar10pause我们的HDFS和Yarn运行良好。我们正在使用Hadoop2.7.0和Spark1.4.1。我们只有1个节