草庐IT

CLUSTER_CONFIG

全部标签

java - Apache Spark : TaskResultLost (result lost from block manager) Error On cluster

我在Virtualbox上有一个带有3个从节点的Spark独立集群。我的代码在Java上,它可以很好地处理我的小输入数据集,它们的输入总共大约100MB。我将我的虚拟机RAM设置为16GB,但是当我在大输入文件(大约2GB)上运行我的代码时,在我的reduce部分处理数小时后出现此错误:Jobabortedduetostagefailure:Totalsizeofserializedresultsof4tasks(4.3GB)isbiggerthanspark.driver.maxResultSize`我编辑了spark-defaults.conf并为spark.driver.maxR

hadoop - yarn : How to utilize full cluster resources?

所以我有一个带有7个工作节点的cloudera集群。30GB内存4个vCPU以下是我发现的一些配置(来自Google)对于调整我的集群性能很重要。我正在运行:yarn.nodemanager.resource.cpu-vcores=>4yarn.nodemanager.resource.memory-mb=>17GB(为操作系统和其他进程预留)mapreduce.map.memory.mb=>2GBmapreduce.reduce.memory.mb=>2GB运行nproc=>4(可用处理单元数)现在我担心的是,当我查看我的ResourceManager时,我看到可用内存为119GB,

java - Apache Spark :-Nullpointer Exception on broadcast variables (YARN Cluster mode)

我有一个简单的spark应用程序,我试图在YARN集群上广播一个String类型的变量。但是每次我尝试访问广播变量值时,我都会在任务中得到空值。如果你们可以提出建议,那将非常有帮助,我在这里做错了什么。我的代码如下:-publicclassTestAppimplementsSerializable{staticBroadcastmongoConnectionString;publicstaticvoidmain(String[]args){StringmongoBaseURL=args[0];SparkConfsparkConf=newSparkConf().setAppName(Co

Hadoop安装错误, "error : cannot execute hdfs-config.sh."

我正在关注this在我的电脑上安装hadoop的教程。据我所知,在source~/.profile之前,我一直完全按照说明操作,但是当我尝试通过输入hdfsnamenode-format来格式化HDFS时,它给了我以下错误:ERROR:Cannotexecute/usr/local/Cellar/hadoop/3.0.0/libexec/hdfs-config.sh我尝试了很多方法在互联网上寻找解决方案,但没有找到解决方案。 最佳答案 @BIKI我刚遇到同样的问题,Hadoop版本3.0.0有一个奇怪的文件结构,不能按照您认为的方式

scala - Cluster 模式下使用 Spark 写入文件到本地系统

我知道这是一种使用Spark的奇怪方式,但我正在尝试使用Spark将数据帧保存到本地文件系统(不是hdfs),即使我处于集群模式。我知道我可以使用客户端模式,但我确实想在集群模式下运行并且不关心哪个节点(3个中的)应用程序将作为驱动程序运行。下面的代码是我正在尝试做的伪代码。//createdataframevaldf=Seq(Foo("John","Doe"),Foo("Jane","Doe")).toDF()//saveittothelocalfilesystemusing'file://'becauseitdefaultstohdfs://df.coalesce(1).rdd.s

hadoop - 了解 Spark : Cluster Manager, Master 和 Driver 节点

读完这篇question,我想再问一些问题:集群管理器是一个长期运行的服务,它在哪个节点上运行?主节点和驱动节点可能是同一台机器吗?我假设某处应该有一条规则说明这两个节点应该不同?如果Driver节点出现故障,谁负责重新启动应用程序?究竟会发生什么?即主节点、集群管理器和工作节点将如何参与(如果他们参与),以及以什么顺序参与?与上一个问题类似:如果主节点发生故障,具体会发生什么情况以及谁负责从故障中恢复? 最佳答案 1.TheClusterManagerisalong-runningservice,onwhichnodeitisru

scala - Spark : check your cluster UI to ensure that workers are registered

我在Spark中有一个简单的程序:/*SimpleApp.scala*/importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext._importorg.apache.spark.SparkConfobjectSimpleApp{defmain(args:Array[String]){valconf=newSparkConf().setMaster("spark://10.250.7.117:7077").setAppName("SimpleApplication").set("spark.cores.m

php - [OSX][PHP 5.5.5] 忽略 --with-config-file-scan-dir

我将OSXLion升级到Mavericks,并决定将我的PHP版本升级到当时的最新版本(5.5.5)我设法使所有依赖项、配置、制作和安装正常工作,但是在运行它之后,它忽略了扫描目录并使用了Apple最初设置的目录。苹果原创php-config显示--configure-options[...--with-config-file-scan-dir=/Library/Server/Web/Config/php...]php-i显示phpinfo()PHPVersion=>5.4.17System=>Darwinaeris-mba13.0.0DarwinKernelVersion13.0.0

php - 使用 laravel 拒绝 .composer/config 文件权限

我在ubuntuvirtualbox上有一个laravel项目。我曾经运行过composerupdate并且一切正常。我不知道有什么变化会影响这个但是现在当我运行composerupdate我得到file_get_contents(/home/user/.composer/config.json):无法打开流:权限被拒绝有人知道为什么吗?当我运行sudocomposerupdate时,它起作用了。 最佳答案 您的权限以某种方式更改(可能与运行composer无关)。将该文件的所有者设置为您的用户应该可以解决此问题:sudochown

php - Magento:通过本地副本获取 "overriding"核心 config.xml 文件?这个对吗?

我正在尝试重命名出现在我的Magento结帐单上的一些信用卡(例如,“Visa”变为“VisaDebit/Credit”)。为此,我发现您必须编辑/app/code/core/Mage/Payment/etc/config.xml中定义的名称.不想覆盖核心文件,我尝试将此文件复制到/app/code/local/Mage/Payment/etc/config.xml并在那里进行更改,但没有用。从研究中,我了解到Magento不会首先从本地文件夹自动加载配置文件?然后我发现您可以更改app/etc/modules/Mage_All.xml并指定local而不是core在下.我在本地文件夹