草庐IT

java - 如何启用执行器中的所有端点(Spring Boot 2.0.0 RC1)

我从1.5.10迁移到SpringBoot2.0.0RC1,但我被最新版本的执行器卡住了。如何启用公开和启用所有执行器端点?唯一暴露的端点是:{"_links":{"self":{"href":"http://127.0.0.1:8080/actuator","templated":false},"health":{"href":"http://127.0.0.1:8080/actuator/health","templated":false},"info":{"href":"http://127.0.0.1:8080/actuator/info","templated":false}

使用Kubernetes部署xxl-job-admin及xxl-job执行器服务

部署环境xxl-job-2.4.0kubernetes-1.26这里以xxl-job官方的2.4.0的代码为例子,在官方编写的Dockerfile基础上使用docker+kubernetes进行部署,++xxl-job-admin和执行器的Dockerfile、application等配置文件并不是关键,所以这里示例安装以官方Demo文件示例++编写Dockerfile、application文件xxl-job-admin-Dockerfile文件FROMopenjdk:8-jre-slimMAINTAINERxuxueliENVPARAMS=""ENVTZ=PRCRUNln-snf/usr/

hadoop - 在 Spark-on-Yarn 中配置执行器和驱动程序内存

我对在Spark-1.5.2中配置执行程序和驱动程序内存感到困惑。我的环境设置如下:3NodeMAPRCluster-EachNode:Memory256G,16CPUHadoop2.7.0Spark1.5.2-Spark-on-Yarn输入数据信息:来自Hive的460GBParquet格式表我正在使用spark-sql通过spark-on-yarn查询hive上下文,但它比Hive慢很多,而且我不确定Spark的内存配置是否正确,这些是我的配置,exportSPARK_DAEMON_MEMORY=1gexportSPARK_WORKER_MEMORY=88gspark.execut

hadoop - 如何在 Java 中获取 Spark 执行器的工作目录?

这个问题已经存在:Copyfiles(config)fromHDFStolocalworkingdirectoryofeverysparkexecutor关闭5年前。我需要知道Spark执行器的当前工作目录URI/URL,以便我可以在作业执行之前将一些依赖项复制到那里。我如何进入Java?我应该调用什么api?

apache-spark - 在 Spark 中比较执行器之间的数据

我们有一个spark应用程序,其中数据在不同的执行程序之间共享。但是我们还需要比较执行器之间的数据,其中一些数据存在于executor-1中,一些数据存在于executor-2中。我们想知道如何在spark中实现?例如:有一个包含以下详细信息的文件:Name,Date1,Date2A,2019-01-01,2019-01-23A,2019-02-12,2019-03-21A,2019-04-01,2019-05-31A,2019-06-02,2019-12-30B,2019-01-01,2019-01-21B,2019-02-10,2019-03-21B,2019-04-01,2019

hadoop - 如何估计 Hortonworks Hadoop 集群上的 spark 执行器数量?

我设置了一个HortonworksHadoop集群:Hortonworks版本为2.3.2。1个NameNode,1个辅助NameNode,10个DataNodeSpark1.4.1并部署在所有数据节点上。YARN已安装。当我运行一个spark程序时,执行器只在4个节点上运行,而不是在整个数据节点上运行。如何估算此类Hadoop集群上的spark执行器数量? 最佳答案 你请求的执行者数量默认是4个,如果你想请求更多,你必须在命令行调用--num-executors=x参数或者设置spark.executors.instances在配

java - 没有 Spring Boot 的 Spring Boot 执行器

我一直在开发Spring/SpringMVC应用程序,我希望添加性能指标。我遇到了SpringBootActuator,它看起来是一个很棒的解决方案。但是我的应用程序不是SpringBoot应用程序。我的应用程序在传统容器Tomcat8中运行。我添加了以下依赖项//SpringActuatorcompile"org.springframework.boot:spring-boot-starter-actuator:1.2.3.RELEASE"我创建了以下配置类。@EnableConfigurationProperties@Configuration@EnableAutoConfigur

java - 没有 Spring Boot 的 Spring Boot 执行器

我一直在开发Spring/SpringMVC应用程序,我希望添加性能指标。我遇到了SpringBootActuator,它看起来是一个很棒的解决方案。但是我的应用程序不是SpringBoot应用程序。我的应用程序在传统容器Tomcat8中运行。我添加了以下依赖项//SpringActuatorcompile"org.springframework.boot:spring-boot-starter-actuator:1.2.3.RELEASE"我创建了以下配置类。@EnableConfigurationProperties@Configuration@EnableAutoConfigur

java - 由于某些未知原因,Spark 作业在 saveAsHadoopDataset 阶段失败,因为执行器丢失

我有一个在yarn上运行的spark作业,它处理大约150gb的数据集,并进行多次随机播放操作,最后将数据存储到hbase中。它在saveAsHadoopDataset处一直失败基本上,多个执行程序在报告高GCActivity后在此阶段失败。但是,执行程序日志、驱动程序日志或节点管理器日志均未指示任何OutOfMemory错误或GCOverheadExceeded错误或超出内存限制错误。我在sparkui中也没有看到执行器失败的任何其他原因。valhConf=HBaseConfiguration.createhConf.setInt("hbase.client.scanner.cach

python - Spark - 为我的 Spark 作业分配了多少执行器和内核

Spark架构完全围绕执行器和内核的概念展开。我想看看在集群中运行的spark应用程序实际上有多少执行程序和内核在运行。我试图在我的应用程序中使用下面的代码片段,但没有成功。valconf=newSparkConf().setAppName("ExecutorTestJob")valsc=newSparkContext(conf)conf.get("spark.executor.instances")conf.get("spark.executor.cores")有没有办法使用SparkContext对象或SparkConf对象等获取这些值。 最佳答案