行器_草庐IT

java - 如何启用执行器中的所有端点(Spring Boot 2.0.0 RC1)

我从1.5.10迁移到SpringBoot2.0.0RC1，但我被最新版本的执行器卡住了。如何启用公开和启用所有执行器端点？唯一暴露的端点是:{"_links":{"self":{"href":"http://127.0.0.1:8080/actuator","templated":false},"health":{"href":"http://127.0.0.1:8080/actuator/health","templated":false},"info":{"href":"http://127.0.0.1:8080/actuator/info","templated":false}

使用Kubernetes部署xxl-job-admin及xxl-job执行器服务

部署环境xxl-job-2.4.0kubernetes-1.26这里以xxl-job官方的2.4.0的代码为例子，在官方编写的Dockerfile基础上使用docker+kubernetes进行部署，++xxl-job-admin和执行器的Dockerfile、application等配置文件并不是关键，所以这里示例安装以官方Demo文件示例++编写Dockerfile、application文件xxl-job-admin-Dockerfile文件FROMopenjdk:8-jre-slimMAINTAINERxuxueliENVPARAMS=""ENVTZ=PRCRUNln-snf/usr/

xxl-job-admin Kubernetes job xxl xxl-job java

hadoop - 在 Spark-on-Yarn 中配置执行器和驱动程序内存

我对在Spark-1.5.2中配置执行程序和驱动程序内存感到困惑。我的环境设置如下:3NodeMAPRCluster-EachNode:Memory256G,16CPUHadoop2.7.0Spark1.5.2-Spark-on-Yarn输入数据信息:来自Hive的460GBParquet格式表我正在使用spark-sql通过spark-on-yarn查询hive上下文，但它比Hive慢很多，而且我不确定Spark的内存配置是否正确，这些是我的配置，exportSPARK_DAEMON_MEMORY=1gexportSPARK_WORKER_MEMORY=88gspark.execut

Spark-on-Yarn 驱动 spark section hadoop apache-spark apache-spark-sql mapr

hadoop - 如何在 Java 中获取 Spark 执行器的工作目录？

这个问题已经存在:Copyfiles(config)fromHDFStolocalworkingdirectoryofeverysparkexecutor关闭5年前。我需要知道Spark执行器的当前工作目录URI/URL，以便我可以在作业执行之前将一些依赖项复制到那里。我如何进入Java？我应该调用什么api？

何在 hadoop section notice directory apache-spark

apache-spark - 在 Spark 中比较执行器之间的数据

我们有一个spark应用程序，其中数据在不同的执行程序之间共享。但是我们还需要比较执行器之间的数据，其中一些数据存在于executor-1中，一些数据存在于executor-2中。我们想知道如何在spark中实现？例如:有一个包含以下详细信息的文件:Name,Date1,Date2A,2019-01-01,2019-01-23A,2019-02-12,2019-03-21A,2019-04-01,2019-05-31A,2019-06-02,2019-12-30B,2019-01-01,2019-01-21B,2019-02-10,2019-03-21B,2019-04-01,2019

中比 apache-spark 2019 section 01 hadoop

hadoop - 如何估计 Hortonworks Hadoop 集群上的 spark 执行器数量？

我设置了一个HortonworksHadoop集群:Hortonworks版本为2.3.2。1个NameNode，1个辅助NameNode，10个DataNodeSpark1.4.1并部署在所有数据节点上。YARN已安装。当我运行一个spark程序时，执行器只在4个节点上运行，而不是在整个数据节点上运行。如何估算此类Hadoop集群上的spark执行器数量？最佳答案你请求的执行者数量默认是4个，如果你想请求更多，你必须在命令行调用--num-executors=x参数或者设置spark.executors.instances在配

Hortonworks hadoop section spark apache-spark hadoop-yarn hortonworks-data-platform

java - 没有 Spring Boot 的 Spring Boot 执行器

我一直在开发Spring/SpringMVC应用程序，我希望添加性能指标。我遇到了SpringBootActuator，它看起来是一个很棒的解决方案。但是我的应用程序不是SpringBoot应用程序。我的应用程序在传统容器Tomcat8中运行。我添加了以下依赖项//SpringActuatorcompile"org.springframework.boot:spring-boot-starter-actuator:1.2.3.RELEASE"我创建了以下配置类。@EnableConfigurationProperties@Configuration@EnableAutoConfigur

Spring Boot section java spring-mvc spring-boot

java - 没有 Spring Boot 的 Spring Boot 执行器

我一直在开发Spring/SpringMVC应用程序，我希望添加性能指标。我遇到了SpringBootActuator，它看起来是一个很棒的解决方案。但是我的应用程序不是SpringBoot应用程序。我的应用程序在传统容器Tomcat8中运行。我添加了以下依赖项//SpringActuatorcompile"org.springframework.boot:spring-boot-starter-actuator:1.2.3.RELEASE"我创建了以下配置类。@EnableConfigurationProperties@Configuration@EnableAutoConfigur

Spring Boot section java spring-mvc spring-boot

java - 由于某些未知原因，Spark 作业在 saveAsHadoopDataset 阶段失败，因为执行器丢失

我有一个在yarn上运行的spark作业，它处理大约150gb的数据集，并进行多次随机播放操作，最后将数据存储到hbase中。它在saveAsHadoopDataset处一直失败基本上，多个执行程序在报告高GCActivity后在此阶段失败。但是，执行程序日志、驱动程序日志或节点管理器日志均未指示任何OutOfMemory错误或GCOverheadExceeded错误或超出内存限制错误。我在sparkui中也没有看到执行器失败的任何其他原因。valhConf=HBaseConfiguration.createhConf.setInt("hbase.client.scanner.cach

saveAsHadoopDataset Spark AbstractChannelHandlerContext java scala hadoop apache-spark

python - Spark - 为我的 Spark 作业分配了多少执行器和内核

Spark架构完全围绕执行器和内核的概念展开。我想看看在集群中运行的spark应用程序实际上有多少执行程序和内核在运行。我试图在我的应用程序中使用下面的代码片段，但没有成功。valconf=newSparkConf().setAppName("ExecutorTestJob")valsc=newSparkContext(conf)conf.get("spark.executor.instances")conf.get("spark.executor.cores")有没有办法使用SparkContext对象或SparkConf对象等获取这些值。最佳答案

Spark python code section scala hadoop apache-spark executors