SPARK_DIST_CLASSPATH

java - 线程主java.lang.exceptionininitializerError中的异常在没有hadoop的情况下安装spark

我正在尝试安装spark2.3.0，更具体地说，它是spark-2.3.0-bin-hadoppo2.7'D:\spark\bin'已经添加到环境变量PATH中。同时，安装了JDK-10。未安装Hadoop。但是谷歌说spark可以在没有hadoop的情况下工作。这是错误信息C:\Users\a>spark-shellExceptioninthread"main"java.lang.ExceptionInInitializerErroratorg.apache.hadoop.util.StringUtils.(StringUtils.java:80)atorg.apache.hadoo

java.lang.IllegalStateException : Failed to load property source from location 'classpath:/application.yml' 错误

SpringCloud项目出现以下错误。在这个项目中，除了从GIT读取.properties文件外，我没有做任何特别的事情。请指导此处还有哪些需要更正的地方？java.lang.IllegalStateException:Failedtoloadpropertysourcefromlocation'classpath:/application.yml'atorg.springframework.boot.context.config.ConfigFileApplicationListener$Loader.load(ConfigFileApplicationListener.java:

IllegalStateException application RELEASE ConfigFileApplicationListener springframework java spring-boot

Java Apache Spark : Long transformation chains result in quadratic time

我有一个使用ApacheSpark的Java程序。该程序最有趣的部分如下所示:longseed=System.nanoTime();JavaRDDannotated=documents.mapPartitionsWithIndex(newInitialAnnotater(seed),true);annotated.cache();for(intiter=0;itera.sum(b));//updateoverallcounts(*)seed=System.nanoTime();//copyoverallcountswhichCountChangerusestocomputeastoch

transformation quadratic mapPartitionsWithIndex annotated code java apache-spark

java - Spark : get number of cluster cores programmatically

我在yarn集群中运行我的spark应用程序。在我的代码中，我使用队列的可用核心数在我的数据集上创建分区:Datasetds=...ds.coalesce(config.getNumberOfCores());我的问题:如何以编程方式而非配置方式获取队列的可用核心数？最佳答案有一些方法可以从Spark中获取集群中的执行器数量和核心数量。这是我过去使用过的一些Scala实用程序代码。您应该能够轻松地将其改编为Java。有两个关键思想:worker的数量是executor的数量减一或sc.getExecutorStorageStat

programmatically cluster code coresPerExecutor SparkContext java apache-spark dataset hadoop-yarn core

java - 加入数据框 spark java

Firstofall,thankyouforthetimeinreadingmyquestion.Myquestionisthefollowing:InSparkwithJava,iloadintwodataframethedataoftwocsvfiles.Thesedataframeswillhavethefollowinginformation.DataframeAirportId|Name|City-----------------------1|Barajas|MadridDataframeairport_city_stateCity|state---------------

java spark city dfairport code apache-spark dataframe spark-dataframe

java - org.apache.xbean.asm5.ClassReader 中的 Spark Java IllegalArgumentException

我正在尝试将Spark2.3.1与Java结合使用。我遵循示例inthedocumentation但在调用.fit(trainingData)时不断收到描述不佳的异常。Exceptioninthread"main"java.lang.IllegalArgumentExceptionatorg.apache.xbean.asm5.ClassReader.(UnknownSource)atorg.apache.xbean.asm5.ClassReader.(UnknownSource)atorg.apache.xbean.asm5.ClassReader.(UnknownSource)at

IllegalArgumentException ClassReader apache scala spark java apache-spark apache-spark-mllib apache-spark-ml

java - 尽管设置了 PATH 和 CLASSPATH，但无法执行 jar 文件

我的问题是关于在路径中包含jar文件。它有2个部分。1)我正在尝试执行位于/home/andy/software/weka/weka.jar的weka.jarjar文件PATH变量指向这个jar文件(即/home/andy/software/weka/weka.jar)，CLASSPATH也是如此。但是，当我尝试使用java-jarweka.jar运行jar时，出现错误“无法访问jarfileweka.jar”。知道发生了什么事吗？我在UbuntuLinux上。我环顾四周，似乎我没有做任何明显错误的事情(因为PATH和CLASSPATH似乎都设置正确)。2)我希望能够将我所有的jar文

CLASSPATH 尽管 jar weka java path

java - 如果我在 Spark 中两次缓存相同的 RDD 会发生什么

我正在构建一个通用函数，它接收一个RDD并对其进行一些计算。由于我在输入RDD上运行了多个计算，所以我想缓存它。例如:publicJavaRDDfoo(JavaRDDr){r.cache();JavaRDDt1=r...//SomecalculationsJavaRDDt2=r...//Othercalculationsreturnt1.union(t2);}我的问题是，因为r给我它可能已经或可能没有被缓存。如果它被缓存并且我再次对其调用缓存，将创建一个新的缓存层，这意味着t1和t2计算出我将有两个r的实例在缓存中？或者willspark会意识到r被缓存并会忽略它？

Spark java code section RDD caching apache-spark

java - 如何使用 java 从 Spark 中的列表或数组创建行

在Java中，我使用RowFactory.create()来创建行:Rowrow=RowFactory.create(record.getLong(1),record.getInt(2),record.getString(3));其中“record”是数据库中的一条记录，但我无法预先知道“record”的长度，所以我想使用一个列表或一个数组来创建“行”。在Scala中，我可以使用Row.fromSeq()从列表或数组创建行，但我如何在Java中实现这一点？最佳答案我们经常需要在现实世界的应用程序中创建数据集或数据帧。以下是如何在

建行 java section 中创 apache-spark apache-spark-mllib

java - 请求的路由还没有映射到 Spark 中

我想做点什么用spark+java+hibernate+postgres注册用户这是我的代码:post("/registrar",(request,response)->{EntityManagerFactoryemf=Persistence.createEntityManagerFactory("compradorcitoPU");EntityManagerem=emf.createEntityManager();em.getTransaction().begin();em.persist(u);em.getTransaction().commit();em.close();retu

Spark java section request hibernate postgresql persistence spark-java