spark-ui

java - Spark 应用程序 - Java.lang.OutOfMemoryError : Java heap space

我用的是SparkStandalone单机，128G内存，32核。以下是我认为与我的问题相关的设置:spark.storage.memoryFraction0.35spark.default.parallelism50spark.sql.shuffle.partitions50我有一个Spark应用程序，其中有一个用于1000个设备的循环。对于每个循环(设备)，它都会准备特征向量，然后调用MLLib的k-Means。在循环的第25到30次迭代(处理第25到第30个设备)时，它遇到了“Java.lang.OutOfMemoryError:Java堆空间”的错误。我尝试将memoryFra

java - jsontostructs 到 spark 结构化流中的行

我正在使用Spark2.2，我正在尝试从Kafka读取JSON消息，将它们转换为DataFrame并将它们作为Row:spark.readStream().format("kafka").option("kafka.bootstrap.servers","localhost:9092").option("subscribe","topic").load().select(col("value").cast(StringType).as("col")).writeStream().format("console").start();有了这个我可以实现:+-----------------

结构化 jsontostructs code 34 pre java apache-spark apache-spark-sql apache-spark-2.0 spark-structured-streaming

java - gwt uibinder ui :with - calling methods with arguments

我正在使用gwtuibinder。我想为一个字段动态设置值。我正在尝试这样的事情字段的值是这样设置的NameValueStore有两个方法publicStringgetValue(Stringkey){returnlocalizedValues.get(key);}publicStringgetValue(){returnnull;}问题是我无法调用getValue(key)。我只能调用no-args方法，这意味着以下是不可能的Name请澄清是否有一种方法可以实现这一点，我可以在其中调用传递给它的参数的方法。最佳答案不支持，只能

with arguments section code getValue java gwt

java - Clojure:类 CSS/DOM 的 Java UI

注意事项:答案不是clojurescript。我想用Clojure而不是ClojureScript编写代码。上下文:比起Java的Graphics2D，我更喜欢用户界面的CSS/DOM模型。问题:是否有某种方法/某个项目可以将某种WebKit嵌入到Java应用程序中？我希望能够用Java编写代码，但也希望能够拥有一个GUI，我可以通过CSS/DOM控制/操作它。谢谢! 最佳答案 JavaFX2.0scenegraph在概念上与DOM有点相似，您可以skinitusingCSS.有一个JavaAPI，因此您应该能够从Clojure中相

Clojure java section noreferrer user-interface

java - Find out if the calling thread is the SWT UI thread - 确定调用线程

我有这个模块用于应用程序COMM的多个部分(在SWTUi端、后端等)。这个模块有一个sendMessage方法，我想在其中添加一个例程来确定调用线程(只是为了在UI中使用它)是SWTUI线程。并警告程序员，他正在尝试从UI线程执行耗时的操作……这很糟糕:)当然，我想通过不在UI模块(来自COMM)上添加任何依赖项来做到这一点。如何确定调用线程是否是SWTUI线程？谢谢，米尔恰最佳答案您可以调用Display.getThread()来获取应用程序的当前UI线程。如果您不想依赖SWTUI，那么您将不得不使用反射。例如:publics

定调 thread section displayClass java swt

java - Spark : driver/worker configuration. 驱动程序是否在主节点上运行？

我在AWS上启动一个spark集群，有一个master和60个核心:下面是启动的命令，基本上每个核心2个executor，一共120个executor:spark-submit--deploy-modecluster--masteryarn-cluster--driver-memory180g--driver-cores26--executor-memory90g--executor-cores13--num-executors120然而，在作业跟踪器中，只有119个执行程序:我认为应该有1个驱动程序+120个工作执行程序。但是，我看到的是119个executor，其中包括1个driv

configuration 驱动 strong code image java scala amazon-web-services apache-spark

java - Spark SQL 失败，因为 "Constant pool has grown past JVM limit of 0xFFFF"

我在EMR4.6.0+Spark1.6.1上运行这段代码:valsqlContext=SQLContext.getOrCreate(sc)valinputRDD=sqlContext.read.json(input)try{inputRDD.filter("`first_field`isnotnullOR`second_field`isnotnull").toJSON.coalesce(10).saveAsTextFile(output)logger.info("DONE!")}catch{casee:Throwable=>logger.error("ERROR"+e.getMessa

amp Constant section code Spark java scala apache-spark amazon-emr

java - 尝试在 Spark DataFrame 上使用 map

我最近开始尝试使用Spark和Java。我最初使用RDD完成了著名的WordCount示例，一切都按预期进行。现在我正在尝试实现我自己的示例，但使用的是DataFrames而不是RDD。所以我正在从文件中读取数据集DataFramedf=sqlContext.read().format("com.databricks.spark.csv").option("inferSchema","true").option("delimiter",";").option("header","true").load(inputFilePath);然后我尝试选择一个特定的列并对每一行应用一个简单的转换

DataFrame Spark code section 34 java apache-spark java-8 apache-spark-sql

java - 合并两个在 Apache spark 中具有不同列名的数据集

我们需要合并两个具有不同列名的数据集，数据集之间没有公共(public)列。我们尝试了几种方法，两种方法都没有产生结果。请告诉我们如何使用ApachesparkJava合并两个数据集输入数据集1"405-048011-62815","CRCIndustries","630-0746","Dixonvalue","4444-444","3MINdustries","555-55","Dixoncouplingvalve"输入数据集2"222-2222-5555","Tata","7777-88886","WestSide","22222-22224","Reliance","33333-

列名 Apache 34 label sentence java apache-spark apache-spark-sql

java - 线程主java.lang.exceptionininitializerError中的异常在没有hadoop的情况下安装spark

我正在尝试安装spark2.3.0，更具体地说，它是spark-2.3.0-bin-hadoppo2.7'D:\spark\bin'已经添加到环境变量PATH中。同时，安装了JDK-10。未安装Hadoop。但是谷歌说spark可以在没有hadoop的情况下工作。这是错误信息C:\Users\a>spark-shellExceptioninthread"main"java.lang.ExceptionInInitializerErroratorg.apache.hadoop.util.StringUtils.(StringUtils.java:80)atorg.apache.hadoo

exceptionininitializerError java SparkSubmit apache spark apache-spark java-10

93 94 959697 98 99