spark-ui

java - 调试 UI 并在按下某个键时暂停

我真的不是调试专家，最近我遇到了一个问题，希望有一个简单的解决方案。当我测试和调试MathematicapluginforIDEA，我写了一些代码，构建它并在沙箱IDEA中运行它。对于那些不熟悉为IDEA编写插件的人:主要问题是，所有的UI代码都已经存在，因为它是IDEA自带的。我的插件只实现了让IDEA理解Mathematica语言所需的特定接口(interface)。因此，不可能像@Jeroen建议的那样在onClickListener中设置断点或扔东西，因为我几乎没有编写任何一行UI代码*。现在我的情况是一切正常，但是当我取消特定操作时，会发生一些奇怪的事情。我不知道在我按Esc

java UI section code EventQueue debugging intellij-idea

java - HashMap 作为 Spark Streaming 中的广播变量？

我有一些数据需要在sparkstreaming中分类。分类键值在程序开始时加载到HashMap中。因此，每个传入的数据包都需要与这些key进行比较并进行相应标记。我意识到spark有称为广播变量和累加器的变量来分发对象。教程中的示例使用简单的变量，例如etc。如何使用HashMap在所有sparkworker上共享我的HashMap。或者，是否有更好的方法来执行此操作？我正在用Java编写我的SparkStreaming应用程序。最佳答案在spark中，您可以用相同的方式广播任何可序列化的对象。这是最好的方法，因为您只需将数据发

Streaming HashMap section 斯卡拉 java apache-spark spark-streaming

java - 我如何在 Eclipse jdt ui 中获取父类(super class)节点？

我这里有一个代码:publicclassTestOverride{intfoo(){return-1;}}classBextendsTestOverride{@Overrideintfoo(){//error-quickfixtoadd"returnsuper.foo();"}}如您所见，我已经提到了错误。我正在尝试在eclipsejdtui中为此创建一个quickfix。但是我无法获得类TestOverride的类B的父类(superclass)节点。我试过下面的代码if(selectedNodeinstanceofMethodDeclaration){ASTNodetype=sel

何在 Eclipse code section TestOverride java eclipse-jdt

java - "spark.memory.fraction"好像没有作用

在Spark中，当我从一个函数中从HDFS读取一个大约1GB的字符串时，我遇到了java.lang.OutOfMemoryError:Javaheapspace错误。我使用的执行程序内存是6GB。为了增加用户内存，我什至将spark.memory.fraction减少到0.3，但我仍然遇到同样的错误。似乎降低该值没有效果。我正在使用Spark1.6.1并使用Spark1.6核心库进行编译。我在这里做错了什么吗？最佳答案请参阅SparkConfSparkExecutorOOM:如何在Spark上设置内存参数一旦应用程序运行，您将看

amp fraction spark code Memory java scala apache-spark

java - 尝试使用 Spring-WS - "Connection timed out"访问 WS 服务器，但服务器在使用 SOAP UI 测试时响应

问题我正在接管JavaWeb服务客户端的开发工作，为了测试改进，我必须从远程Web服务服务器(嵌入在运行在tomcat实例中的ApacheAxis2中)请求一个方法。首先，我使用服务器提供的WSDL通过SOAPUI请求该方法。它工作正常。现在我尝试通过我的JavaWeb服务客户端请求该方法，但我无法连接到服务器，即使使用SOAPUI的测试证明一切正常。JavaWeb服务客户端依赖于Spring-WS。从客户端调用网络服务//SettingthekycScoreRequest...//TryingtoconnectandtogetthekycScoreResponseKycScoreRe

Connection Spring-WS java WebServiceTemplate code spring web-services soap wsdl

java - 比较 Spark 中的两个数据帧(性能)

我需要比较我的spark应用程序中的两个数据帧。我浏览了以下帖子。HowtoobtainthedifferencebetweentwoDataFrames?但是，我不明白为什么最佳答案中的方法df1.unionAll(df2).except(df1.intersect(df2))比问题中的那个好df1.except(df2).union(df2.except(df1))谁能解释一下？据我了解，后者适用于两个较小的数据集，而前者适用于大型数据集。是因为后者将不同作为联合的一部分吗？即使那样，如果两个数据框有相同记录的可能性更大，那么在后一种情况下我们处理的是一个小数据集。

Spark java code section df scala performance apache-spark apache-spark-sql

java - Apache Spark - 内存异常错误 - IntelliJ 设置

当我尝试运行使用ApacheSpark的测试时，我遇到了以下异常:Exceptionencounteredwheninvokingrunonanestedsuite-Systemmemory259522560mustbeatleast4.718592E8.Pleaseusealargerheapsize.java.lang.IllegalArgumentException:Systemmemory259522560mustbeatleast4.718592E8.Pleaseusealargerheapsize.我可以通过更改配置中的vm选项来绕过错误，使其具有:-Xms128m-Xmx

IntelliJ Apache strong section code java intellij-idea apache-spark jvm virtual-machine

java - spark - 如何减少 JavaPairRDD<Integer, Integer[]> 的洗牌大小？

我有一个JavaPairRDD我想在其上执行groupByKey行动。groupByKey行动给我一个:org.apache.spark.shuffle.MetadataFetchFailedException:Missinganoutputlocationforshuffle如果我没记错的话，这实际上是一个OutOfMemory错误。这只发生在大数据集中(在我的例子中，WebUI中显示的“ShuffleWrite”约为96GB)。我已经设置:spark.serializerorg.apache.spark.serializer.KryoSerializer在$SPARK_HOME/c

Integer 洗牌 code blockquote strong java scala apache-spark kryo

java - 为什么我不能再从 AWS S3 in Spark 应用程序读取数据？

我已经升级到ApacheSpark1.5.1，但我不确定这是否导致了它。我在spark-submit中有我的访问key，它一直有效。Exceptioninthread"main"java.lang.NoSuchMethodError:org.jets3t.service.impl.rest.httpclient.RestS3Service.(Lorg/jets3t/service/security/AWSCredentials;)VSQLContextsqlContext=newSQLContext(sc);DataFramedf=sqlContext.read().format("c

Spark java apache scala amazon-s3 apache-spark

java - 在 Spark/Jetty-server 中重新加载静态文件

我在这里描述了一些类似的问题:RefreshstaticfilesservedbySparkJava在我的应用程序中，用户可以将内容上传到一个文件夹，该文件夹也提供给用户Spark.staticFileLocation("/public");特征。我知道SparkJava在启动时只从该文件夹中读取一次“静态”内容，并且它不知道那里的变化。是否可以要求Spark(或通过Spark的Jetty)重新加载静态文件夹中的更改？最佳答案移动到externalStaticFileLocation("/var/www/public");

Jetty-server server section stackoverflow questions java jetty static-content spark-java

91 92 939495 96 97