spark-app

java - Google App Engine 奇怪的延迟

我改进了很多我的代码，现在所有的API都运行得非常快，我还添加了memcache并且我有一个很好的命中率..但有时我会遇到毫无意义的延误。我在此处附上最重要的appstats屏幕截图:运行90毫秒的RPC总共需要20多秒；这怎么可能？我应该在哪里寻找这些延迟的根源？我真的被卡住了，因为我不明白RPC之间发生了什么，我不知道我还能做些什么来获得更多信息。只是想一想:每个HTTP调用都由同一个GAE实例处理，对吗？因为我的实例花了很多时间来预热..但我不认为这是相关的顺便说一句:我正在用Java编写代码。最佳答案通常，appstat

java - 与缓存相关的 HTTP header 在 App Engine 上的 Servlet 响应中被覆盖

我在AppEngine上有一个服务于图像的servlet。servlet正确设置HTTPheader值以指示应缓存图像。但是AppEngine覆盖了这些header，导致图像未被缓存。请注意，相同的代码以前可以工作，但现在有一段时间不工作了。App引擎文档指出，如果Cache-Control、Expires和Varyheader由servlet设置，它们将保持不变:https://developers.google.com/appengine/docs/java/runtime#Responses这是我的示例代码:response.setContentType("image/jpeg"

Servlet Engine code header section java google-app-engine http servlets http-headers

java - CloudBees 和 App Cells、实例和池

我试图理解以下两者之间的区别:一个app-cell一个应用实例；和一个应用程序池例如，我如何知道何时适合为我的应用添加更多应用单元？或者添加更多实例？或者将它们的某个子集配置到一个池中？提前致谢! 最佳答案大多数情况下，应用程序单元是衡量内存以及IO和CPU的“公平份额”的单位。1个单元是128meg-ish-因此8个单元将是它的8倍(不仅包括内存等)。应用程序实例是在服务器上运行的JVM(因此，如果您有3个实例，如果它是Java应用程序，则为3个JVM)——但它们是具有相同“大小”的JVM的3个实例——因此一个单元实际上是尺寸的

CloudBees Cells section stackoverflow 时适 java paas autoscaling pooling

Java 6 应用程序无法从任何版本的 SDK 部署到 Google App Engine

当我尝试在AppEngine中部署Java6应用程序时。我得到了这样的错误Java6applicationsarepreventedfrombeingdeployedtoGoogleAppEnginefromanyversionoftheSDK,includingolderones.IfyouneedtocontinuetodeployJava6applicationsforcompatibilityreasons,youcanrequestthatyourapplicationbewhitelistedforJava6deploymentbyvisitinglink.然后我在项目设置

Google Engine section strong https java google-app-engine java-6

java - HashMap 作为 Spark Streaming 中的广播变量？

我有一些数据需要在sparkstreaming中分类。分类键值在程序开始时加载到HashMap中。因此，每个传入的数据包都需要与这些key进行比较并进行相应标记。我意识到spark有称为广播变量和累加器的变量来分发对象。教程中的示例使用简单的变量，例如etc。如何使用HashMap在所有sparkworker上共享我的HashMap。或者，是否有更好的方法来执行此操作？我正在用Java编写我的SparkStreaming应用程序。最佳答案在spark中，您可以用相同的方式广播任何可序列化的对象。这是最好的方法，因为您只需将数据发

Streaming HashMap section 斯卡拉 java apache-spark spark-streaming

java - "spark.memory.fraction"好像没有作用

在Spark中，当我从一个函数中从HDFS读取一个大约1GB的字符串时，我遇到了java.lang.OutOfMemoryError:Javaheapspace错误。我使用的执行程序内存是6GB。为了增加用户内存，我什至将spark.memory.fraction减少到0.3，但我仍然遇到同样的错误。似乎降低该值没有效果。我正在使用Spark1.6.1并使用Spark1.6核心库进行编译。我在这里做错了什么吗？最佳答案请参阅SparkConfSparkExecutorOOM:如何在Spark上设置内存参数一旦应用程序运行，您将看

amp fraction spark code Memory java scala apache-spark

java - 比较 Spark 中的两个数据帧(性能)

我需要比较我的spark应用程序中的两个数据帧。我浏览了以下帖子。HowtoobtainthedifferencebetweentwoDataFrames?但是，我不明白为什么最佳答案中的方法df1.unionAll(df2).except(df1.intersect(df2))比问题中的那个好df1.except(df2).union(df2.except(df1))谁能解释一下？据我了解，后者适用于两个较小的数据集，而前者适用于大型数据集。是因为后者将不同作为联合的一部分吗？即使那样，如果两个数据框有相同记录的可能性更大，那么在后一种情况下我们处理的是一个小数据集。

Spark java code section df scala performance apache-spark apache-spark-sql

java - 如何从 eclipse 程序构建 Mac OS X .app

我的程序在Eclipse中运行良好。但是，如果我尝试将它导出为可运行的jar，当我双击它时jar不会打开。有没有办法在Eclipse中直接导出到.app？最佳答案 gradle-macappbundleplugin是我知道如何做到这一点的最简单方法。它连接到您的构建系统并为您生成.app。如果您想推出自己的解决方案，Apple的JavaDeploymentOptionsforOSX为您提供有关执行此操作所需的所有信息。基本上，.app只是一个包含JAR的文件夹，一些XML文件提供了类路径等。您可以阅读该指南了解所有详细信息。

eclipse java section noreferrer https macos slick2d

java - Apache Spark - 内存异常错误 - IntelliJ 设置

当我尝试运行使用ApacheSpark的测试时，我遇到了以下异常:Exceptionencounteredwheninvokingrunonanestedsuite-Systemmemory259522560mustbeatleast4.718592E8.Pleaseusealargerheapsize.java.lang.IllegalArgumentException:Systemmemory259522560mustbeatleast4.718592E8.Pleaseusealargerheapsize.我可以通过更改配置中的vm选项来绕过错误，使其具有:-Xms128m-Xmx

IntelliJ Apache strong section code java intellij-idea apache-spark jvm virtual-machine

java - spark - 如何减少 JavaPairRDD<Integer, Integer[]> 的洗牌大小？

我有一个JavaPairRDD我想在其上执行groupByKey行动。groupByKey行动给我一个:org.apache.spark.shuffle.MetadataFetchFailedException:Missinganoutputlocationforshuffle如果我没记错的话，这实际上是一个OutOfMemory错误。这只发生在大数据集中(在我的例子中，WebUI中显示的“ShuffleWrite”约为96GB)。我已经设置:spark.serializerorg.apache.spark.serializer.KryoSerializer在$SPARK_HOME/c

Integer 洗牌 code blockquote strong java scala apache-spark kryo

78 79 808182 83 84