spark-structured-streaming

java - 如何在 Java 8 Stream.flatMap(..) 中捕获异常

给定一个Stream和一个返回Stream作为数据源的不同参数的方法，我正在寻找一种通过flatMap合并流的方法(..)并在执行期间捕获某些Exceptions。让我们看下面的代码片段:publicclassFlatMap{publicstaticvoidmain(finalString[]args){longcount;//thismightthrowanexceptioncount=Stream.of(0.2,0.5,0.99).flatMap(chance->getGenerator(chance,20)).count();//tryingtocatchtheexception

何在 flatMap code Stream section java exception java-8 java-stream

java - 使用 Java8 stream api 将函数列表应用于值

我想要一个单条日志消息pojoLoggedExchange并对其应用一系列转换。转换是列表中的一元运算符:Listtransforms=newArrayList();哪里ConditionalTransform工具UnaryOperator我目前的解决方案是像这样使用reduce:publicLoggedExchangetransform(LoggedExchangeoriginal){returntransforms.stream().reduce(original,(o,t)->t.apply(o),(m1,m2)->m2);}并行运行它没有意义，因为无法合并两条消息((m1,m2

stream Java8 code LoggedExchange section java java-8 reduce

java - 如何使用 Java 8 Stream 扩展和重组列表列表？

我有一个A类列表，其中包括一个列表本身。publicclassA{publicdoubleval;publicStringid;publicListnames=newArrayList();publicA(doublev,StringID,Stringname){val=v;id=ID;names.add(name);}staticpublicListcreateAnExample(){Listitems=newArrayList();items.add(newA(8.0,"x1","y11"));items.add(newA(12.0,"x2","y21"));items.add(n

Stream java items names code lambda java-8 java-stream

java - Apache Spark - 内存异常错误 - IntelliJ 设置

当我尝试运行使用ApacheSpark的测试时，我遇到了以下异常:Exceptionencounteredwheninvokingrunonanestedsuite-Systemmemory259522560mustbeatleast4.718592E8.Pleaseusealargerheapsize.java.lang.IllegalArgumentException:Systemmemory259522560mustbeatleast4.718592E8.Pleaseusealargerheapsize.我可以通过更改配置中的vm选项来绕过错误，使其具有:-Xms128m-Xmx

IntelliJ Apache strong section code java intellij-idea apache-spark jvm virtual-machine

java - 如何将这个经典的 Java 代码重写为 Java Stream API 代码？

有一段旧的Java代码(没有lambda表达式):publicListgetAttackedCheckersForPoint(CheckerPositionfrom,booleanisSecondPlayerOwner,booleanisQueen,VectorDirectionignoredDirection){ListallDirections=VectorDirection.generateAllDirections();Listresult=newArrayList();for(VectorDirectiondirection:allDirections){if(!direct

Java Stream code VectorDirection section collections lambda java-8 java-stream

java - spark - 如何减少 JavaPairRDD<Integer, Integer[]> 的洗牌大小？

我有一个JavaPairRDD我想在其上执行groupByKey行动。groupByKey行动给我一个:org.apache.spark.shuffle.MetadataFetchFailedException:Missinganoutputlocationforshuffle如果我没记错的话，这实际上是一个OutOfMemory错误。这只发生在大数据集中(在我的例子中，WebUI中显示的“ShuffleWrite”约为96GB)。我已经设置:spark.serializerorg.apache.spark.serializer.KryoSerializer在$SPARK_HOME/c

Integer 洗牌 code blockquote strong java scala apache-spark kryo

java - 仅使用两个键和奇数或偶数列表索引作为值将 List 转换为 Map - Java 8 Stream

我想将列表转换为map，只使用两个字符串值作为键值。然后作为值只是包含来自输入列表的奇数或偶数索引位置的元素的字符串列表。这是旧时尚代码:Map>map=newHashMap();Listlist=Arrays.asList("one","two","three","four");map.put("evenIndex",newArrayList());map.put("oddIndex",newArrayList());for(inti=0;i如何使用流将此代码转换为Java8以获得此结果？{evenIndex=[one,three],oddIndex=[two,four]}我目前

Stream java 34 code section collections java-8 java-stream

java - 为什么我不能再从 AWS S3 in Spark 应用程序读取数据？

我已经升级到ApacheSpark1.5.1，但我不确定这是否导致了它。我在spark-submit中有我的访问key，它一直有效。Exceptioninthread"main"java.lang.NoSuchMethodError:org.jets3t.service.impl.rest.httpclient.RestS3Service.(Lorg/jets3t/service/security/AWSCredentials;)VSQLContextsqlContext=newSQLContext(sc);DataFramedf=sqlContext.read().format("c

Spark java apache scala amazon-s3 apache-spark

java - 在 Spark/Jetty-server 中重新加载静态文件

我在这里描述了一些类似的问题:RefreshstaticfilesservedbySparkJava在我的应用程序中，用户可以将内容上传到一个文件夹，该文件夹也提供给用户Spark.staticFileLocation("/public");特征。我知道SparkJava在启动时只从该文件夹中读取一次“静态”内容，并且它不知道那里的变化。是否可以要求Spark(或通过Spark的Jetty)重新加载静态文件夹中的更改？最佳答案移动到externalStaticFileLocation("/var/www/public");

Jetty-server server section stackoverflow questions java jetty static-content spark-java

java - 从另一个应用程序启动它时如何正确等待 apache spark 启动器作业？

当我等待我的sparkapache工作完成但没有成功时，我试图避免使用“while(true)”解决方案。我有一个spark应用程序，它假设要处理一些数据并将结果放入数据库，我确实从我的spring服务调用它，并想等到工作完成。例子:带有方法的启动器:@Overridepublicvoidrun(UUIDdocId,Stringquery)throwsException{launcher.addAppArgs(docId.toString(),query);SparkAppHandlesparkAppHandle=launcher.startApplication();sparkApp

启动器 apache SparkAppHandle handle 34 java apache-spark spark-launcher