草庐IT

apache-spark-2.3

全部标签

java - 如何在 Apache Spark 中为两个具有不同结构的 DataFrame 实现 NOT IN

我在我的Java应用程序中使用ApacheSpark。我有两个DataFrame小号:df1和df2.df1包含Row与email,firstName和lastName.df2包含Row与email.我想创建一个DataFrame:df3包含df1中的所有行,df2中不存在哪个电子邮件.有没有办法用ApacheSpark做到这一点?我试图创建JavaRDD来自df1和df2通过类型转换它们toJavaRDD()和过滤df1包含所有电子邮件,然后使用subtract,但我不知道如何映射新的JavaRDD至ds1得到DataFrame.基本上我需要df1中的所有行谁的邮箱不在df2.Dat

java - Spark 应用程序 - Java.lang.OutOfMemoryError : Java heap space

我用的是SparkStandalone单机,128G内存,32核。以下是我认为与我的问题相关的设置:spark.storage.memoryFraction0.35spark.default.parallelism50spark.sql.shuffle.partitions50我有一个Spark应用程序,其中有一个用于1000个设备的循环。对于每个循环(设备),它都会准备特征向量,然后调用MLLib的k-Means。在循环的第25到30次迭代(处理第25到第30个设备)时,它遇到了“Java.lang.OutOfMemoryError:Java堆空间”的错误。我尝试将memoryFra

java - jsontostructs 到 spark 结构化流中的行

我正在使用Spark2.2,我正在尝试从Kafka读取JSON消息,将它们转换为DataFrame并将它们作为Row:spark.readStream().format("kafka").option("kafka.bootstrap.servers","localhost:9092").option("subscribe","topic").load().select(col("value").cast(StringType).as("col")).writeStream().format("console").start();有了这个我可以实现:+-----------------

java - 如何使用java生成像apache的htpasswd这样的哈希

我在htpasswd中使用“强制对密码进行MD5加密”来生成一个哈希值,例如“123”,我得到:使用htpasswd:123=>$apr1$kaTbKaLO$ewJXRZAKpjaxK4thy2jOp/使用MD5摘要:123=>202cb962ac59075b964b07152d234b70请告诉我如何使用java生成像apachehtpasswd这样的哈希谢谢。 最佳答案 Apache.htpasswd文件中的密码使用salt编码.如果您想使用Java生成这些密码,则需要执行相同的操作。Thissite解释了用于Apache的.h

java - Apache CXF : adding custom documentation in the WSDL?

我目前正在学习ApacheCXF。当CXF从Pojo生成WSDL文件时,有没有办法(java注释?)向WSDL文件添加自定义文档?描述服务或参数?我已经使用@WebParam设置了一些描述性名称,但我想添加更长的文档。像...@WebService@Documentation("Thisservicesayhello.Seehttp://say.hello")publicinterfaceMyService{@WebResult(name="helloMessage")@Documentation("Returnsthehellomessage")publicStringsayHell

java - 如何在 Tomcat 中获取 org.apache.catalina.connector.Request 对象?

我需要编写一个Servlet或Filter类来访问org.apache.catalina.connector.Request对象,该对象包装在提供给我的servlet的RequestFacade对象中。转换不起作用,因为RequestFacade不是Request的子类。我需要这个的原因是因为我试图调用Request的setRequestedSessionId()方法,这显然不是Httpservlet规范的一部分。我需要这样做的原因是因为sessionID包含在URL中,名称与JSESSIONID不同。我无法更改URL或参数名称,因此我尝试通过提取sessionID并调用Request

java - 在 java 程序中使用 Apache UIMA 的示例

我一直在寻找在Java程序中使用ApacheUIMA的示例。是否有关于如何在Java程序中使用示例注释器的示例? 最佳答案 如果您想直接在Java代码中使用UIMA,您可能想看看uimafit,因为它简化了在Java中使用UIMA的过程。这是使用示例注释器(source)的快速示例publicclassRoomNumberAnnotatorPipeline{publicstaticvoidmain(String[]args)throwsUIMAException{Stringtext="ThemeetingwasmovedfromY

java - Apache Maven : What is the difference between Inheritance, 聚合和依赖项?

我是Maven的新手,我想了解为什么我公司的模块被组织成“模块组”,而且每个子模块都显式声明其父模块。我不太明白POM引用关于differencebetweeninheritanceandaggregation的内容。.例如,一个父模块:example.grouputilpomUtilParentutil_clientutil_coreutil_server还有它的一个child:utilexample.grouptrunk-SNAPSHOTexample.group.utilutil_corejarUtilCore为什么要双向声明?它是多余的吗?更令人困惑的是,一些util子模块相互

java - 在 Apache Commons CLI 中只需要一个参数吗?

我只是想知道ApacheCommonsCLI库中是否有任何方法可以指定必须提供一个参数?例如我有2个命令行参数,但必须提供一个(不多也不少)?我想要ip或msisdn,但不是两者都想要,也不是两者都想要:OptionBuilder.hasArg(true);OptionBuilder.withDescription("Blabla");OptionBuilder.isRequired(false);commandLineOptions.addOption(OptionBuilder.create("ip"));OptionBuilder.hasArg(true);OptionBuild

java - 如何使用 Apache Ant 以 UTF-8 编码 Java 文件?

在我的build.xml文件中,我通过cxf获取了一些Java文件。其中一些Java文件需要以UTF-8编码。如何使用Ant将编码更改为UTF-8?PS:我找到了有关如何将javac的编码设置为UTF-8的说明,但在javac之前,我需要Java文件采用UTF-8。否则我会得到一个错误:warning:unmappablecharacterforencodingutf-8这是我的代码:我在这里应该做什么来制作用utf-8编码java文件? 最佳答案 Ant的任务具有属性encoding和outputencoding.单个Java文件