草庐IT

apache-spark-2.3

全部标签

java - 无法将 Spring Boot Java 应用程序提交到 Spark 集群

我使用SpringBoot开发了一个Web应用程序,它使用ApacheSpark查询来自不同数据源(如Oracle)的数据。一开始我打算使用spark-submit脚本不提交就运行应用,但是好像不提交jar就连接不上Master集群了。我已经成功生成了一个uberjar,其中包含我正在使用的所有依赖项和子项目,但似乎Spark不喜欢SpringBoot应用程序。当我尝试提交应用程序时,spark显示以下错误:Exceptioninthread"main"java.lang.IllegalArgumentException:LoggerFactoryisnotaLogbackLogger

java - Apache CXF 客户端在测试需要服务器名称指示 (SNI) 的服务器时出错

我们有一个使用ApacheCXF制作的客户端,使用特定的服务器(即:https://serverexample.com/application/webservice?wsdl)工作正常。但是服务器已经转移到另一个IP,现在它在同一个IP中有两个带有TLS和SNI(服务器名称指示)的SSL证书,现在我们的应用程序失败并出现此错误:javax.net.ssl.SSLHandshakeException:java.security.cert.CertificateException:NosubjectalternativeDNSnamematchingserverexample.comfou

java - 在 Spark 中,是否可以在两个执行者之间共享数据?

我有一个非常大的只读数据,我希望同一节点上的所有执行程序都使用它。这在Spark中可能吗?我知道,你可以广播变量,但你能广播非常大的数组吗?在幕后,它是否在同一节点上的执行者之间共享数据?这如何能够在同一节点上运行的执行程序的JVM之间共享数据? 最佳答案 是的,你可以使用broadcast考虑数据时的变量是只读的(不可变的)。广播变量必须满足以下属性。适合内存不可变分发到集群因此,这里唯一的条件是您的数据必须能够适合一个节点上的内存。这意味着数据不应该像大表那样超大或超出内存限制。每个执行器都会收到广播变量的副本,并且该特定执行器

java - EIP/Apache Camel - 如何同时处理消息,但按组原子处理?

我有以下情况:有固定数量的组。有一个传入消息的TCP流。每条消息只与一个组相关。我开始Camel路线如下:publicclassMyMessageimplementsRunnable{publicvoidrun(){//omittedhere}}from("netty:tcp://localhost:7777?textline=true&sync=false")...//omittedhere:parsemessagetopojoMyMessage,setheader"group-identifier".to(seda:process);这个Camel路由消耗TCP流,解析每个传入消息

java - 空指针异常apache poi

嗨,我们一直在使用apachepoi读取我们的java程序的xls和xlsx文件,问题是我们得到空指针异常有两个原因。第一个是我们已经解决的空白单元格,另一个是是当我们选择某个没有任何记录的列时..我们的程序要求excel文件的路径,然后是文件的具体工作表编号和你要阅读的工作表的具体列号..这是读取xls文件的代码publicvoidreadXLSFile()throwsIOException{InputStreamExcelFileToRead=newFileInputStream(path);HSSFWorkbookwb=newHSSFWorkbook(ExcelFileToRea

java - 如何使用 apache avro 生成无模式的 avro 文件?

我正在使用Apacheavro进行数据序列化。因为,数据有一个固定的模式,我不希望模式成为序列化数据的一部分。在以下示例中,模式是avro文件“users.avro”的一部分。Useruser1=newUser();user1.setName("Alyssa");user1.setFavoriteNumber(256);Useruser2=newUser("Ben",7,"red");Useruser3=User.newBuilder().setName("Charlie").setFavoriteColor("blue").setFavoriteNumber(null).build(

java - 相当于 wsimport 的 org.apache.axis.components.net.SunFakeTrustSocketFactory

当我使用ApacheAxis生成Web服务客户端stub时,我通过调用以下方法使用客户端stub禁用我的代码中的服务器证书信任检查AxisProperties.setProperty("axis.socketSecureFactory","org.apache.axis.components.net.SunFakeTrustSocketFactory");如何禁用通过运行wsimport生成的客户端stub的信任检查?我在运行一些测试代码时使用它。 最佳答案 该类(class)中发生的所有事情都是提供伪造的truststoreman

java - ZooKeeper 食谱和 Apache Curator

我正在尝试确切地了解ApacheZooKeeper(“ZK”)解决了哪些类型的问题,也许还有他们的Recipespage是最好的起点。首先,我做出以下假设:ZooKeeperAPI(在Java和C中均可用)公开了these7simplemethods然后允许您建立自己的使用模式,称为“ZK食谱”然后由您使用这些ZKRecipes自己解决分布式编程中的问题或者,您可以只使用ApacheCurator附带的那些,而不是构建您自己的ZK食谱。因此,无论哪种方式,您都在使用ZKRecipes(还是自行开发或由Curator提供)来解决分布式计算问题我相信ApacheKafka就是一个例子,Ka

java - 在 Spark Scala 中处理微秒

我使用Scala将PostgreSQL表作为数据框导入到spark中。数据框看起来像user_id|log_dt--------|-------96|2004-10-1910:23:54.01020|2017-01-1212:12:14.931652我正在将此数据帧转换为log_dt的数据格式为yyyy-MM-ddhh:mm:ss.SSSSSS。为此,我使用以下代码使用unix_timestamp函数将log_dt转换为时间戳格式。valtablereader1=tablereader1Df.withColumn("log_dt",unix_timestamp(tablereader1

java - Android-Studio-2.3 错误 :java. util.concurrent.ExecutionException : java. lang.RuntimeException: AAPT 进程未准备好接收命令

您好,我是Android-Studio-2.3的新手我弹出了这些错误消息:错误:java.util.concurrent.ExecutionException:java.lang.RuntimeException:AAPT进程未准备好接收命令错误:任务':app:mergeDebugResources'执行失败。Error:java.util.concurrent.ExecutionException:java.lang.RuntimeException:AAPTprocessnotreadytoreceivecommands我访问了很多网站,但找不到解决这个问题的办法顺便说一下,我已