草庐IT

spark-packages

全部标签

java - Spark Web 框架单元测试

我正在使用Spark网络框架并创建一个RESTfulAPI。(http://sparkjava.com因为那里有多个名为“Spark”的东西)我的雇主的标准要求我们编写一系列每天自动运行一次的单元测试,以确认应用程序仍在运行。Spark很容易使用像Postman这样的工具来测试自己,但我还没有找到任何用Spark编写的JUnit测试的好例子,甚至是HTTP请求以编程方式使用它。有人做过吗?可能吗? 最佳答案 我们开发了一个小型库,可促进SparkController/端点的单元测试。Github此外,1.1.3版本发布在MavenC

java - 如何使用 Spark Java 返回静态 html 页面?

一个带有spark的HelloWorld:get(newRoute("/hello"){@OverridepublicObjecthandle(Requestrequest,Responseresponse){response.type("text/html");return"HelloSparkMVCFramework!";}});我怎样才能返回静态文件index.html呢?注意事项:我需要这个index.html放在jar里本着sparkjava的简单精神,我想尽可能避免通过模板,这对于静态页面来说太过分了。 最佳答案 我知道

Java、Spark 和 Cassandra java.lang.ClassCastException : com. datastax.driver.core.DefaultResultSetFuture 无法转换到阴影

我在尝试将数据写入我的Cassandra数据库时遇到错误。我在这里得到了什么:1)词典.javapackagecom.chatSparkConnactionTest;importjava.io.Serializable;publicclassDictionaryimplementsSerializable{privateStringvalue_id;privateStringd_name;privateStringd_value;publicDictionary(){}publicDictionary(Stringvalue_id,Stringd_name,Stringd_value)

【Spark系列1】DAG中Stage和Task的划分全流程

一、整体流程每个Aciton操作会创建一个JOB,JOB会提交给DAGScheduler,DAGScheduler根据RDD依赖的关系划分为多个Stage,每个Stage又会创建多个TaskSet,每个TaskSet包含多个Task,这个Task就是每个分区的并行计算的任务。DAGScheduler将TaskSet按照顺序提交给TaskScheduler,TaskScheduler将每一个任务去找SchedulerBackend申请执行所需要的资源,获取到资源后,SchedulerBackend将这些Task提交给Executor,Executor负责将这些任务运行起来。二、JOB提交2.1、

(超详细)Spark on Yarn安装配置

1,前期准备使用root用户完成相关配置,已安装配置Hadoop及前置环境2,spark上传解压到master服务器3,修改环境变量 /etc/profile末尾添加下面代码exportSPARK_HOME=.../spark-3.1.1-bin-hadoop3.2(注意:需要替换成你自己得路径)exportPATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin4,环境变量生效source/etc/profile5,运行spark-submit--version显示如下6,修改saprk-env.sh文件  在.../spark-3.1.1-bin-hadoop

java - Maven 在 `package` 目标期间复制 webapp 资源后如何做?

Maven将webapp资源复制到package目标内的war目录后,我该怎么办?我想在将webapp资源复制到目标的war目录之后,但就在它最终将所有内容归档到WAR文件之前做一些事情。 最佳答案 您遇到问题的原因是因为复制webapp资源是由warplugin完成的与它建立war的同时。它不是不同的生命周期阶段,甚至不是同一阶段中的两个不同操作。这都是war:wargoal的一部分.不过,有一个解决方法。如果绑定(bind)war:exploded到更早的阶段,比如prepare-package,然后它会构建你的exploded

java - "Package should contain a content type part [M1.13]"

我正在尝试写入Excel文件,但我一直收到错误消息:Exceptioninthread"main"org.apache.poi.POIXMLException:org.apache.poi.openxml4j.exceptions.InvalidFormatException:Packageshouldcontainacontenttypepart[M1.13]据我所知,我缺少一个jar文件。谁能帮我看看是哪个文件?附言我正在使用Netbeans。importjava.io.FileInputStream;importjava.io.FileNotFoundException;impo

java - Spark 2.0.0 Arrays.asList 不工作 - 不兼容的类型

以下代码适用于Spark1.5.2,但不适用于Spark2.0.0。我正在使用Java1.8。finalSparkConfsparkConf=newSparkConf();sparkConf.setMaster("local[4]");//FourthreadsfinalJavaSparkContextjavaSparkContext=newJavaSparkContext(sparkConf);finalJavaRDDjavaRDDLines=javaSparkContext.textFile("4300.txt");finalJavaRDDjavaRDDWords=javaRDDL

java - Java Spark Dataframe API (1.4.1) 中未定义的 max() 和 sum() 方法

将DataFrame.groupBy()的示例代码放入我的代码中,但它显示了max()和sum()的方法不明确的。df.groupBy("department").agg(max("age"),sum("expense"));如果要使用max()和sum()方法,应该导入哪个Java包?此示例代码的语法是否正确? 最佳答案 导入对我不起作用。EclipseIDE仍然显示编译错误。但下面的方法调用有效df.groupBy("Gender").agg(org.apache.spark.sql.functions.max(df.col("

java - Spark 将数据集转换为 RDD

我有一个数据集[String],需要转换成一个RDD[String]。怎么办?注意:我最近从spark1.6迁移到了spark2.0。我的一些客户期望使用RDD,但现在Spark给了我数据集。 最佳答案 如scalaAPIdocumentation中所述您可以在数据集上调用.rdd:valmyRdd:RDD[String]=ds.rdd 关于java-Spark将数据集转换为RDD,我们在StackOverflow上找到一个类似的问题: https://sta