草庐IT

spark-framework

全部标签

java - 尝试在 Spark DataFrame 上使用 map

我最近开始尝试使用Spark和Java。我最初使用RDD完成了著名的WordCount示例,一切都按预期进行。现在我正在尝试实现我自己的示例,但使用的是DataFrames而不是RDD。所以我正在从文件中读取数据集DataFramedf=sqlContext.read().format("com.databricks.spark.csv").option("inferSchema","true").option("delimiter",";").option("header","true").load(inputFilePath);然后我尝试选择一个特定的列并对每一行应用一个简单的转换

java - 合并两个在 Apache spark 中具有不同列名的数据集

我们需要合并两个具有不同列名的数据集,数据集之间没有公共(public)列。我们尝试了几种方法,两种方法都没有产生结果。请告诉我们如何使用ApachesparkJava合并两个数据集输入数据集1"405-048011-62815","CRCIndustries","630-0746","Dixonvalue","4444-444","3MINdustries","555-55","Dixoncouplingvalve"输入数据集2"222-2222-5555","Tata","7777-88886","WestSide","22222-22224","Reliance","33333-

java - 线程主java.lang.exceptionininitializerError中的异常在没有hadoop的情况下安装spark

我正在尝试安装spark2.3.0,更具体地说,它是spark-2.3.0-bin-hadoppo2.7'D:\spark\bin'已经添加到环境变量PATH中。同时,安装了JDK-10。未安装Hadoop。但是谷歌说spark可以在没有hadoop的情况下工作。这是错误信息C:\Users\a>spark-shellExceptioninthread"main"java.lang.ExceptionInInitializerErroratorg.apache.hadoop.util.StringUtils.(StringUtils.java:80)atorg.apache.hadoo

java - Play Framework : Redirect to controller method with arguments

我正在使用PLAY框架2.2.1构建一个Web应用程序,并试图在地址栏中显示所请求站点的所有可用httpget查询参数,即使是那些未在请求中设置的参数。在这种情况下并非所有httpget参数都已设置,我想添加具有默认值的未设置参数并进行重定向。我有一个可以使用GET请求的站点:GET/testcontrollers.Application.test(q:String,w:String?=null,f:String?=null,o:String?=null)这是我希望在controllers.Application中使用的方法:publicstaticResulttest(Stringq

java - Spring Core Framework - beans 在哪里?

我是一名初级Java开发人员,我正在阅读来自spring.io的spring文档.我读到每个在*.xml中注册的beanspring用来解决依赖关系的文件是使用声明的标签。我的问题是:读取xml文件并实例化(创建)bean后,bean保存在哪个数据结构中?谢谢 最佳答案 不过如果你刚开始学习,你不应该太担心内部结构Spring但为了知识的缘故,几乎在所有情况下,基础类都是DefaultSingletonBeanRegistry正如您通过查看源代码所看到的那样here它维护一个单例对象的ConcurrentHashMap。还有类似的其

Java Apache Spark : Long transformation chains result in quadratic time

我有一个使用ApacheSpark的Java程序。该程序最有趣的部分如下所示:longseed=System.nanoTime();JavaRDDannotated=documents.mapPartitionsWithIndex(newInitialAnnotater(seed),true);annotated.cache();for(intiter=0;itera.sum(b));//updateoverallcounts(*)seed=System.nanoTime();//copyoverallcountswhichCountChangerusestocomputeastoch

java - Play Framework JPA : how to implement one-to-many relationship?

我有一个Posts模型,每个帖子还包含Blocks(也是一个模型)。我正在为这个网站使用PlayFramework,我想做的是在一个页面上显示X个帖子及其所有block。JPA(或PlayFramework的实现,不知道它是哪个)有find()方法,我可以用它在我的Controller中查询帖子,然后我会将帖子列表发送到我的像这样看:render(postList);我想知道什么是将每个帖子的block发送到View的最佳方式。我可以向我的Post模型添加一个getBlocks()方法,它发回一个blocksList,并从View中调用它,但这对我来说似乎很困惑,而且它会破坏MVC的目

java - 如何为初学者提供 : Accessing RESTful Web Services with Play Framework 2. 1

我对这个问题中使用的许多概念和技术还很陌生,所以我希望能为社区的初学者提供一些理解和帮助。我正在使用PlayFramework2.1.3版,我需要将数据发布到RESTfulWeb服务,以便它可以插入到远程数据库中。将返回一个XML响应,指示成功或失败。我相信您知道PlayFramework的文档非常缺乏并且对初学者毫无帮助,因此我不确定如何在考虑最佳实践的情况下完成这项任务。我正在寻找这个问题的Java解决方案,我目前没有时间学习Scala语言。我在Web服务方面的经验相当有限,通常我会在我的应用程序中实现DAO设计模式(或根据需要使用许多可用的ORM库之一)并使用JDBC直接连接到数

java - Play Framework 2.3 - CORS header

更新新的Play2.5提供了一个新的CORSFilter随着新的2.3Java版本完成了Response类到Promise类的迁移,以下代码不再有效。publicclassCorsActionextendsAction.Simple{publicResultcall(Contextcontext)throwsThrowable{Responseresponse=context.response();response.setHeader("Access-Control-Allow-Origin","*");//Handlepreflightrequestsif(context.reque

java - Spring Framework 过滤器,未注入(inject) bean

ServletFilter有2个条目,一个在web.xml中,一个在SpringapplicationContext.xml中我将过滤器添加到applicationContext.xml中,因为我想将creditProcessorbean注入(inject)其中。唯一的问题是web.xml中的条目被JBoss提取然后使用,因此creditProcessor为空。我是否必须使用Spring的delegatingFilterProxy或类似工具才能将内容注入(inject)到bean中,或者我是否可以调整web.xml?web.xml:CreditFiltercredit.filter.C