我在Scala中使用XML,在具有有限内存资源的系统中解析可以达到~20MB的文件。我必须读取整个文件,并且必须从中提取所有数据。更具体地说,我必须读取的节点具有有限的属性和值。我想知道在性能方面最好的方法是什么(或者两者是否具有相同的性能)。我问这个是因为我不知道Scala如何处理它的XML库,而且我可能会遗漏一些细节。第一种方法deffirstApproach(root:Elem)=for{nif(node\"@attr").text=="type1"=>//dosomething//hereotherpossiblecases->type2,type3}第二种方法defsecon
我希望能够将XML文件通过管道传输到程序中,并使用XMLEventReader读取它。我能为XMLEventReader找到的唯一构造函数将Source作为参数,但scala.io.StdIn不是Source而且我找不到任何方法将它变成Source。可以做到吗?如果可以,怎么做? 最佳答案 您可以使用java.lang.System.in作为InputStream或scala.Console.in作为BufferedReader。更喜欢后者,因为它可以在测试中轻松修改(使用Console.withIn)。importjavax.xm
scala的解析器组合器能否解析xml并验证结束标记是否与开始标记同名?我并不直接需要它,但我想知道我的库的限制。 最佳答案 是的,它可以做到这一点。使用into或>>>(实际上是同一回事)根据已解析的值对后一个解析器进行参数化。 关于xml-Scala解析器组合器解析xml?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/5271010/
我使用scala.xml.PrettyPrinter在Scala中格式化我的XML。问题在于没有文本内容的节点。而不是这个:我更喜欢这个:我怎样才能使PrettyPrinter以我的方式格式化它? 最佳答案 这是scala-xml中的一个错误,但已在2018年2月20日的1.1.0版中修复。新选项minimizeEmpty已添加到PrettyPrinter.要使用1.1.0,请将以下内容添加到您的build.sbt:libraryDependencies++=Seq("org.scala-lang.modules"%%"scala-
我看到之前在这里讨论的以下示例,其目标是返回包含id为X且包含值Y的属性的所有节点://findallnodeswithanattribute"class"thatcontainsthevalue"test"valxml=XML.loadString("""hellohello""")defattributeEquals(name:String,value:String)(node:Node)={node.attribute(name).filter(_==value).isDefined}valtestResults=(xml\\"_").filter(attributeEquals
我已经编写了一个通用方法来通过scala.xml库生成Elem类型。但是Jersey使用JAXB,意味着将xml信息与Java对象绑定(bind)。我怎么能简单地响应scala的Elem类型避免构造对象?简单代码为:@GET@Path("sitemap.xml")@Produces(Array(MediaType.APPLICATION_XML))defsitemap(@Contextclient:DaoService[Future])={valx:Elem=Common.defaultXml()x} 最佳答案 您将需要一个自定义的
我尝试做的是使用XML解析器解析字符串。我只找到这种在scala中使用Spark进行解析的方法:valdf=sqlContext.read.format("com.databricks.spark.xml").option("rowTag","book").load("books.xml")我需要解析的是一个字符串,而不是一个文件那么,是否有加载字符串(而不是文件路径)的选项?谢谢! 最佳答案 从下面的字符串创建一个RDD,valxmlStringRDD=sc.parallelize(List("Yourxmlstring"))然后
我有这段代码涉及scala的Parsers类:traitSomeTraitextendsSomeTrait2{defmyParse={phrase(rep(ElemName(Some("http://someUri/"),"someNode1")~//compileswell,butfailssometimesatruntimeElemName(Some("http://someUri/"),"someNode2")^^{casep1~p2⇒//......})^^{casep1⇒//....})}}在哪里caseclassElemName(namespace:Option[Strin
我想用这个符号名定义一个函数而不使用反引号:def不幸的是,这会导致以下错误identifierexpectedbut$XMLSTART$.有没有办法阻止Scala将这个符号名称解析为XML?谢谢! 最佳答案 不,没有。不幸的是,你每次都必须用反棍来逃避它。def`测试它:scala>def`` 关于xml-阻止Scala解析XML,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/
是否可以将javax.xml.xpath.XPathExpression与scala.xml.NodeSeq一起使用?我想要一个允许我表达如下内容的API:valxml=...valxpath=XPathFactory.newInstance.newXPath.compile("""/this/that/theOther[@abc="123"]""")valselectedNodes:NodeSeq=xml.applyXpath(xpath) 最佳答案 Scala采用函数式方法来搜索XML。在相同的情况下,它不像XPath那样清晰,