草庐IT

java - 用于 Java 的小型、简约和快速的 XML 库?

有时我需要解析XML文件-并且只解析,我不想通过String.indexOf手动执行此操作。所以我需要使用可能最小和快速的XML解析库。不幸的是,我不知道任何类似于GSON(180kb)的东西。我已经导入了dom4j,但是之后我得到了异常:java.lang.NoClassDefFoundError:org/jaxen/JaxenException所以我添加了jaxen依赖项(maven),这是非常令人震惊的体验:添加了大约7MB的依赖项,其中最大的是xercesImpl和icu4j.另一个猜测是Jericho,但这主要是为解析格式错误的HTML而设计的,而且它超过2MB-肯定会有更小

xml - 使用什么算法根据 XSD 验证 XML?

我正在编写自己的验证XML解析器。(是的,我知道这是一项非常复杂的任务,使用libxml2或Xerces等现有产品将是更明智的选择。但这不是一个选择,所以请多多包涵。)将XML和XSD文件解析为树结构应该不是很困难。但是,我似乎无法弄清楚要使用什么算法来根据XSD验证XML树。我做了一些研究,但我发现的所有内容要么过于笼统(如何编写编译器等),要么过于具体(例如增量验证)。我有一些自己的想法,但它们都相当复杂,所以我真的很想在开始编码之前更加确定我的想法的有效性(无双关语)。在此先致谢,如果您认为可以提供帮助,请随时询问更多详情! 最佳答案

java - 我应该从哪里下载什么 jar 文件?

importjavax.xml.parsers.DocumentBuilderFactory;importjavax.xml.parsers.DocumentBuilder;importorg.w3c.dom.Document;importorg.w3c.dom.NodeList;importorg.w3c.dom.Node;importorg.w3c.dom.Element;importjava.io.File;我想使用上面的内容。那么,我应该从哪里下载什么jar文件?? 最佳答案 javax.xml、org.w3c和java.i

python - 使用带有不正确标签的 Python ElementTree 解析 XML

我正在尝试使用Python来解析XML文件,以从XML提要中获取标题、作者、URL和摘要。然后我确保我们收集数据的XML是这样的:OurSiteRSS2013-08-14T20:05:08-04:00urn:uuid:c60d7202-9a58-46a6-9fca-f804s879f5ebcOriginalcontentavailablefornon-commercialuseunderaCreativeCommonslicense(Attribution-NonCommercial-NoDerivs3.0Unported),exceptwherenoted.Headline#1Joh

python - 在 Python 中从 XML 中获取文本值

fromxml.dom.minidomimportparseStringdom=parseString(data)data=dom.getElementsByTagName('data')“数据”变量作为元素对象返回,但我终究无法在文档中看到获取元素的文本值。例如:IWANTTHIS有人有什么想法吗? 最佳答案 所以看待它的方式是“IWANTTHIS”实际上是另一个节点。它是“数据”的文本子项。fromxml.dom.minidomimportparseStringdom=parseString(data)nodes=dom.get

java - VTD-XML 可以将字符串作为输入吗?

嘿,我正在尝试使用VTD-XML来解析作为字符串提供给它的XML,但我找不到如何去做。任何帮助将不胜感激。http://vtd-xml.sourceforge.net 最佳答案 VTD-XML库似乎可以让您读取字节数组数据。在这种情况下,我建议使用正确的编码将字符串转换为字节。如果在XML字符串的开头有一个编码信号:然后使用它:myString.getBytes("UTF-8")如果没有编码,请使用一个,因为VTD-XML知道如何解码字节:StringwithHeader=""+myString;byte[]bytes=withHe

jQuery:将行数据不一致的XML解析成表

这可能是一个非常菜鸟的问题,但我很困惑。我有以下代码,它解析一个XML文件并将每个元素放入一个表中。我的问题是每行中并不总是有九个元素,并且每个元素的名称在XML文件之间发生变化。有什么方法可以创建一个遍历每一行的循环(不知道元素名称(col0、col1等))并将其放入表中?XML是这样的:titlesmoretitlestitlenameanothernamedifferentname5:58-6:086:116:156:19等....这是我的代码:$(document).ready(function(){$.get('newlayout.xml',function(d){$('.t

java - 是否有 Java XML API 可以在不解析字符实体的情况下解析文档?

我有一个程序需要解析包含字符实体的XML。程序本身不需要解决它们,而且它们的列表很大并且会发生变化,所以我想尽可能避免对这些实体的明确支持。这是一个简单的例子:Hellothere&something;是否有JavaXMLAPI可以在不解析(非标准)字符实体的情况下成功解析文档?理想情况下,它会将它们转化为可以专门处理的特殊事件或对象,但我会选择一个会默默抑制它们的选项。答案和例子:Skaffman给了我答案:使用StAX解析器并将IS_REPLACING_ENTITY_REFERENCES设置为false。这是我编写的用于试用的代码:XMLInputFactoryinputFacto

java - 使用 Java DOM 处理空节点

我有一个关于XML、Java对DOM的使用和空节点的问题。我目前正在从事一个项目,其中我使用抽象机器的XML描述rune件(用于文本解析)并使用它们解析一系列输入字符串。这些抽象机器的实际构建和解释都已完成并且工作正常,但我遇到了一个相当有趣的XML需求。具体来说,我需要能够将一个空的InputString节点变成一个空字符串("")并且仍然执行我的解析例程。然而,当我试图从我的XML树中提取这个空白节点时,问题就出现了。这会导致空指针异常,然后通常会发生不好的事情。这是有问题的XML片段(注意第一个元素是空的):000111010011011011101100001010101010

xml - 使用 Nokogiri 从元素中删除外部标签?

这就是我想要做的:删除类为“none”的“span”节点。删除“额外”节点但保留其中的文本。删除任何“br”节点并用“p”节点替换它们SometextgoeshereSomeothertextgoeshere这是我想要实现的输出:SometextgoeshereSomeothertextgoeshere到目前为止我已经试过了:doc.xpath('html/body/p/span').eachdo|span|span.attribute_nodes.eachdo|a|ifa.value=="none"span.children.eachdo|child|span.parent但这是我得