草庐IT

java - 在 xml 文件中使用 CDATA 来解析 html 数据

我有一个xml文件,其内容中包含格式错误的HTML..由于xml无法解析之类的html标签我使用CDATA进行保存和解析。我使用了documentBuilder.setCoalescing(true);在解析以恢复数据时testdata]]>没有CDATA标签..但是在optput中标签被<and>代替了分别..我期待这个字符串的结果......testdata在解析后的字符串中。如何做到这一点?任何的想法?提前致谢!更新:我还有两个问题正在跟进..1.有什么方法可以通过代码将格式错误的HTML(例如)转换为可解析的xml(例如),如果可以,它会处理 吗?还有吗?

java - 如何向 XML 元素添加属性

我正在使用DOM解析器。我必须解析以下XML:test001test2002所以,根据type字段下的value字段,我要在type中填写action属性字段。我有点难过。我能够获取value字段的值,但我不知道如何返回并添加该属性。任何帮助将不胜感激!!!谢谢! 最佳答案 要返回,只需保存对typeElement的引用,然后再遍历其value子元素。(假设您已经访问过它)。要更改值,请使用setAttribute()方法。编辑:替代方法:从value文本节点调用getParentNode()两次(一次返回值元素,一次返回类型元素)

具有表情符号字符的 java xml 解析器

以下代码用于解析一个xml文件。我注意到表情符号字符没有被正确解析。在示例中,输入末尾有一个表情符号(http://www.iemoji.com/view/emoji/693/people/revolving-hearts),字符在输出中加倍。这是已知错误吗?importjava.io.File;importjavax.xml.parsers.DocumentBuilder;importjavax.xml.parsers.DocumentBuilderFactory;importorg.w3c.dom.Document;importorg.w3c.dom.Element;importo

java - 修复 XML 文件中的错误编码

我们的一个提供商有时会发送标记为UTF-8编码文档但包含未包含在UTF-8字符集中的字符的XML提要。这会导致解析器在遇到这些字符时抛出异常并停止构建DOM对象:DocumentBuilder.parse(ByteArrayInputStreambais)抛出以下异常:org.xml.sax.SAXParseException:Invalidbyte2of2-byteUTF-8sequence.有没有办法及早“捕获”这些问题并避免异常(即从流中查找和删除这些字符)?我正在寻找的是针对错误编码文档的“尽力而为”类型的回退。正确的解决方案显然是从源头上解决问题并确保只交付正确的文档,但如果

java - 告诉 SAX 解析器忽略无效字符?

SAX因以下异常而不断死亡:Invalidbyte2of3-byteUTF-8sequence问题是它大部分是正确的UTF-8编码,但其中有一些错误。我们无法获得该文件的新版本,我们必须使用该文件。那么我们如何告诉SAX忽略无效的字符序列,或者清理UTF-8文件以使其不包含无效的UTF-8序列? 最佳答案 您可以在SAX读取流之前对其进行过滤。创建一个InputStream来读取您的流并丢弃无效字符。 关于java-告诉SAX解析器忽略无效字符?,我们在StackOverflow上找到一

.net - .NET 是否有向后的 XML 解析器?

在我的应用程序中,我对XML字符串有一个已知的兴趣偏移量,并且想回答诸如“我的父元素是什么?”之类的问题。无需解析整个文档。这article提到了一个似乎在Objective-C中用于“向后”XML解析的库。我的应用程序不需要完整的XML支持,所以我很乐意忍受所有关于无法完全可靠地解析的警告。C#/.NET有这样的东西吗?澄清:我不是在询问一般的解析解决方案或性能权衡,我对特定情况感兴趣,在这种情况下,我正处于文本流的中途,只需要了解一些有关本地结构的信息。想象一下我不想获取文档顶部的情况,因为访问具有非常高的延迟。 最佳答案 如果

java - 对元素的 DOM 属性序列进行排序

这个问题在这里已经有了答案:OrderofXMLattributesafterDOMprocessing(12个答案)关闭8年前。这个问题之前在stackoverflow中被问过:settingorderofattributes真的不可能吗?使用insertBefore我想对元素的属性序列进行排序。具体来说,在下面的示例中,如何更改属性的顺序?只使用setAttribute会更容易吗?从一个节点?在任何一种情况下,顺序似乎都是自动发生的,尽管insertBefore肯定意味着可以指定顺序。代码:packagexml;importjava.io.FileWriter;importjava

java - java中的xml dom解析器?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭7年前。Improvethisquestion谁能分享一下java中dom解析器的好文档。谢谢

java - 在 JDOM/DOM 中禁用 XML 实体解析

我正在编写一个用于XML文件后处理的Java应用程序。这些xml文件来自SemanticMediawiki的RDF-Export,因此它们具有rdf/xml语法。我的问题如下:当我读取xml文件时,文件中的所有实体都解析为Doctype中指定的值。例如在我的Doctype中..]>在根元素中这意味着成为我尝试过使用JDOM和标准JavaDOM。我认为这里相关的代码是针对标准DOM的:DocumentBuilderFactoryfactory=DocumentBuilderFactory.newInstance();factory.setExpandEntityReferences(fa

iphone - 使用 GDataXMLDocument 解析 xml 属性

如何使用GDataXMLDocument解析xml属性?我有一个xml字符串作为NSData(命名为xmlData)Raju25然后我读了它:NSError*error;GDataXMLDocument*doc=[[GDataXMLDocumentalloc]initWithData:xmlDataoptions:0error:&error];if(doc==nil){return;}//NSArray*partyMembers=[doc.rootElementelementsForName:@"Player"];NSArray*partyMembers=[docnodesForXPa