Parsing

xml - 可用于解析 XML 的主要方法/库有哪些？

我正在进行一项权衡研究，评估为大型系统解析XML的各种方法。我正在查看多个平台(iOS、Linux、OSX、Windows)上的分析和实际相对性能(空间和时间)。我目前候选的方法和库评估列表如下:萨克斯NSXMLParser(iOS)文档对象模型System.Xml.XmlDocument(.NET)拉解析System.Xml.XmlReader(.NET)XmlLite:ASmallandFastXMLParserforNativeC++数据绑定(bind)JavaAPIforXMLBinding(JAXB)XMLSchemaDefinition(XSD)Tool(.NET)作为数据

objective-c - NSXMLParser 无法解析特殊字符(德语和法语)

我正在开发一个应用程序，它在私有(private)服务器上进行搜索并将结果显示给用户。问题是NSXLParser无法解析特殊的德语和法语字符。例如:它应该是:(Geschäftsführer)->我得到的是:(äftsführer)我该如何解决这个问题？这是我的代码:-(void)parser:(NSXMLParser*)parserfoundCharacters:(NSString*)string{currentNodeContent=(NSMutableString*)[stringstringByTrimmingCharactersInSet:[NSCharacterSetwhi

德语法语 code NSString elementname objective-c xml parsing special-characters nsxmlparser

解析 XML 字段并检索值的 SQL 查询

我试图解析一个XML字段，它是SCOM2007数据仓库数据库的一部分，并且发现了许多示例，这些示例显示了实现此目的的类似场景，但是似乎没有任何返回值，通常在我运行查询时出错。这是一个示例，我需要针对一千行左右的行运行它，我想在其中提取值England和UK(构成标签的GUID对于每种数据类型都是一致的，因此永远不会更改和可用于查询等)。当然，每一行都有不同的城市和国家代码，这就是我想要捕获的内容。表名是dbo.ManagedEntityProperty，列名是PropertyXML192.168.1.0WASPDC01.LIV10.Local192.168.1.0England255.

XML SQL Property 39 section sql-server parsing

c# - 解析 RSS 提要最近引发文档类型定义 (DTD) 错误

这是一个最近开始困扰我的rss提要解析器的错误。今天早上我的四个rss提要开始抛出这个异常:出于安全原因，此XML文档中禁止使用DTD。要启用DTD处理，请将XmlReaderSettings上的DtdProcessing属性设置为Parse，并将设置传递给XmlReader.Create方法。代码过去工作正常，但我相信这四个特定的rss提要发生了变化，导致了这个问题。Feed在之前未使用DTD时使用DTD，或者我的SyndicationFeed无法解析的某种模式更改。所以我把我的代码改成了stringurl=RssFeed.AbsoluteUri;XmlReaderSettingss

c#提要 code 34 SyndicationFeed xml parsing rss syndication-feed

java - DocumentBuilder 解析在命中 '&' 时中断字符串

我有这个xml:H&M我使用这段代码解析它:DocumentBuilderdocumentBuilder=null;Documentdocument=null;try{documentBuilder=DocumentBuilderFactory.newInstance().newDocumentBuilder();document=documentBuilder.parse(is);}catch(Exceptione){returnresult;}NodeListnl=document.getElementsByTagName(XML_RESPONSE_ROOT);if(nl.

时中 amp section code document java xml parsing dom escaping

xml - 如何加速 XML::Twig

我正在使用XML::Twig解析一个非常大的XML文档。我想根据将它分成block标签。现在我有:my$xml=XML::Twig->new(twig_handlers=>{'change'=>\&parseChange,});$xml->parsefile($LOGFILE);subparseChange{my($xml,$change)=@_;my$message=$change->first_child('message');my@lines=$message->children_text('line');foreach(@lines){if($_=~/[^a-zA-Z0-9](

Twig xml gt code lt perl parsing large-files xml-twig

Dart 中的 XML 绑定(bind)

Dart中有什么方法可以解析XML并获取对象吗？例如，如果我有这个XML:JohnSmith我想将它绑定(bind)到这个对象:classPerson{Stringname;Stringsurname;...}像这样的片段:Personperson=parse(xml); 最佳答案不是开箱即用的。这里目前正在进行关于序列化/反序列化的广泛讨论:https://groups.google.com/a/dartlang.org/forum/#!topic/misc/0pv-Uaq8FGI讨论主要是关于JSON，但其中大部分也适用于XM

Dart bind section code pre xml parsing

.net - XPathNavigator 和 XmlReader 之间的速度差异到底有多大？

我有一个相当大的XML文件，我需要将其解析为.NET类结构(以映射到固定长度的记录格式并通过MQ传输)。性能很重要，但不是绝对关键。我几乎总是使用XPathNavigator来读取XML文件，因为它比XmlReader容易得多。另一方面，我知道XmlReader比XPathNavigator快，因为理论上它一次只读取一个节点，而XPathNavigator必须读取足够的内容执行XPath，可能是整个文档。我的问题是:它到底快了多少？读取几千个节点时会有明显的不同吗？我几乎必须切换到XmlReader的转折点是什么？还是XPathNavigator优化到始终是一个不错的选择？我的大部分X

XPathNavigator XmlReader code section .net xml performance optimization parsing

Python - 如何确定已解析 XML 元素的层次结构级别？

我正在尝试使用Python从XML文件中解析具有特定标记的元素并生成输出excel文档，该文档将包含元素并保留其层次结构。我的问题是我无法弄清楚每个元素(解析器迭代)的嵌套深度。XML示例摘录(3个元素，它们可以任意嵌套在它们自身中):以下代码使用ElementTree可以很好地迭代元素。但我认为ElementTree无法确定每个元素的嵌套深度。见下文:importxml.etree.ElementTreeasETroot=ET.parse('XML_file.xml')tree=root.getroot()forelementintree.iter():ifelement.tagin

级别 Python section code level xml parsing hierarchy

python - 在python中解析具有多个根元素的xml文件

我有一个xml文件，我需要从中获取一些标签以供使用，其中包含如下数据:1200814110042011599006820111360012008141100420115990068201113600我需要解析这个，所以我使用了:importxml.etree.ElementTreeasETtree=ET.parse("myfile.xml")root=tree.getroot()此代码在第2行给出错误:xml.etree.ElementTree.ParseError:junkafterdocumentelement:我认为这是因为多个xml标记，你有什么想法，我应该如何解析它？

python xml lt gt 34 python-2.7 parsing

56 57 585960 61 62