parsing

python - 使用 ElementTree 在 python 中解析 xml

我是python的新手，我需要解析一些需要先清理的脏xml文件。我有以下python代码:importarffimportxml.etree.ElementTreeimportretotstring=""withopen('input.sgm','r')asinF:forlineininF:string=re.sub("[^0-9a-zA-Z/\s=!-\"\"]+","",line)totstring+=stringdata=xml.etree.ElementTree.fromstring(totstring)printdatafile.close解析:26-FEB-198715:0

python ElementTree and gt lt xml parsing xml-parsing

c# - 使用 LINQ 解析 XML 数据

我是LINQ的新手。我需要为每个MPrice返回包含今天日期的正确价格信息的ID。这是一个XML示例:007931.252009-8-012009-08-26131.252009-08-269999-12-310081131.252009-8-012009-08-26231.252009-08-269999-12-31 最佳答案这是一种实现方式:usingSystem;usingSystem.Linq;usingSystem.Xml.Linq;classProgram{staticvoidMain(){Stringxml=@"00

c#LINQ lt gt code xml parsing

html - 我应该使用 HTML::Parser 还是 XML::Parser 来提取和替换文本？

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的，因为它们往往会吸引自以为是的答案和垃圾邮件。相反，describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion我希望能够从HTML/XHTML文档中提取所有纯文本并进行分析/修改，然后在需要时进行替换。我可以使用HTML::Parser来做到这一点吗？或者应该是XML::Parser？有没有人知道的任何好的演示？

Parser html section noreferrer noopener xml perl parsing

python - 如何在 Python 和 LXML 中解析 XML？

这是我的项目:我正在使用RRDTool从WeatherBug绘制天气数据图表。我需要一种简单、高效的方法来从WeatherBug下载天气数据。我使用的是一个非常低效的bash-script-scraper，但后来转向了BeautifulSoup。性能太慢(它在RaspberryPi上运行)所以我需要使用LXML。我目前拥有的:fromlxmlimportetreedoc=etree.parse('weather.xml')printdoc.xpath("//aws:weather/aws:ob/aws:temp")但是我收到一条错误消息。Weather.xml是这样的:http://w

何在 python aws 34 gt xml parsing beautifulsoup lxml

objective-c - 使用 NSXMLParser 从 HTTPS URL 解析 XML？

我正在尝试直接从HTTPSURL解析XML，如下所示:NSString*constURL=@"https://some/HTTPS/url";NSURL*url=[NSURLURLWithString:URL];NSXMLParser*parser=[[NSXMLParseralloc]initWithContentsOfURL:url];[parsersetDelegate:self];[parserparse];我有以下解析器委托(delegate)方法:-(void)parser:(NSXMLParser*)parserdidStartElement:(NSString*)ele

objective-c NSXMLParser section Reference noreferrer xml cocoa cocoa-touch parsing

java - 在 Java 中解析没 Root过的 XML 文件

我有这个没有根节点的XML文件。除了手动添加“假”根元素之外，还有什么方法可以用Java解析XML文件吗？谢谢。最佳答案我想您可以创建一个新的InputStream实现来包装您将从中解析的那个。此实现将在包装流的字节之前返回开始根标记的字节，然后返回结束根标记的字节。这将相当简单。我也可能遇到这个问题。遗留代码，嗯？伊恩。编辑:您还可以查看java.io.SequenceInputStream，它允许您将流附加到另一个流。您需要将前缀和后缀放在字节数组中并将它们包装在ByteArrayInputStreams中，但这一切都非常简

java section 包装伊恩 xml parsing xml-parsing

xml - CDATA 的正则表达式是什么

您好，我这里有一个CDATA示例和我的CDATA正则表达式无法识别这个"])*"]]>"这也行不通"][^\]]*[\]]{2,})*">"有人可以给我一个的正则表达式吗？,我需要在Lex/Flex中使用它:我已经回答了这个问题，请对我的回答进行投票，谢谢。最佳答案很简单，应该是这样的:至少itworksonregexpal.com 关于xml-CDATA的正则表达式是什么，我们在StackOverflow上找到一个类似的问题： https://stack

CDATA xml code section regex parsing lex

java - 使用java获取XML文件中的所有标签

您好，我想获取XML中所有标签的列表，如果某些标签带有特定属性，我还需要该属性的值。例如这里有一个具体的例子，我对父子关系不感兴趣，如果存在父子关系，我想迭代到最深的child。如果存在于特定元素中，我还想要android:id和android:name属性值。问题是您无法知道父子关系可以有多深以及它将在xml中的什么位置。而且您以前也不知道标签名称。我可以考虑在我的代码中使用递归，但我相信有一个更简单的解决方案最佳答案我找到了解决方案，非常简单，之前不知道getElementsByTagName("*")是这样做的，这是我的代

java XML android 34 layout parsing dom sax

java - 为什么在解析 XML 时得到空节点值

在解析下面的XML时。首先url-malformed-exception在解析时出现，所以在代码中而不是给出xml字符串，我使用了这段代码Documentdoc=dBuilder.parse(newInputSource(newByteArrayInputStream(xmlResponse.getBytes("utf-8"))));根据这个链接java.net.MalformedURLException:noprotocol现在我得到的节点值为null。我怎样才能克服这个问题。在for循环的代码中我已经提到节点的null值在哪里我正在使用以下代码:try{DocumentBuilde

java XML ns2 lt gt parsing

java - 线程 "main"java.net.MalformedURLException : unknown protocol: c 中的异常

我正在尝试使用SAX解析器来解析XML文件。尽管我的代码中不断出现以下错误:Exceptioninthread"main"java.net.MalformedURLException:unknownprotocol:catjava.net.URL.(URL.java:592)atjava.net.URL.(URL.java:482)atjava.net.URL.(URL.java:431)atcom.sun.org.apache.xerces.internal.impl.XMLEntityManager.setupCurrentEntity(XMLEntityManager.java:

MalformedURLException java equalsIgnoreCase element 34 xml parsing runtime-error sax

64 65 666768 69 70