草庐IT

python - 使用 ElementTree 在 python 中解析 xml

我是python的新手,我需要解析一些需要先清理的脏xml文件。我有以下python代码:importarffimportxml.etree.ElementTreeimportretotstring=""withopen('input.sgm','r')asinF:forlineininF:string=re.sub("[^0-9a-zA-Z/\s=!-\"\"]+","",line)totstring+=stringdata=xml.etree.ElementTree.fromstring(totstring)printdatafile.close解析:26-FEB-198715:0

c# - 使用 LINQ 解析 XML 数据

我是LINQ的新手。我需要为每个MPrice返回包含今天日期的正确价格信息的ID。这是一个XML示例:007931.252009-8-012009-08-26131.252009-08-269999-12-310081131.252009-8-012009-08-26231.252009-08-269999-12-31 最佳答案 这是一种实现方式:usingSystem;usingSystem.Linq;usingSystem.Xml.Linq;classProgram{staticvoidMain(){Stringxml=@"00

html - 我应该使用 HTML::Parser 还是 XML::Parser 来提取和替换文本?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion我希望能够从HTML/XHTML文档中提取所有纯文本并进行分析/修改,然后在需要时进行替换。我可以使用HTML::Parser来做到这一点吗?或者应该是XML::Parser?有没有人知道的任何好的演示?

python - 如何在 Python 和 LXML 中解析 XML?

这是我的项目:我正在使用RRDTool从WeatherBug绘制天气数据图表。我需要一种简单、高效的方法来从WeatherBug下载天气数据。我使用的是一个非常低效的bash-script-scraper,但后来转向了BeautifulSoup。性能太慢(它在RaspberryPi上运行)所以我需要使用LXML。我目前拥有的:fromlxmlimportetreedoc=etree.parse('weather.xml')printdoc.xpath("//aws:weather/aws:ob/aws:temp")但是我收到一条错误消息。Weather.xml是这样的:http://w

objective-c - 使用 NSXMLParser 从 HTTPS URL 解析 XML?

我正在尝试直接从HTTPSURL解析XML,如下所示:NSString*constURL=@"https://some/HTTPS/url";NSURL*url=[NSURLURLWithString:URL];NSXMLParser*parser=[[NSXMLParseralloc]initWithContentsOfURL:url];[parsersetDelegate:self];[parserparse];我有以下解析器委托(delegate)方法:-(void)parser:(NSXMLParser*)parserdidStartElement:(NSString*)ele

java - 在 Java 中解析没 Root过的 XML 文件

我有这个没有根节点的XML文件。除了手动添加“假”根元素之外,还有什么方法可以用Java解析XML文件吗?谢谢。 最佳答案 我想您可以创建一个新的InputStream实现来包装您将从中解析的那个。此实现将在包装流的字节之前返回开始根标记的字节,然后返回结束根标记的字节。这将相当简单。我也可能遇到这个问题。遗留代码,嗯?伊恩。编辑:您还可以查看java.io.SequenceInputStream,它允许您将流附加到另一个流。您需要将前缀和后缀放在字节数组中并将它们包装在ByteArrayInputStreams中,但这一切都非常简

xml - CDATA 的正则表达式是什么

您好,我这里有一个CDATA示例和我的CDATA正则表达式无法识别这个"])*"]]>"这也行不通"][^\]]*[\]]{2,})*">"有人可以给我一个的正则表达式吗?,我需要在Lex/Flex中使用它:我已经回答了这个问题,请对我的回答进行投票,谢谢。 最佳答案 很简单,应该是这样的:至少itworksonregexpal.com 关于xml-CDATA的正则表达式是什么,我们在StackOverflow上找到一个类似的问题: https://stack

java - 使用java获取XML文件中的所有标签

您好,我想获取XML中所有标签的列表,如果某些标签带有特定属性,我还需要该属性的值。例如这里有一个具体的例子,我对父子关系不感兴趣,如果存在父子关系,我想迭代到最深的child。如果存在于特定元素中,我还想要android:id和android:name属性值。问题是您无法知道父子关系可以有多深以及它将在xml中的什么位置。而且您以前也不知道标签名称。我可以考虑在我的代码中使用递归,但我相信有一个更简单的解决方案 最佳答案 我找到了解决方案,非常简单,之前不知道getElementsByTagName("*")是这样做的,这是我的代

java - 为什么在解析 XML 时得到空节点值

在解析下面的XML时。首先url-malformed-exception在解析时出现,所以在代码中而不是给出xml字符串,我使用了这段代码Documentdoc=dBuilder.parse(newInputSource(newByteArrayInputStream(xmlResponse.getBytes("utf-8"))));根据这个链接java.net.MalformedURLException:noprotocol现在我得到的节点值为null。我怎样才能克服这个问题。在for循环的代码中我已经提到节点的null值在哪里我正在使用以下代码:try{DocumentBuilde

java - 线程 "main"java.net.MalformedURLException : unknown protocol: c 中的异常

我正在尝试使用SAX解析器来解析XML文件。尽管我的代码中不断出现以下错误:Exceptioninthread"main"java.net.MalformedURLException:unknownprotocol:catjava.net.URL.(URL.java:592)atjava.net.URL.(URL.java:482)atjava.net.URL.(URL.java:431)atcom.sun.org.apache.xerces.internal.impl.XMLEntityManager.setupCurrentEntity(XMLEntityManager.java: