Python格式化大文本

python - 使用 Python 的 ElementTree 查找顶级 xml 注释

我正在使用Python的ElementTree解析一个xml文件，就像这样:et=ElementTree(file=file("test.xml"))test.xml以几行xml注释开始。有没有办法从et那里得到这些评论？最佳答案对于ElementTree1.2.X，有一篇关于ReadingprocessinginstructionsandcommentswithElementTree的文章(http://effbot.org/zone/element-pi.htm)。编辑:替代方法是使用实现ElementTreeAPI的l

xml - 窄带可扩展消息格式

我正在对投标进行技术响应，其中一项要求是在窄带宽网络(10字节/秒左右)上使用可扩展格式传递消息。为了让服务器上的生活更轻松，服务器将从1000台设备接收信息，我想使用Xml。为了帮助解决带宽问题，我可以使用压缩的Xml，但数据来自嵌入式设备，这些设备可能没有能力动态进行压缩。任何人都有更好的想法，理想的是一种小型可扩展格式，一旦通过窄带接收到消息，就可以将其混合到Xml中。最佳答案 GoogleProtocolBuffersProtocolBuffersareawayofencodingstructureddatainaneff

窄带 xml section Protocol embedded compression

c# - 如何在不更改格式/间距的情况下在 C# 中编辑 XML？

我需要一个应用程序来遍历xml文件，更改一些属性值并添加其他属性。我知道我可以用XmlDocument和XmlWriter做到这一点。但是，我不想更改文档的间距。有什么办法吗？或者，我必须自己解析文件吗？最佳答案 XmlDocument有一个属性PreserveWhitespace.如果将其设置为true将保留无关紧要的空格。参见MSDN编辑如果我执行以下代码，将保留包括换行符在内的空格。(确实在和/>之间插入了一个空格)XmlDocumentdoc=newXmlDocument();doc.PreserveWhitespace=

c#code section XmlDocument xml

xml - Coldfusion - XML 格式化从 API 调用返回的字符串

我们调用一个返回XML格式数据字符串的API。我们想通过XMLParse()将此字符串转换为ColdFusionXML对象。当数据值中出现特殊字符时会出现问题。例如，像这样的字符: —–(是的，原始数据以HTML编码的等效形式包含它们)。在执行XMLParse()时，它会在这些编码字符上抛出错误。这是一个会出错的例子:我们字符串的一部分:Hello World错误:Referencetoundefinedentity" "使这些字符与XMLParse()兼容的最佳方法是什么？更重要的是-如果我们并不总是知道角色会是什么，我们怎么能做

Coldfusion xml section code amp parsing special-characters

xml - 我们可以以 MM-DD-YYYY 格式验证来自 XSD 的日期吗？

我们可以在XSD中对要限制的元素指定MM-DD-YYYY格式的日期限制吗？最佳答案是的，可以使用正则表达式左边当然也应该检查范围。也许您可以扩展正则表达式以仅接受某些数字。关于xml-我们可以以MM-DD-YYYY格式验证来自XSD的日期吗？，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/3507071/

MM-DD-YYYY YYYY section xsd stackoverflow xml

python - 使用 DTD 验证 XML 无法使用 lxml 导入实体

我有一个生成NewsML类型XML文件的工具，我想在生成文件后验证它们。我收到一个错误:Attempttoloadnetworkentityhttp://www.w3.org/TR/ruby/xhtml-ruby-1.modPython调用是:parser=etree.XMLParser(load_dtd=True,dtd_validation=True)treeObject=etree.parse(f,parser)首先，我不确定我是否同时需要“load_dtd=True,dtd_validation=True”，但无论如何我都在使用它。第二个错误似乎来自定义为的导入的nitf-3-

python lxml code dtd section xml

python - 使用 Python 替换 XML 文档中的数字字符引用

我正在努力解决以下问题:我有一个包含以下标记的XML字符串，我想使用cElementTree将其转换为有效的XML文档:#55296;#57136;#55296;#57149;#55296;#57139;#55296;#57136;#55296;#57151;#55296;#57154;#55296;#57136;但是每个#符号前面都有一个&符号，因此输出看起来像:��这是一个unicode字符串，编码是UTF-8。我想丢弃这些数字字符引用，因为它们在有效的XML文档中不是合法的XML(参见ParsererrorusingPerlXML::DOMmodule

python amp 55296 code xml

python - 如何从单个流中解析多个 XML 文档？

我有一个套接字，可以从中读取XML数据。然而，这个套接字会吐出多个不同的XML文档，所以我不能简单地解析我收到的所有输出。有没有好的方法，最好是使用Python标准库，让我解析多个XML文档？换句话说，如果我最终得到那么有没有办法获取多个DOM对象或让SAX解析器简单地处理这样的流？最佳答案如果你有单独的文件，你需要一些东西来分割它们；如果有的话，您可以在解析单个文档之前简单地拆分流。另一种可能性是将其包装到另一个文档中，因此每个XML文档实际上都是您为此目的创建(并包装)的父文档的子文档。

python XML section 套接字套接

c# - 像使用 C# 的 python 的 lxml 一样读取 XML 文件？

当我需要从之前的XML代码中获取信息时，Python的lxml可以如下使用。defgetNodeList(self):connection=self.doc.find('Connections')cons=connection.find('Connection')forconincons.iter():con.get("ID")#getattribute...我可以使用哪些C#库/函数来获取python的lxml等信息？我的意思是，我可以在C#中使用find()/iter()或类似工具吗？哪些C#库与python的lxml相似？已添加根据dtb的回答，我可以得到我需要的。usingSy

c#34 Connection section python xml lxml

python - lxml.etree 和 xml.etree.ElementTree 添加没有前缀的命名空间(ns0、ns1 等)

是否有任何解决方案可以添加不带前缀的命名空间(我的意思是这些ns0、ns1)，它们适用于所有etree实现，或者每个实现都有可行的解决方案？目前我有以下解决方案:lxml-元素的nsmap参数(c)ElementTree(python2.6+)-以空字符串作为前缀注册命名空间方法问题是python2.5中的(c)ElementTree，我知道有_namespace_map属性但将其设置为空字符串会创建无效的XML，将其设置为None添加默认的ns0等namespace，是否有任何可行的解决方案？我猜Element('foo',{'xmlns':'http://my_namespace_

etree ElementTree section 39 output_filename python xml lxml

115 116 117118119 120 121