草庐IT

Python图形处理

全部标签

python - Python 中的空 XML 元素处理

我对minidom解析器对空元素的处理感到困惑,如以下代码部分所示。importxml.dom.minidomdoc=xml.dom.minidom.parseString('')printdoc.firstChild.nodeValue.__repr__()#Out:Noneprintdoc.firstChild.toxml()#Out:doc=xml.dom.minidom.Document()v=doc.appendChild(doc.createElement('value'))v.appendChild(doc.createTextNode(''))printv.firstC

python - 在没有非 python 依赖项的情况下在 Python 中验证 XML

我正在编写一个用于分发的小型Python应用程序。我需要包括简单的XML验证(它是一个调试工具),但我想避免对已编译的C库(如lxml或pyxml)的任何依赖,因为它们会使生成的应用程序更难分发。我找不到任何似乎符合要求的东西——对于DTD、RelaxNG或XMLSchema。有什么建议吗? 最佳答案 你的意思是像MiniXsv?我从来没有用过它,但是从网站上,我们可以读到minixsvisalightweightXMLschemavalidatorpackagewritteninpurePython(atleastPython2.

xml - XmlDictionaryReader 真的可以处理二进制 XML 吗?如果不是,那是什么?

我正在尝试写一个debuggingtool允许用户以纯文本形式查看WCF的新二进制XML格式(application/soap+msbin1)。一旦我找到XmlDictionaryReaderclass我以为我会在几分钟内完成,但它没有按预期工作。privatestringDecodeBinaryXML(byte[]binaryBuffer){if(binaryBuffer==null){return"";}try{vardoc=newXmlDocument();using(varbinaryReader=XmlDictionaryReader.CreateBinaryReader(b

python - 如何获取 XML 文档并使用 Python twisted 对其进行解析?

我想要一种快速获取URL并在流式传输时解析它的方法。理想情况下,这应该非常快。我选择的语言是Python。我有一种直觉,扭曲可以做到这一点,但我找不到一个例子。 最佳答案 如果您需要以流方式处理HTTP响应,有几个选项。您可以通过downloadPage完成:fromxml.saximportmake_parserfromtwisted.web.clientimportdownloadPageclassStreamingXMLParser:def__init__(self):self._parser=make_parser()def

xml - 关于Java 6中xml处理的教程

我对Java、XPath、SAX、DOM、DoButuBuffDebug……中的所有XML处理方法有点迷惑……不同的嗡嗡声,我看不出它们是如何关联的……1)所以我想我的问题是有人知道在Java6中处理XML的好教程吗?,我找到了一些,但它们看起来很旧。2)我需要遍历一个XML树,这意味着要了解它的不同节点并能够从中获取数据,什么是最好的方法?谢谢任何链接都将不胜感激 最佳答案 Java中有几种不同的XML技术,它们基本上都是做同样的事情(提供对XML树的某种访问方式),但是它们的方式各不相同。最初的技术sax是一个流式xml处理器。

python - 在 Beautiful Soup 中向 p 标签添加文本

我想知道是否有人知道如何将文本添加到标签(p、b——任何您可能想要包含字符数据的标签)。该文档没有提到您可以在哪里执行此操作。 最佳答案 我不确定这是否是您想要的,但也许这是一个开始...fromBeautifulSoupimportBeautifulSoup,NavigableStringhtml=""soup=BeautifulSoup(html)ptag=soup.find('p')ptag.insert(0,NavigableString("new"))printptag输出new文档显示了更多类似的示例:http://ww

ruby-on-rails - 如何防止 Rails 处理大型 XML 帖子

在我们的rails应用程序中,我们有许多执行常规webapp操作的操作。但是,我们有一个接受大型XML文件的操作。我想阻止Rails将XML解析为参数。相反,我希望能够获取URL参数(/documents/{id}/action),然后将xml文件写入特定目录。如何阻止Rails处理它?我将如何定义处理此问题的操作?defhandle_xml#whattoputhereend上传是使用Content-Type完成的:application/xml它是一个文件,而不是多部分表单的一部分。示例curl语句为:curl-H'Accept:application/xml'-H'Content-

python - 更正 XML 编码

我有一个编码标记设置为“utf-8”的xml。但是,它实际上是iso-8859-1。以编程方式,我如何在perl和python中检测到它?以及如何使用不同的编码进行解码?在perl中,我尝试过$xml=decode('iso-8859-1',$file)但是,这不起作用。 最佳答案 错误编码是出了名的难以检测,因为随机二进制数据通常代表许多编码中的有效字符串。在Perl中,您可以尝试的最简单的方法是尝试将其解码为utf-8并检查是否失败。(它只能这样工作;一个utf-8编码的西方语言文档几乎总是一个有效的iso-8859-1文档)m

python - 在 python 中迭代写入 XML 节点

有多种读取XML的方法,包括一次性(DOM)和一次一位(SAX)。我使用SAX或lxml来迭代读取大型XML文件(例如,维基百科转储是6.5GB压缩)。然而,在对该XML文件进行一些迭代处理(在python中使用ElementTree)之后,我想将(新的)XML数据写出到另一个文件。是否有任何库可以迭代地写出XML数据?我可以创建XML树,然后将其写出,但如果没有大量ram,这是不可能的。有没有办法将XML树迭代地写入文件?一次一位?我知道我可以用print""%tag_name自己生成XML等等,但这似乎有点……hacky。 最佳答案

python - 首选 Python XML 处理器

与Python一起使用的首选XML处理器是什么?一些选择是迷你王国PyXML元素树...编辑:我需要能够阅读文档并对其进行操作。我还需要pretty-print功能。 最佳答案 lxml就是它所在的位置。下面是一些示例代码:importtextwrapfromos.pathimportjoinfromlxmlimportetree#stringtoElementtree=etree.XML(textwrap.dedent('''footextbartext'''))print'roottext:',tree.textprint'pr