草庐IT

XMLSyntaxError 需要开始标记,未找到 '<'

在Django中,我构建了一个脚本来创建xml对象来发出xml请求。这是我的代码:my_xml=etree.XML('''\"]>"''')my_xml_doc=etree.ElementTree(my_xml)my_tipe=etree.SubElement(my_xml,"element")my_tipe.text='Element'my_xml_serialize=etree.parse(my_xml)my_request=urllib2.Request(url,my_xml_serialize)但是django抛出一个错误XMLSyntaxErrorStarttagexpect

python - XPath:仅获取具有特定子元素的元素

我有一个文件系统,它以以下格式在xml文档中表示:123directory3...456filesuccess...我需要做的是,使用Python的lxml,只检索表示目录的entry对象。所有条目都包含一个对象,但我需要知道如何检索entry对象列表,其中该对象的文本等于directory。我可以通过几个不方便的步骤来完成此操作,但我宁愿对其进行一次查询。这是我分步进行的方式:#xml_parse.pyns={'ns1':'namespace1','ns2':'namespace2'}fornodeintree.xpath("//ns1:entry",namespaces=ns):i

python - 如何使用 lxml 以编程方式实例化注释元素?

我正在使用lxml以编程方式构建HTML,我需要在输出中包含自定义注释。虽然lxml中有处理注释的代码(它们可以在解析现有HTML代码时实例化),但我找不到以编程方式实例化注释的方法。有人能帮忙吗? 最佳答案 您可以使用lxml.etree.Comment()工厂功能。它将返回一个注释元素,您可以像使用任何其他元素一样使用它。 关于python-如何使用lxml以编程方式实例化注释元素?,我们在StackOverflow上找到一个类似的问题: https://

Python 使用通配符在 XML 中查找标签

我的python脚本中有这一行:url=tree.find("//video/products/product/read_only_info/read_only_value[@key='storeURL-GB']")但有时storeURL-GB键会更改最后两个国家代码字母,所以我尝试使用类似这样的方法,但它不起作用:url=tree.find("//video/products/product/read_only_info/read_only_value[@key='storeURL-\.*']")有什么建议吗? 最佳答案 你或许应

python - 覆盖 lxml 行为以编写 Null 标记的结束和开始元素

root=etree.Element('document')rootTree=etree.ElementTree(root)firstChild=etree.SubElement(root,'test')输出是:我希望输出为:我知道两者是等价的,但有没有办法获得我想要的输出。 最佳答案 将tostring的method参数设置为html。如:etree.tostring(root,method="html")引用:Closeatagwithnotextinlxml 关于python-覆盖

python - 在 python 中使用 lxml 创建元素时出现 "Invalid tag name"错误

我正在使用lxml制作一个xml文件,我的示例程序是:fromlxmlimportetreeimportdatetimedt=datetime.datetime(2013,11,30,4,5,6)dt=dt.strftime('%Y-%m-%d')page=etree.Element('html')doc=etree.ElementTree(page)dateElm=etree.SubElement(page,dt)outfile=open('somefile.xml','w')doc.write(outfile)我收到以下错误输出:dateElm=etree.SubElement(p

python - lxml xsi :schemaLocation namespace URI validation issue

我正在尝试使用lxml.etree重现CDAQuickStartGuidefoundhere中的CDA示例.特别是,我在尝试重新创建此元素时遇到了命名空间问题。我使用的代码如下root=etree.Element('ClinicalDocument',nsmap={None:'urn:hl7-org:v3','mif':'urn:hl7-org:v3/mif','xsi':'http://www.w3.org/2001/XMLSchema-instance','{http://www.w3.org/2001/XMLSchema-instance}schemaLocation':'urn

python - 全流式 XML 解析器

我正在尝试使用ExchangeGetAttachment网络服务使用requests,lxml和base64io.此服务在SOAPXMLHTTP响应中返回一个base64编码的文件。文件内容包含在单个XML元素的一行中。GetAttachment只是一个例子,但问题更普遍。我想将解码后的文件内容直接流式传输到磁盘,而不会将附件的全部内容随时存储在内存中,因为一个附件可能有几百MB。我试过这样的:r=requests.post('https://example.com/EWS/Exchange.asmx',data=...,stream=True)withopen('foo.txt','

Python: lxml.etree.tostring(with_comments=False)

我调用以下命令并得到以下错误:>>>lxml.etree.tostring([tree].getroot(),with_comments=False)ValueError:CanonlydiscardcommentsinC14Nserialisation我不知道C14N是什么,但我希望能解释一下如何实现它并使用with_comments=False运行上述命令。(是的,我知道我可以使用正则表达式去除评论。请不要提供正则表达式作为解决方案。)背景:我想通过http连接传输我的xml文档。我正在使用lxmlPython库。我在Python2.7.1上运行 最佳答

python - XML 走在 python 中

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭10年前。我是python的新手,想了解解析xml。我还没有找到任何关于如何创建通用程序来遍历XML节点集的很好的示例或解释。我希望能够按名称和值对所有元素和属性进行分类和识别,而无需任何有关xml架构的信息。我不想依赖于通过标签名称或文本来调用元素和属性。有人能给我指出正确的方向吗?谢谢更新:被问到的具体问题是,“我通常如何在不了解架构的情况下从XML文档的根节点开始递归所有节点。”当时,作为pytho