草庐IT

Python包结构

全部标签

python - 如何获取 XML 文档并使用 Python twisted 对其进行解析?

我想要一种快速获取URL并在流式传输时解析它的方法。理想情况下,这应该非常快。我选择的语言是Python。我有一种直觉,扭曲可以做到这一点,但我找不到一个例子。 最佳答案 如果您需要以流方式处理HTTP响应,有几个选项。您可以通过downloadPage完成:fromxml.saximportmake_parserfromtwisted.web.clientimportdownloadPageclassStreamingXMLParser:def__init__(self):self._parser=make_parser()def

python - 在 Beautiful Soup 中向 p 标签添加文本

我想知道是否有人知道如何将文本添加到标签(p、b——任何您可能想要包含字符数据的标签)。该文档没有提到您可以在哪里执行此操作。 最佳答案 我不确定这是否是您想要的,但也许这是一个开始...fromBeautifulSoupimportBeautifulSoup,NavigableStringhtml=""soup=BeautifulSoup(html)ptag=soup.find('p')ptag.insert(0,NavigableString("new"))printptag输出new文档显示了更多类似的示例:http://ww

xml - 在 xml 层次结构中向上移动分隔符元素

我有一个xml文档,在层次结构的深处有分隔符。我想向上移动分隔符,使元素保持有序。所以期望的输出是仅使用xslt1.0如何完成?可以不使用for-each,仅使用模板匹配来完成吗?更新:我实际上得到了4个不同程度的概括的精彩答案,谢谢你们,伙计们。 最佳答案 这个转换:1]"/>应用于提供的XML文档时:产生想要的、正确的结果: 关于xml-在xml层次结构中向上移动分隔符元素,我们在StackOverflow上找到一个类似的问题: https://stack

xml - 使用 xslt 编码层次结构问题 xslt v1 将 xml 转换为 xml

在我的输入xml文件中,我在元素属性“lp”中获得了编码层次结构:如何将这个xml数据转换成 最佳答案 可能有一种使用XSLT2.0执行此操作的简单方法,但我在这里假定为XSLT1.0。需要注意的是您的XML不是严格有效的,因为它缺少根元素。出于答案的目的,我假设根元素称为elements为此,我认为您需要一个函数来确定元素的“级别”。这可以通过计算@lp属性中的句点数来完成。在XSLT1.0中,我通过删除文本中的所有句号并将结果字符串长度与原始字符串长度进行比较来完成此操作因此,为了匹配顶级元素,您可以这样做...这将匹配以下元素

python - 更正 XML 编码

我有一个编码标记设置为“utf-8”的xml。但是,它实际上是iso-8859-1。以编程方式,我如何在perl和python中检测到它?以及如何使用不同的编码进行解码?在perl中,我尝试过$xml=decode('iso-8859-1',$file)但是,这不起作用。 最佳答案 错误编码是出了名的难以检测,因为随机二进制数据通常代表许多编码中的有效字符串。在Perl中,您可以尝试的最简单的方法是尝试将其解码为utf-8并检查是否失败。(它只能这样工作;一个utf-8编码的西方语言文档几乎总是一个有效的iso-8859-1文档)m

xml - 子结构上的 XPath 求和

如何在以下结构上编写XPath总和?10201020我想得到(数量*商品价格)的总和我能做到:select*frommytablewheredocumentdata.exist('/Order[sum(/Details/Detail/Quantity)>20])=1但是我想使用Quantity*ItemPrice但我不知道它的语法.. 最佳答案 尝试select*frommytablewheredocumentdata.exist('/Order[sum(for$dinDetails/Detailreturn$d/Quantity*

python - 在 python 中迭代写入 XML 节点

有多种读取XML的方法,包括一次性(DOM)和一次一位(SAX)。我使用SAX或lxml来迭代读取大型XML文件(例如,维基百科转储是6.5GB压缩)。然而,在对该XML文件进行一些迭代处理(在python中使用ElementTree)之后,我想将(新的)XML数据写出到另一个文件。是否有任何库可以迭代地写出XML数据?我可以创建XML树,然后将其写出,但如果没有大量ram,这是不可能的。有没有办法将XML树迭代地写入文件?一次一位?我知道我可以用print""%tag_name自己生成XML等等,但这似乎有点……hacky。 最佳答案

python - 首选 Python XML 处理器

与Python一起使用的首选XML处理器是什么?一些选择是迷你王国PyXML元素树...编辑:我需要能够阅读文档并对其进行操作。我还需要pretty-print功能。 最佳答案 lxml就是它所在的位置。下面是一些示例代码:importtextwrapfromos.pathimportjoinfromlxmlimportetree#stringtoElementtree=etree.XML(textwrap.dedent('''footextbartext'''))print'roottext:',tree.textprint'pr

java - 使用 JAXB 解码时如何忽略(有效地)大部分 XML 结构?

在处理具有相当复杂的XML结构的Web服务响应时,我只对非常小的信息子集感兴趣。让我们考虑在这种情况下必须使用usingJAXB。例如,假设我只对检索d感兴趣(可以将其建模为单个JAXBbean):ab1c1c2b2d忽略其他所有内容但检索d的最快推荐方法是什么? 最佳答案 注意:我是EclipseLinkJAXB(MOXy)JAXB2(JSR-222)专家组的领导和成员。有几种不同的方法可以处理这个用例:选项#1-StreamFilter任何JAXB实现您可以使用StAXXMLStreamReader和StreamFilter来过

python - 使用 lxml 解析奇怪结构的 XML

我有许多XML文件需要解析。我写了一些有效但很丑陋的代码,我想从比我更有XML经验的人那里得到一些建议。首先,我可能在错误的上下文中使用了一些术语,因为我在XML方面的经验有限。对于元素,除非另有说明,我的意思是这样的:......无论如何,每个文件都包含许多元素,以及许多子元素(很明显)。令我感到困惑的是,需要以四种不同的方式访问相关值;1)节点文本:value2)属性:3)标签内“隐藏”的值(本例中为“true”):4)同名标​​签(“tagA”)内的值,但具有不同名称(“tag1”和“tag2”)的“祖parent”标签,都在同一元素内。“tagA”对我没有用,我会寻找“tag1