草庐IT

python - ElementTree:为什么我的 namespace 声明被删除了?

coder 2024-06-28 原文

我正在构建 openoffice 文档。我有一个用于生成 content.xml 文件的脚手架。 content-scaffold.xml 文件存储在文件系统中,如下所示:

<?xml version="1.0" encoding="UTF-8"?>
  <office:document-content
  xmlns:anim="urn:oasis:names:tc:opendocument:xmlns:animation:1.0"
  xmlns:chart="urn:oasis:names:tc:opendocument:xmlns:chart:1.0"
  xmlns:config="urn:oasis:names:tc:opendocument:xmlns:config:1.0"
  xmlns:db="urn:oasis:names:tc:opendocument:xmlns:database:1.0"
  xmlns:dc="http://purl.org/dc/elements/1.1/"
  xmlns:dr3d="urn:oasis:names:tc:opendocument:xmlns:dr3d:1.0"
  xmlns:draw="urn:oasis:names:tc:opendocument:xmlns:drawing:1.0"
  xmlns:fo="urn:oasis:names:tc:opendocument:xmlns:xsl-fo-compatible:1.0"
  xmlns:form="urn:oasis:names:tc:opendocument:xmlns:form:1.0"
  xmlns:grddl="http://www.w3.org/2003/g/data-view#"
  xmlns:manifest="urn:oasis:names:tc:opendocument:xmlns:manifest:1.0"
  xmlns:math="http://www.w3.org/1998/Math/MathML"
  xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0"
  xmlns:number="urn:oasis:names:tc:opendocument:xmlns:datastyle:1.0"
  xmlns:odf="http://docs.oasis-open.org/ns/office/1.2/meta/odf#"
  xmlns:of="urn:oasis:names:tc:opendocument:xmlns:of:1.2"
  xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0"
  xmlns:pkg="http://docs.oasis-open.org/ns/office/1.2/meta/pkg#"
  xmlns:presentation="urn:oasis:names:tc:opendocument:xmlns:presentation:1.0"
  xmlns:script="urn:oasis:names:tc:opendocument:xmlns:script:1.0"
  xmlns:smil="urn:oasis:names:tc:opendocument:xmlns:smil-compatible:1.0"
  xmlns:style="urn:oasis:names:tc:opendocument:xmlns:style:1.0"
  xmlns:svg="urn:oasis:names:tc:opendocument:xmlns:svg-compatible:1.0"
  xmlns:table="urn:oasis:names:tc:opendocument:xmlns:table:1.0"
  xmlns:text="urn:oasis:names:tc:opendocument:xmlns:text:1.0"
  xmlns:xforms="http://www.w3.org/2002/xforms"
  xmlns:xhtml="http://www.w3.org/1999/xhtml"
  xmlns:xlink="http://www.w3.org/1999/xlink"
  office:version="1.2">

  <office:automatic-styles>

    <style:style style:family="text" style:name="Strong">
      <style:text-properties
        fo:color="#000000"
        fo:font-weight="bold" />
    </style:style>

  </office:automatic-styles>


  <office:body>
    <office:text>
      <!-- content will go here -->
    </office:text>
  </office:body>

</office:document-content>

我的想法是,我采用此 xml 并将内容注入(inject) office:text 标记(在 python 中),然后将其渲染回来。在这个例子中,我注入(inject)了一个简单的 text:p 标签。

document_content = ElementTree.parse('content-scaffold.xml').getroot()
office_body = document_content.find('office:body', NAMESPACES)
office_text = office_body.find('office:text', NAMESPACES)
p = ElementTree.SubElement(office_text, 'text:p')
p.text = "Hello"

然而,这是命名空间声明在呈现后的样子:

<office:document-content 
xmlns:fo="urn:oasis:names:tc:opendocument:xmlns:xsl-fo-compatible:1.0"
xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0" 
xmlns:style="urn:oasis:names:tc:opendocument:xmlns:style:1.0"
office:version="1.2">

这会导致以下错误:

Namespace prefix text on p is not defined

很明显,ElementTree 只保留需要的 xmlns 声明(在我的例子中是 fo、office 和 style,因为它们是 content-scaffold.xml 中唯一存在的声明),而且非常简洁。但是,我真的想要它们,以便能够使用所有 namespace 。

知道如何强制 ElementTree 保留它们吗?还是我从一开始就认为这是错误的?我愿意接受任何替代解决方案。

注意:我使用的是 Python 3 和 ElementTree

谢谢

最佳答案

ElementTree 在命名空间处理方面相当薄弱。但是,你要求的是可以做到的(但是有点麻烦):

from xml.etree import ElementTree as ET

NAMESPACES = {"anim": "urn:oasis:names:tc:opendocument:xmlns:animation:1.0",
  "chart": "urn:oasis:names:tc:opendocument:xmlns:chart:1.0",
  "config": "urn:oasis:names:tc:opendocument:xmlns:config:1.0",
  "db": "urn:oasis:names:tc:opendocument:xmlns:database:1.0",
  "dc": "http://purl.org/dc/elements/1.1/",
  "dr3d": "urn:oasis:names:tc:opendocument:xmlns:dr3d:1.0",
  "draw": "urn:oasis:names:tc:opendocument:xmlns:drawing:1.0",
  "fo": "urn:oasis:names:tc:opendocument:xmlns:xsl-fo-compatible:1.0",
  "form": "urn:oasis:names:tc:opendocument:xmlns:form:1.0",
  "grddl": "http://www.w3.org/2003/g/data-view#",
  "manifest": "urn:oasis:names:tc:opendocument:xmlns:manifest:1.0",
  "math": "http://www.w3.org/1998/Math/MathML",
  "meta": "urn:oasis:names:tc:opendocument:xmlns:meta:1.0",
  "number": "urn:oasis:names:tc:opendocument:xmlns:datastyle:1.0",
  "odf": "http://docs.oasis-open.org/ns/office/1.2/meta/odf#",
  "of": "urn:oasis:names:tc:opendocument:xmlns:of:1.2",
  "office": "urn:oasis:names:tc:opendocument:xmlns:office:1.0",
  "pkg": "http://docs.oasis-open.org/ns/office/1.2/meta/pkg#",
  "presentation": "urn:oasis:names:tc:opendocument:xmlns:presentation:1.0",
  "script": "urn:oasis:names:tc:opendocument:xmlns:script:1.0",
  "smil": "urn:oasis:names:tc:opendocument:xmlns:smil-compatible:1.0",
  "style": "urn:oasis:names:tc:opendocument:xmlns:style:1.0",
  "svg": "urn:oasis:names:tc:opendocument:xmlns:svg-compatible:1.0",
  "table": "urn:oasis:names:tc:opendocument:xmlns:table:1.0",
  "text": "urn:oasis:names:tc:opendocument:xmlns:text:1.0",
  "xforms": "http://www.w3.org/2002/xforms",
  "xhtml": "http://www.w3.org/1999/xhtml",
  "xlink": "http://www.w3.org/1999/xlink"}

document_content = ET.parse('content-scaffold.xml').getroot()
office_body = document_content.find('office:body',  NAMESPACES)
office_text = office_body.find('office:text', NAMESPACES)
p = ET.SubElement(office_text, 'text:p')
p.text = "Hello"

for prefix, uri in NAMESPACES.items():
    ET.register_namespace(prefix, uri)           # Ensure correct prefixes in output 
    if prefix not in ("office", "fo", "style"):  # Prevent duplicate ns declarations
        document_content.set("xmlns:" + prefix, uri)   # Add ns declarations to root element

ET.ElementTree(document_content).write("output.xml")

此代码将创建一个保留所有命名空间声明的结果文档。


这是如何使用 lxml 完成的:

from lxml import etree as ET

NAMESPACES = {"office": "urn:oasis:names:tc:opendocument:xmlns:office:1.0"}

document_content = ET.parse('content-scaffold.xml')
office_body = document_content.find('office:body', NAMESPACES)
office_text = office_body.find('office:text', NAMESPACES)
p = ET.SubElement(office_text, '{urn:oasis:names:tc:opendocument:xmlns:text:1.0}p')
p.text = "Hello"

document_content.write("output.xml")

请注意,您必须使用 Clark notation 提供元素名称在 SubElement() 中。

关于python - ElementTree:为什么我的 namespace 声明被删除了?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41937624/

有关python - ElementTree:为什么我的 namespace 声明被删除了?的更多相关文章

  1. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

    类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

  2. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  3. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

    我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

  4. ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby​​ 中生成它们? - 2

    我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%

  5. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  6. ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996?但是 4.2%2==0.2 - 2

    为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返

  7. ruby-on-rails - active_admin 目录中的常量警告重新声明 - 2

    我正在使用active_admin,我在Rails3应用程序的应用程序中有一个目录管理,其中包含模型和页面的声明。时不时地我也有一个类,当那个类有一个常量时,就像这样:classFooBAR="bar"end然后,我在每个必须在我的Rails应用程序中重新加载一些代码的请求中收到此警告:/Users/pupeno/helloworld/app/admin/billing.rb:12:warning:alreadyinitializedconstantBAR知道发生了什么以及如何避免这些警告吗? 最佳答案 在纯Ruby中:classA

  8. ruby - ruby 中的 TOPLEVEL_BINDING 是什么? - 2

    它不等于主线程的binding,这个toplevel作用域是什么?此作用域与主线程中的binding有何不同?>ruby-e'putsTOPLEVEL_BINDING===binding'false 最佳答案 事实是,TOPLEVEL_BINDING始终引用Binding的预定义全局实例,而Kernel#binding创建的新实例>Binding每次封装当前执行上下文。在顶层,它们都包含相同的绑定(bind),但它们不是同一个对象,您无法使用==或===测试它们的绑定(bind)相等性。putsTOPLEVEL_BINDINGput

  9. ruby - Infinity 和 NaN 的类型是什么? - 2

    我可以得到Infinity和NaNn=9.0/0#=>Infinityn.class#=>Floatm=0/0.0#=>NaNm.class#=>Float但是当我想直接访问Infinity或NaN时:Infinity#=>uninitializedconstantInfinity(NameError)NaN#=>uninitializedconstantNaN(NameError)什么是Infinity和NaN?它们是对象、关键字还是其他东西? 最佳答案 您看到打印为Infinity和NaN的只是Float类的两个特殊实例的字符串

  10. ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象,为什么它会起作用? - 2

    如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象

随机推荐