草庐IT

Python格式化大文本

全部标签

php - 我的 PHP 应用程序需要导出为一系列不同的 XML 格式 : should I use XSLT or native PHP?

我的PHP应用程序需要能够导出(和导入)一系列不同的数据格式,主要是基于XML。我可以选择在PHP中,使用DOM导出一些基于XML的格式,该格式是其他格式所需的所有数据的超集,并为我想要支持的每种输出格式创建一个单独的XSLT样式表,通过PHP的XSL运行DOM输出扩展名。或不使用PHP的XSL扩展,而是将每种输出格式实现为原生PHP中的一个类,使用DOM将内部对象/结构直接转换为给定的XML格式,每个此类都实现相同的接口(interface),因此它们可以互换。该应用程序将由大学使用,是一种以各种方式管理“人员”记录的工具,并从各种来源(例如他们的人力资源系统等)导入/导出。我将实现

python - 使用 Python 的维基百科

我有这个非常简单的python代码来读取维基百科api的xml:importurllibfromxml.domimportminidomusock=urllib.urlopen("http://en.wikipedia.org/w/api.php?action=query&titles=Fractal&prop=links&pllimit=500")xmldoc=minidom.parse(usock)usock.close()printxmldoc.toxml()但此代码返回这些错误:Traceback(mostrecentcalllast):File"/home/user/work

python - 用 Python 解析 XML xml.sax : How does one "keep track" of where in the tree you are?

我需要定期从我们的管理软件导出XML文件。这是我第一次在Python中使用XML解析。使用xml.sax的XML并不是非常困难,但是“跟踪”您在XML树中的位置的最佳方法是什么?例如,我有一份我们的客户名单。我想通过提取电话,但有多个地方出现:eExact->Accounts->Account->Contacts->Contact->Addresses->Address->PhoneeExact->Accounts->Account->Contacts->Contact->PhoneeExact->Accounts->Account->Phone所以我需要不断跟踪我在XML树中的确切位

python - 如何使用 django/python 解析外部 XML 文件

我做了一些研究,试图从另一个网络服务器解析XML文件,并遇到了一个叫做minidom的东西。.我已经尝试在我的view.py文件中实现它:fromxml.domimportminidomimportmodelsdeftest(request):data={}doc=minidom.parse("http://www.someotherdomain.com/XML.aspx?id=27550&limit=100")我遇到的问题是出现错误ExceptionValue:[Errno2]Nosuchfileordirectory:'http://www.someotherdomain.com/

python - 将压缩的 xml 提要解析到 ElementTree

我试图在python中将以下提要解析到ElementTree中:“http://smarkets.s3.amazonaws.com/oddsfeed.xml”(警告大文件)到目前为止,这是我尝试过的:feed=urllib.urlopen("http://smarkets.s3.amazonaws.com/oddsfeed.xml")#feediscompressedcompressed_data=feed.read()importStringIOcompressedstream=StringIO.StringIO(compressed_data)importgzipgzipper=g

python - 使用 xmltodict 从已解析的 xml 文件的键中删除特殊字符

我使用xmltodict模块解析了一个xml文件,结果存储在字典中。现在我想删除字典每个键中的特殊字符@和#。defremove_using_json(parse_result):data={}data=json.dumps(parse_result)#printdata#fordindata:forkey,valueindata.iterkeys():ifkey[0]=='@':data[key]=key.strip("@")elifkey[0]=='#':data[key]=key.strip("#") 最佳答案 您不应该从您的

python - 在给定标签处将 XML 文件拆分为多个

我想将一个XML文件拆分成多个文件。我的工作站仅限于使用Xalan2.7.1的EclipseMars。我也可以使用Python,但以前从未使用过。DoeJonMMustermannMaxM我怎样才能把它们变成这样DoeJonM我需要每个“行”-数据在一个带有标题的文件中。上面的数据只是一个例子。大多数“行”数据有16个属性,但它会随着时间的推移而变化。 最佳答案 使用Python元素树。创建一个文件,例如xmlsplitter.py。添加以下代码(其中file.xml是您的xml文件并假设每一行都有一个唯一的NAME元素。)。imp

XML 文本格式

有谁知道我可以在其中粘贴xml(从我的java类中的System.out中获取它)并将其格式化为xml所以它不是很长的文本行的好程序? 最佳答案 我喜欢XMLPad.它有一个很好的格式化程序加上一堆可视化工具,例如TreeView和GridView。还有一个很好的交互式XPath查询工具,可能还有更多功能。 关于XML文本格式,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/190

xml - XSLT 函数以 YYYYMMDD 格式验证日期

我正在寻找验证保存日期的XML元素的建议,我需要XSLT中的函数来验证它是否采用YYYYMMDD格式。 最佳答案 注意:以下内容适用于XSLT1.0版,它没有日期数据类型。如果您的XSLT处理器支持never版本,请使用内置日期函数之一。这在一定程度上取决于您要推进“验证”的程度。你可以这样做:您还可以进行更彻底的检查:但是,后者仍然允许20090231。如果您想排除这种可能性,则可能不可避免地会调用某种扩展函数。 关于xml-XSLT函数以YYYYMMDD格式验证日期,我们在Stack

python - 将返回的 XML 数据放入字典的简单快捷的方法是什么?

我正在尝试获取返回的数据:http://ipinfodb.com/ip_query.php?ip=74.125.45.100&timezone=true以快速简单的方式写入字典。最好的方法是什么?谢谢。 最佳答案 使用标准Python库中的xml:importxml.etree.ElementTreeasxeecontents='''\74.125.45.100OKUSUnitedStates06CaliforniaMountainView9404337.4192-122.057America/Los_Angeles-252001'