草庐IT

yolov8-python

全部标签

python - 使用 lxml 有效地计算非常大的 XML 文档中的元素

我有一个非常大(1.8GB)的XML文档。我想简单地找到带有标签的元素数量.我已经做到了:context=etree.iterparse('./test.xml',tag='Product')num_elems=0forevent,elemincontext:num_elems+=1printnum_elems它有效,但是有没有更快的方法呢? 最佳答案 因为这有效,我认为内存使用不是问题(iterparse将在内存中构建整个文件的树,除非您在迭代时修剪它要素)。在那种情况下,省去在Python中迭代和计数的麻烦,让LXML/libx

python - 当输入开始标记时,lxml 的解析器目标不会立即触发 'start' 回调

我试图使用lxml的parsertargetinterface逐步将XML解析为“自定义”树,我遇到了以下问题:如果您实例化解析器并立即将根元素的开始标记提供给它,则目标的“开始”回调不会触发,直到任何其他事件发生(例如传入数据、结束标记、另一个开始标记等)。这似乎不会发生在任何其他(嵌套)元素上。演示:classEchoTarget(object):defstart(self,tag,attrib):print("start%s%s"%(tag,attrib))defend(self,tag):print("end%s"%tag)defdata(self,data):print("d

使用正则表达式的 Python XML 重建

我有这个部分XMLstring='''someValuesomeValue'''现在我想“傻傻地”修复一下。我想到了一种方法-对所有开始元素和结束元素进行正则表达式-->检查缺少哪个元素并添加它。当然,不要涉及太多细节。到目前为止我得到的是(这不起作用):importrestarts=re.compile('(?)|(?)')print(start.findall(string))我期望的是x:root、x:tag2、x:tag3的列表我一直在谷歌上搜索并尝试了很多,但找不到答案。我从这个表达式中得到的唯一东西是x:root、x:tag1、x:tag3。请帮忙谢谢

python - 从 MediaWiki 的 API 维基文本中提取 Python 中的模板参数

有没有办法从MediaWikia的API中提取部分文本?例如,此链接将所有内容转储为XML格式:http://marvel.wikia.com/api.php?action=query&prop=revisions&titles=All-New%20X-Men%20Vol%201%201&rvprop=content&format=xml但是它没有太多的结构,即使是json格式。我想获取Writer1_1、Penciler1_1等的文本。也许我的参数不正确,所以也许还有其他选择输出。您可以以更易读的方式查看内容here. 最佳答案

python - 无法卸载模块 - Openerp

当我要卸载我自己的模块时,它给出了一个错误。(OpenErpver7)在我的课上我也输入了不同的不同修改。但我没有清除所有这些东西并只保留下面的代码。请帮助我找出问题所在..现在当我尝试安装address_book模块时也发生了这个错误File"/home/priyan/Software/openerp-7.0-20130309-002120/openerp/modules/registry.py",line218,innewopenerp.modules.load_modules(registry.db,force_demo,status,update_module)File"/ho

python - OpenERP 获取下一个序列号

OpenERP在我们保存一条记录时给出了一个序号。我已经完成了那个模块。当我创建一个工作人员时,按照那个模块,然后将员工编号加载为EMP001、EMP002..我的要求是这样的。当我要创建一个新员工时,需要将下一个序列号显示为只读字段。例如:当我要创建第9名员工时,需要在我的empno字段中显示EMP009。我当前的代码已上传到以下位置https://github.com/priyankahdp/openerp/tree/openerp现在已排序我在下面添加了_defaults={'register_no':lambdaobj,cr,uid,context:obj.pool.get('

python - 如何对 OOo/LibreOffice Writer 文档进行简单操作,然后保存

我想对LibreOfficeWriter文档做一些非常简单的操作……然后再次保存为ODT文件……这可能有什么问题?如果我尝试这样做,我会在zip文件(ODT文件)中得到2个content.xmls...奇怪的是,这两个(例如,如果解压缩为“content.xml”和“content_1.xml”)似乎包含修改后的内容...zipfile=ZipFile(file_path,"a")forzip_infoinzipfile.infolist():contents=zipfile.read(zip_info.filename)if(zip_info.filename=="content.x

python - lxml:通过XSLT将XML转换为HTML并获取HtmlElements

我有一个XML文件形式的数据。我还获得了一个XSLT来将XML转换为HTML。我可以使用lxml来执行转换,但是,我想在转换后更改一些HTML标记。如何将这个新的etree转换为HtmlElements,以便我可以专门使用某些方法,如.cssselect()等。 最佳答案 >>>importlxml.etree>>>importlxml.html>>>>>>xmlstring='''\......link1link2...'''>>>root=lxml.etree.fromstring(xmlstring)>>>root.cssse

python - FIXML python 解析器

我希望在python中解析一个FIXML文件(~150M大小),并最终从解析的数据中生成一个pandas数据帧。我一直在试验xmltodict和xml的ETree解析器,但想知道是否已经有一个用于“FIXML”的python解析器可以更容易地使用它来生成pandas数据帧。有人知道吗?谢谢。 最佳答案 PyPI包索引显示了FIXML解析器的几个命中:https://pypi.python.org/pypi?%3Aaction=search&term=fixml&submit=search也就是说,架构很简单,所以使用lxml也是一个

python lxml 3.3.5 - 加载代码时出错 - "ValueError: lxml.etree._Element has the wrong size, try recompiling"

我通过pip安装了lxml3.3.5。现在我在运行一些Django测试时遇到了问题:Traceback(mostrecentcalllast):File"manage.py",line10,inexecute_from_command_line(sys.argv)File"/home/vagrant/venv/local/lib/python2.7/site-packages/django/core/management/__init__.py",line399,inexecute_from_command_lineutility.execute()File"/home/vagrant