草庐IT

python - 使用 Visual Studio C++ 2010 Express 在 Windows x 86(32 位)上为 Python 3.4 安装 lxml

相关相关问题:error:Unabletofindvcvarsall.batLXML3.3withPython3.3onwindows732-bit相关回答:https://stackoverflow.com/a/18045219/1175496相关评论:BuildinglxmlforPython2.7onWindows“@ziyuang这意味着您使用的是使用MicrosoftVisualStudio2010的Python3.3。如果是这种情况,那么答案是肯定的,您应该安装此版本。”事实Windowsx86(32位)同时安装了VisualStudioC++2008(fromhere)E

80+GB XML 的 Python sax 到 lxml

您将如何使用sax读取XML文件并将其转换为lxmletree.iterparse元素?为了提供问题的概述,我使用lxml构建了一个XML摄取工具,用于XML提要,其大小范围为25-500MB,需要每天摄取两次,但需要执行一次摄取60-100GB文件的时间。我选择使用lxml是基于详细说明节点大小不超过4-8GB的规范,我认为这将允许将节点读入内存并在完成后清除。如果代码在下面是一个概览elements=etree.iterparse(self._source,events=('end',))forevent,elementinelements:finished=Trueifeleme

python - MacOS 10.8.4 安装 lxml 失败

我在将lxml安装到我的Mac操作系统时遇到问题。构建它时出现以下错误。这是我在使用pipinstalllxml时遇到的错误/private/var/folders/9s/s5hl5w4x7zjdjkdljw9cnsrm0000gn/T/pip-build-khuevu/lxml/src/lxml/includes/etree_defs.h:9:10:fatalerror:'libxml/xmlversion.h'filenotfound我已经用brew安装了libxml2:brewinstalllibxml2brewlinklibxml2--force我是Mac新手。在Ubuntu中

python - 配置返回代码 256 - python setup.py egg_info 失败,错误代码为 1 in/tmp/pip_build_root/lxml

尝试在Python3.4上构建lxml:系统确实有libxml2和libxslt。pipbuild无法确定多核(?)等(?)相关版本下载:lxml-3.4.1libiconv-1.14libxml2-2.9.2libxslt-1.1.28首先,尝试标准构建(动态):$CFLAGS="-O0"pip3installlxml构建没有错误,但是:Python3.4.2(default,Dec132014,16:48:48)[GCC4.8.3]onsunos5Type"help","copyright","credits"or"license"formoreinformation.>>>fro

python - 如何将 xml 文件传递​​给 lxml 进行解析?

我正在尝试使用lxml解析xml文件。xml.etree允许我将文件名作为参数简单地传递给parse函数,因此我尝试对lxml执行相同的操作。我的代码:fromlxmlimportetreefromlxmlimportobjectifyfile="C:\Projects\python\cb.xml"tree=etree.parse(file)但是我得到了错误:Traceback(mostrecentcalllast):File"cb.py",line5,intree=etree.parse(file)File"lxml.etree.pyx",line2698,inlxml.etree.

python - xml.etree.ElementTree 与 lxml.etree : different internal node representation?

我一直在将我的一些原始xml.etree.ElementTree(ET)代码转换为lxml.etree(lxmlET)。幸运的是,两者之间有很多相似之处。但是,我确实偶然发现了一些我在任何文档中都找不到的奇怪行为。它考虑了后代节点的内部表示。在ET中,iter()用于迭代元素的所有后代,可选择按标签名称进行过滤。因为我在文档中找不到关于此的任何详细信息,所以我希望lxmlET有类似的行为。问题是,从测试中我得出结论,在lxmlET中,树有不同的内部表示。在下面的示例中,我遍历树中的节点并打印每个节点的子节点,但此外我还创建了这些子节点的所有不同组合并打印了它们。这意味着,如果一个元素有

python - lxml 将元素转换为元素树

以下测试代码读取文件,并使用lxml.html生成页面的DOM/Graph的叶节点。但是,我也在尝试弄清楚如何从“字符串”获取输入。使用:lxml.html.fromstring(s)不起作用,因为这会生成一个Element而不是ElementTree。所以,我想弄清楚如何将元素转换为ElementTree。[我的测试代码]importlxml.htmlfromlxmlimportetree#tryingthistoseeifneeded#toconvertfromelementtoelementtree#cmd='catosu_test.txt'cmd='cato2.txt'proc

python - lxml:将命名空间添加到输入文件

我正在解析由外部生成的xml文件program.然后我想使用我自己的命名空间向这个文件添加自定义注释。我的输入如下所示:..................问题是lxml只在使用时声明命名空间,这意味着声明重复了很多次,像这样(简化):Someimportantdatawhichmustbekept....是否可以强制lxml在父元素中只写一次此声明,例如sbml或listOfSpecies?还是有充分的理由不这样做?我想要的结果是:Someimportantdatawhichmustbekept....重要的问题是必须保留从文件读取的现有数据,所以我不能只创建一个新的根元素(我想?)

python - 使用 lxml 处理 XML 文档中类似实体的最佳方法是什么?

考虑以下几点:fromlxmlimportetreefromStringIOimportStringIOx="""\n â"""p=etree.XMLParser(remove_blank_text=True,resolve_entities=False)r=etree.parse(StringIO(x),p)这会失败:lxml.etree.XMLSyntaxError:实体“nbsp”未定义,第2行,第11列这是因为resolve_entities=False不会忽略它们,只是不会解析它们。如果我改用etree.HTMLParser,它会创建html和body标

python - 如何匹配 XPath (lxml) 中元素的内容?

我想使用XPath表达式通过lxml解析HTML。我的问题是匹配标签的内容:例如给定Example元素我可以使用匹配href属性.//a[@href='http://something']但是给定的表达式.//a[.='Example']甚至.//a[contains(.,'Example')]lxml抛出“无效节点谓词”异常。我做错了什么?编辑:示例代码:fromlxmlimportetreefromcStringIOimportStringIOhtml='Example'parser=etree.HTMLParser()tree=etree.parse(StringIO(html)