草庐IT

find_stuff

全部标签

python - BeautifulSoup `find_all` 生成器

有什么办法可以转find_all变成一个内存效率更高的生成器?例如:给定:soup=BeautifulSoup(content,"html.parser")returnsoup.find_all('item')我想改用:soup=BeautifulSoup(content,"html.parser")whileTrue:yieldsoup.next_item_generator()(假设正确处理最终的StopIteration异常)有一些内置的生成器,但不会在查找中产生下一个结果。find只返回第一项。数以千计的项目,find_all占用了很多内存。对于5792项,我发现RAM刚好超过

python - NumPy 数组 : Efficiently find matching indices

我有两个列表,其中一个很大(数百万个元素),另一个有几千个。我要执行以下操作bigArray=[0,1,0,2,3,2,,.....]smallArray=[0,1,2,3,4]foriinlen(smallArray):pts=np.where(bigArray==smallArray[i])#Dostuffwithpts...上面的工作,但很慢。有没有什么方法可以更有效地做到这一点而无需诉诸于用C编写一些东西? 最佳答案 在您的情况下,您可能会受益于对大数组进行预排序。下面是演示如何将时间从大约45秒减少到2秒的示例(在我的笔记

python - ServerNotFoundError : Unable to find the server at accounts. google.com

我正在使用基于以下示例的google身份验证。一切正常,然后当我尝试登录时突然出现此错误:httplib2.ServerNotFoundErrorServerNotFoundError:Unabletofindtheserverataccounts.google.com有什么地方可能是错的吗?fromflaskimportFlask,redirect,url_for,sessionfromflask_oauthimportOAuth#Youmustconfigurethese3valuesfromGoogleAPIsconsole#https://code.google.com/api

python - OpenOffice Python 宏 : Where can I find useful documentation?

我正在尝试为OpenOfficeCalc创建一个宏,它将切换包含用户指定值的单元格的背景颜色。由于我不了解OpenOfficeBasic也不想学习它,所以我想用Python编写我的宏。问题是,我找不到任何关于如何编写Python宏的有用文档。从我所做的阅读来看,我似乎无法建立一个动态环境,从中我可以检查适当的对象本身,所以我将不得不完全依赖文档。我在哪里可以学习如何编写我的宏?编辑:我已经知道“PythonasaMacroLanguage”,但它只回答了将Python文件放在哪里。它没有提及API、如何搜索和修改单元格等。此外,没有关于XSCRIPTCONTEXT的信息,OOo显然将其

Python Pandas : can't find numpy. core.multiarray 导入 Pandas 时

我正在尝试让我的代码(在eclipse中运行)导入pandas。我收到以下错误:"ImportError:numpy.core.multiarrayfailedtoimport"当我尝试导入pandas时。我正在使用python2.7、pandas0.7.1和numpy1.5.1 最佳答案 只是为了确保:您是否从源代码安装了pandas?确保它使用的是所需的NumPy版本。安装pandas后是否升级了NumPy?确保重新编译pandas,因为ABI可能会发生一些变化(但是对于那个版本的NumPy,我怀疑是这种情况)您是从源目录调用p

python - find_all 带有 BeautifulSoup 4 的 camelCase 标签名称

我正在尝试使用BeautifulSoup4.4.0抓取一个xml文件,该文件的标签名称采用驼峰命名法,而find_all似乎无法找到它们。示例代码:frombs4importBeautifulSoupxml="""world"""soup=BeautifulSoup(xml,"lxml")forxinsoup.find_all("hello"):printxxml2=""":-)"""soup=BeautifulSoup(xml2,"lxml")forxinsoup.find_all("helloWorld"):printx我得到的输出是:$pythonsoup_test.pyworl

python - Beautifulsoup - find_all 的 '*' 是什么?

我正在尝试获取所有从一个页面。attrs每次都不一样,还有一些siblings有colourred,colourpink等类(class)。所以我正在寻找colourblue之后的任何其他字符在class要包含在结果中。我试过使用*,但它没有用:soup.find_all('tr',{'class':'colourblue*'})谢谢 最佳答案 可以使用常用的CSSSelectors配上漂亮的汤:>>>soup=BeautifulSoup('''..................''')>>>soup.select('tr.col

python - Python string.find 使用什么?

documentation对于Python2.7,将string.find列为已弃用的函数,但不提供替代函数(与atoi和atol不同)。我现在正在用2.7编写代码,所以我很乐意使用它,但我想知道:它将被什么取代?它可以在2.7中使用吗(如果可以,我现在就使用它以避免以后重新编码)? 最佳答案 几乎整个string模块都已作为方法函数移至str类型。为什么要使用string模块,几乎所有你需要的都已经是字符串类型的一部分了?http://docs.python.org/library/stdtypes.html#str.find字符

python - ElementTree find()/findall() 找不到带有命名空间的标签?

如果指定命名空间,我希望使用以下代码能够搜索目标标记。importxml.etree.ElementTreeasETxml="""nameANameHere"""tree=ET.fromstring(xml)printtree[0][0]#tree.find('{http://www.company.com/app/v2}target')#None无论我做什么,我都找不到那个目标标签?我尝试了各种ElementTree实现,包括据称接受{*}命名空间的lxml。没有骰子? 最佳答案 target不是根元素;您应该在.//.前面加上>

python - 找不到文件错误 : [WinError 2] The system cannot find the file specified:

importosdefrename(directory):fornameinos.listdir(directory):print(name)os.rename(name,"0"+name)path=input("Enterthefilepath")rename(path)我想重命名某个目录中的每个文件,以便它在文件名的开头添加一个0,但是当我尝试运行代码时出现此错误:(FileNotFoundError:[WinError2]Thesystemcannotfindthefilespecified:'0.jpg'->'00.jpg')我确定其中有一个名为0.jpg的文件,但我不确定问题