草庐IT

BeautifulSoup4

全部标签

python - 无法为 python 3.6 安装 BeautifulSoup

在过去的45分钟里,我绝望地试图运行:frombs4importBeautifulSoup但是没有用。我试过命令:python-mpipinstallbeautifulsoup4它说:Requirementalreadysatisfied:beautifulsoup4inc:\python27\lib\site-packages我试过:pip3installbeautifulsoup4哪里说的一样。我试过:pipinstallbeautifulsoup4同样的事情。我已经查看了整个stackoverflow、youtube,我正在逼疯自己试图解决这个问题。我不知道该怎么做,请帮助我。当

python - 用 beautifulsoup 克隆元素

我必须将一个文档的一部分复制到另一个文档,但我不想修改我从中复制的文档。如果我使用.extract()它会从树中删除该元素。如果我只是附加选定的元素,如document2.append(document1.tag),它仍然会从document1中删除该元素。因为我使用的是真实文件,所以我不能在修改后保存document1,但是有什么方法可以在不损坏文档的情况下做到这一点吗? 最佳答案 BeautifulSoup在4.4(2015年7月发布)之前的版本中没有原生克隆功能;您必须自己创建一个深拷贝,这很棘手,因为每个元素都维护到树的其余

python - 使用 BeautifulSoup 从元标记中获取数据

我正在尝试从元标记中读取描述,这就是我使用的soup.findAll(name="description")但它不起作用,然而,下面的代码工作得很好soup.findAll(align="center")如何从文档头部的元标记中读取描述? 最佳答案 是的,name不能用于关键字参数形式来指定名为name的属性,因为名称name已被使用通过BeautifulSoup本身。所以改用:soup.findAll(attrs={"name":"description"})这就是attrs参数的作用:将那些不能使用关键字参数形式的属性约束作为字

python - Ubuntu - 如何在 Python 3.3 而不是 Python 2.7 上安装 Python 模块 (BeautifulSoup)?

我有这段代码(写在BS4文档中):frombs4importBeautifulSoup当我运行脚本(使用python3)时出现错误:ImportError:Nomodulenamed'bs4'因此通过以下方式安装了BeatifulSoup:sudopipinstallBeatifulSoup4但是当我尝试再次运行脚本时,我得到了同样的错误。事实上BS4安装在:BeautifulSoup4in/usr/local/lib/python2.7/dist-packages但我想在python3.3中安装和使用它(因为还有其他模块不能在python2.7中使用)。我试过:virtualenv-

python - 如何使用 CSS 选择器使用 BeautifulSoup 检索位于某个类中的特定链接?

我是Python的新手,我正在学习它是为了抓取目的我正在使用BeautifulSoup来收集链接(即“a”标签的href)。我正在尝试收集网站http://allevents.in/lahore/的“即将发生的事件”选项卡下的链接。.我正在使用Firebug检查元素并获取CSS路径,但这段代码没有返回任何内容。我正在寻找修复程序以及有关如何选择适当的CSS选择器以从任何站点检索所需链接的一些建议。我写了这段代码:frombs4importBeautifulSoupimportrequestsurl="http://allevents.in/lahore/"r=requests.get(

python - BeautifulSoup: AttributeError: 'NavigableString' 对象没有属性 'name'

你知道为什么BeautifulSoup教程中的第一个例子http://www.crummy.com/software/BeautifulSoup/documentation.html#QuickStart给出AttributeError:'NavigableString'objecthasnoattribute'name'?根据thisanswerHTML中的空格字符会导致问题。我尝试使用几页的来源,并且1工作其他人给出了同样的错误(我删除了空格)。你能解释一下“name”指的是什么以及为什么会发生这个错误吗?谢谢。 最佳答案 na

python 2.7 : How to use BeautifulSoup in Google App Engine?

这个问题在这里已经有了答案:HowtoincludethirdpartyPythonlibrariesinGoogleAppEngine?(6个答案)关闭9年前。我正在尝试以下操作:frombs4importBeautifulSoup得到了错误Traceback(mostrecentcalllast):File"/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_appengine/google/appe

python - BeautifulSoup4 藏在哪里?

我执行了sudopipinstallBeautifulSoup4并得到了非常乐观的响应:Downloading/unpackingbeautifulsoup4Runningsetup.pyegg_infoforpackagebeautifulsoup4Installingcollectedpackages:beautifulsoup4Runningsetup.pyinstallforbeautifulsoup4Successfullyinstalledbeautifulsoup4Cleaningup..但是当我尝试在脚本中使用importBeautifulSoup4或fromBeaut

javascript - 解析从 BeautifulSoup 返回的 JavaScript

我想解析网页http://dcsd.nutrislice.com/menu/meadow-view/lunch/获取今天的午餐菜单。(我构建了一个Adafruit#IoT热敏打印机,我想每天自动打印菜单。)我最初使用BeautifulSoup来解决这个问题,但事实证明大部分数据都是用JavaScript加载的,我不确定BeautifulSoup是否可以处理它。如果您查看源代码,您会看到存储在bootstrapData['menuMonthWeeks']中的相关数据。importurllib2fromBeautifulSoupimportBeautifulSoupurl="http://

python - 无法使用 BeautifulSoup4 (Python 3) 抓取特定表

我想从Ligue1足球网站上抓取一张表格。特别是包含卡片和裁判信息的表格。http://www.ligue1.com/LFPStats/stats_arbitre?competition=D1我正在使用以下代码:importrequestsfrombs4importBeautifulSoupimportcsvr=requests.get("http://www.ligue1.com/LFPStats/stats_arbitre?competition=D1")soup=BeautifulSoup(r.content,"html.parser")table=soup.find_all('