BeautifulSoup4

python - 我们可以将 XPath 与 BeautifulSoup 一起使用吗？

我正在使用BeautifulSoup抓取一个URL，并且我有以下代码，以查找其类为'empformbody'的td标记:importurllibimporturllib2fromBeautifulSoupimportBeautifulSoupurl="http://www.example.com/servlet/av/ResultTemplate=AVResult.html"req=urllib2.Request(url)response=urllib2.urlopen(req)the_page=response.read()soup=BeautifulSoup(the_page)so

python - ImportError:没有名为 bs4 的模块(BeautifulSoup)

我正在使用Python并使用Flask。当我在我的计算机上运行我的主要Python文件时，它运行良好，但是当我激活venv并在终端中运行FlaskPython文件时，它说我的主要Python文件有“没有名为bs4的模块”。非常感谢任何意见或建议。最佳答案激活virtualenv，然后安装BeautifulSoup4:$pipinstallBeautifulSoup4当您使用easy_install安装bs4时，您在系统范围内安装了它。所以你的系统python可以导入它，但不是你的virtualenvpython。如果您不需要将b

BeautifulSoup ImportError section code virtualenv python flask

python - ImportError:没有名为 bs4 的模块(BeautifulSoup)

我正在使用Python并使用Flask。当我在我的计算机上运行我的主要Python文件时，它运行良好，但是当我激活venv并在终端中运行FlaskPython文件时，它说我的主要Python文件有“没有名为bs4的模块”。非常感谢任何意见或建议。最佳答案激活virtualenv，然后安装BeautifulSoup4:$pipinstallBeautifulSoup4当您使用easy_install安装bs4时，您在系统范围内安装了它。所以你的系统python可以导入它，但不是你的virtualenvpython。如果您不需要将b

BeautifulSoup ImportError section code virtualenv python flask

python - BeautifulSoup 返回意外的额外空间

我正在尝试使用BeautifulSoup从html文档中获取一些文本。在一个对我来说非常相关的案例中，它产生了一个奇怪而有趣的结果:在某个点之后，文本中充满了多余的空格(一个空格将每个字母与下一个字母分开)。我试图在网上搜索以找到原因，但我只遇到了一些关于相反错误的消息(根本没有空格)。您有什么建议或暗示会发生这种情况，以及如何解决这个问题吗？这是我创建的最基本的代码:frombs4importBeautifulSoupimporturllib2html=urllib2.urlopen("http://www.beppegrillo.it")prova=html.read()soup=

BeautifulSoup python section urllib2 html text

python - BeautifulSoup 美化自定义换行选项

我正在使用BeautifulSoup构建xml文件。似乎我的两个选项是1)无格式即val1val2val3或2)美化即val1val2val3但我真的更喜欢它看起来像这样:val1val2val3我意识到我可以破解bs4来实现这个结果，但我想听听是否存在任何选项。我不太在意4个空格的缩进(尽管那样会很好)，而更在意任何结束标记之后或两个开始标记之间的换行符。我也很好奇是否有这种格式化方式的名称，因为它对我来说似乎是最明智的方式。最佳答案你可以制作简单的html.HTMLParser来实现你想要的:frombs4importBea

自定 BeautifulSoup field lt gt python xml prettify

python - BeautifulSoup: AttributeError: 'str' 对象没有属性 'copy' 。在 Ubuntu 上工作，在 Windows 上失败

我在使用BeautifulSoup时遇到一个奇怪的错误。这是我正在运行的代码片段:whileTrue:listing_soup=soupify(urlget(page_url))foriinlisting_soup.findAll('div','searchResultContent'):#dosomestuff...这是抛出的异常:Traceback(mostrecentcalllast):File"C:\path\to\script.py",line716,inforiinlisting_soup.findAll('div','searchResultContent'):File"

amp 上工 section BeautifulSoup 39 python windows windows-xp

windows - BeautifulSoup4无法安装在Windows7上的python3.5中

我已经从https://www.crummy.com/software/BeautifulSoup/bs4/download/4.5/下载了beautifulsoup4-4.5.3.tar.gz|并将其解压缩到我的python工作目录(不是我的python安装目录)。但是，当我运行frombs4importBeautifulSoup在我的IDLE中弹出错误消息:>>>frombs4importBeautifulSoupTraceback(mostrecentcalllast):File"",line1,infrombs4importBeautifulSoupFile"D:\python

BeautifulSoup4 BeautifulSoup code windows python-3.x installation python-2to3

python - 使用 BeautifulSoup 从标签中提取字符串

我正在尝试从下表中提取。我在第二次之后剪掉它，接下来还有六个。需要提取所有八个字符串，例如在下面的示例中，我想要值61.5,56.43等下面的代码只给了我第一个值，61.5.我怎样才能得到剩余的值(value)？soup.find("div",{"class":"value"}).textDornum61.5MSm3/dEmdenEMS56.43MSm3/d 最佳答案使用soup.find_all()获取匹配元素列表，然后获取每个元素的text属性:frombs4importBeautifulSouphtml='''Dornum6

BeautifulSoup python 34 gt div

python - 访问 BeautifulSoup 中的属性时出现问题

我在使用Python(2.7)时遇到问题。代码主要包括:str='ABCDEF'z=BeautifulStoneSoup(str)forxinz.findAll('el'):#if'at'inx:#ifhasattr(x,'at'):printx['at']else:print'nothing'我期待第一个if语句正常工作(即:如果at不存在，则打印"nothing")，但它始终不打印任何内容(即:始终为False)。第二个if另一方面总是True，这将导致代码引发KeyError尝试访问at时从第二个元素，当然不存在。最佳答案

时出 BeautifulSoup code 39 python attributes

python - 我可以更改 BeautifulSoup 将 XML 标签转换为小写的行为吗？

我正在编写代码来解析用XML编写的配置文件，其中XML标记是大小写混合的，并且大小写很重要。BeautifulSoup似乎默认将XML标签转换为小写，我想更改此行为。我不是第一个提出这个问题的人[参见here].但是，我不理解该问题的答案，在BeautifulSoup-3.1.0.1BeautifulSoup.py中似乎不包含任何“encodedName”或“Tag.__str__" 最佳答案 importhtml5libfromhtml5libimporttreebuildersf=open("mydocument.html")p

BeautifulSoup python section html5lib xml