草庐IT

SGMLParser

全部标签

python - 使用 Python 2.7 解析 HTML - HTMLParser、SGMLParser 或 Beautiful Soup?

我想用Python2.7进行一些屏幕抓取,但我不知道HTMLParser、SGMLParser或BeautifulSoup之间的区别。这些都是为了解决同一个问题,还是出于不同的原因而存在?哪个最简单,哪个最健壮,哪个(如果有的话)是默认选择?另外,如果我忽略了一个重要的选项,请告诉我。编辑:我应该提一下,我在HTML解析方面并不是特别有经验,而且我特别感兴趣的是哪一个能让我最快地移动,目标是在一个特定的平台上解析HTML网站。 最佳答案 我正在使用并推荐使用lxml和pyquery来解析HTML。几个月前我不得不编写一个网络抓取机器