草庐IT

euroleague

全部标签

python - Scrapy 规则如何与爬虫一起使用

我很难理解爬虫爬虫的规则。我有一个例子不能像我希望的那样工作,所以它可能是两件事:我不明白规则是如何运作的。我形成了不正确的正则表达式,导致我无法获得所需的结果。好的,这就是我想要做的:我想写一个爬虫,它会从http://www.euroleague.net获取所有可用的统计信息。网站。包含我开始所需的所有信息的网站页面是here.第1步我在想的第一步是提取“季节”链接并将其搁置。这里是我打算匹配的HTML/href(我想一一匹配“季节”部分中的所有链接,但我认为以一个链接为例会更容易):href="/main/results/by-date?seasoncode=E2001"这是我为

python - Scrapy 规则如何与爬虫一起使用

我很难理解爬虫爬虫的规则。我有一个例子不能像我希望的那样工作,所以它可能是两件事:我不明白规则是如何运作的。我形成了不正确的正则表达式,导致我无法获得所需的结果。好的,这就是我想要做的:我想写一个爬虫,它会从http://www.euroleague.net获取所有可用的统计信息。网站。包含我开始所需的所有信息的网站页面是here.第1步我在想的第一步是提取“季节”链接并将其搁置。这里是我打算匹配的HTML/href(我想一一匹配“季节”部分中的所有链接,但我认为以一个链接为例会更容易):href="/main/results/by-date?seasoncode=E2001"这是我为