草庐IT

python - 使用 Python/urllib2 处理 rss 重定向

在指向从RSS提要获取的文章的链接上调用urrlib2.urlopen会导致以下错误:urllib2.HTTPError:HTTPError301:TheHTTPserverreturnedaredirecterrorthatwouldleadtoaninfiniteloop.Thelast30xerrormessagewas:MovedPermanently根据文档,urllib2支持重定向。在Java上,只需调用即可解决问题HttpURLConnection.setFollowRedirects(true);如何用Python解决?更新我遇到问题的链接:http://feeds.n

python - 如何在 urllib2 请求中获取默认 header ?

我有一个使用urllib2的Python网络客户端。将HTTPheader添加到我的传出请求中非常容易。我只是创建了一个包含要添加的header的字典,并将其传递给请求初始化程序。但是,其他“标准”HTTPheader以及我明确添加的自定义header都会添加到请求中。当我使用Wireshark嗅探请求时,除了我自己添加的标题之外,我还看到了标题。我的问题是如何访问这些header?我想记录每个请求(包括完整HTTPheader集),但不知道如何做。有什么建议吗?简而言之:如何从urllib2创建的HTTP请求中获取所有传出header? 最佳答案

Python 3.5.1 urllib 没有属性请求

我试过了importurllib.request或importurllib我的urllib的路径是/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/__init__.py我想知道urlopen在哪里,或者我的python模块是否指向了错误的文件? 最佳答案 根据this,您必须使用以下内容:importurllib.request原因是:Withpackages,likethis,yousometimesneedtoexplicitlyimp

python - 为 python 3 urllib 打开调试输出

在python2中,可以通过以下方式从urllib获取调试输出importhttplibimporturllibhttplib.HTTPConnection.debuglevel=1response=urllib.urlopen('http://example.com').read()然而,在python3中它看起来已经被移动到http.client.HTTPConnection.set_debuglevel(level)但是,我直接使用urllib而不是http.client。我该如何设置才能使我的http请求以这种方式显示调试信息?这是我目前使用的方法。如果我想获得调试信息,最好的

Python - 使用 HTTPS 的 urllib2 异步/线程请求示例

我有一段时间使用Python的urllib2让异步/线程化HTTPS请求工作。有没有人有实现urllib2.Request、urllib2.build_opener和urllib2.HTTPSHandler子类的基本示例?谢谢! 最佳答案 下面的代码同时异步执行7个http请求。它不使用线程,而是使用异步网络与twisted图书馆。fromtwisted.webimportclientfromtwisted.internetimportreactor,deferurls=['http://www.python.org','http:

python - 为一个名称 urllib2 发送多个值

我正在尝试提交一个包含复选框的网页,我最多需要选中其中的10个复选框问题是当我尝试将它们分配给字典中的一个名称时,它只分配最后一个而不是全部10那么我该怎么做,这里是请求代码:forms={"_ref_ck":ref,"type":"create","selected_items[]":sel_itms[0],"selected_items[]":sel_itms[1],"selected_items[]":sel_itms[2],"selected_items[]":sel_itms[3],"selected_items[]":sel_itms[4],"selected_items[

python - 在 python urllib.urlretrieve 中设置推荐 url

我在Python中使用urllib.urlretrieve下载网站。尽管某些网站似乎不希望我下载它们,除非他们从自己的站点获得了适当的引荐来源网址。有谁知道我可以在Python的一个库或外部库中设置引荐来源网址的方法。 最佳答案 importurllib2req=urllib2.Request('http://www.example.com/')req.add_header('Referer','http://www.python.org/')r=urllib2.urlopen(req)采用自http://docs.python.o

linux - 如何修复 urllib3 RuntimeError : Requests dependency 'urllib3' must be version >= 1. 21.1,< 1.22?

我是一名新开发人员,正在学习使用Python3.4.2编写代码。我在RaspberryPi3上运行DebianLinux。全新安装后,我都做了sudoapt-getupdate和sudoapt-getupgrade让一切都保持最新。我正在尝试测试一段将文件上传到Dropbox的代码:importdropboximporturllib3authkey=(mydropboxdevauthkey)withopen('test.csv','rb')asf:dbx=dropbox.Dropbox(authkey)dbx.files_upload(f.read(),'/test.csv')现在,我

python - urllib2.urlopen() 与 urllib.urlopen() - urllib2 在 urllib 工作时抛出 404!为什么?

importurllibprinturllib.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaController/Apex_Controller_&_Accessories/').read()上述脚本工作并返回预期结果,同时:importurllib2printurllib2.urlopen('http://www.reefgeek.com/equipment/Controllers_&_Monitors/Neptune_Systems_AquaControl

python - urllib.urlretrieve 文件 python 3.3

我知道几周前我在某个地方看到过答案,但现在找不到了。Python3.3中的简单urllib.urlretrieve。你怎么做呢?我正在尝试下载mp4/html(页面不存在)方案,如果页面不存在,则为mp4(如果文件大小太小,我可以删除文件,否则保留).我的代码运行良好,完全符合我在2.7中的要求,但在3.3中不起作用。我正在处理两个版本的Python之间让我头疼的Tkinter和urllib。Tkinter在3.3中可以正常工作,但urllib不能,并且urllib在2.7中可以正常工作,但Tkinter不能。如何在3.3中正确下载?我知道3.3更改了urllib,但我找不到我在一两周