草庐IT

python - urllib2.urlopen() : getting the size of the content

只要工作允许,我仍然会围绕python工作......我正在使用使用urllib2.urlopen的脚本查询大量内部webUI。我想知道如何从每个请求中获取页面内容的大小。我似乎无法弄清楚这一点。提前致谢MHibbin 最佳答案 printlen(urlopen(url).read())或>>>result=urllib2.urlopen('http://www.spiegel.de')>>>result.headers['content-length']'181291' 关于pytho

python - Python3.6安装urllib

我想导入urllib以使用函数“request”。但是,我在尝试这样做时遇到了错误。我试过pipinstallurllib但仍然有同样的错误。我正在使用Python3.6。非常感谢任何帮助。我使用这段代码导入urllib.request:importurllib.request,urllib.parse,urllib.errorfhand=urllib.request.urlopen('data.pr4e.org/romeo.txt')counts=dict()forlineinfhand:words=line.decode().split()forwordinwords:counts

python httplib/urllib 获取文件名

是否有可能获取文件名e.g.xyz.com/blafoo/showall.html如果您使用urllib或httplib?以便我可以将文件保存在服务器上的文件名下?如果你去类似的网站xyz.com/blafoo/你看不到文件名。谢谢 最佳答案 从响应httpheader获取文件名:importcgiresponse=urllib2.urlopen(URL)_,params=cgi.parse_header(response.headers.get('Content-Disposition',''))filename=params['

python - Urllib.urlopen() 在一台机器上使用 Python 2.6.6 处理 SSLv3 url,但在另一台机器上不能使用 2.6.7/2.7.2

为此花了一天的大部分时间,我真的束手无策。我有一台机器“A”安装了Python2.6.6/2.7.2,另一台机器“B”安装了Python2.6.7/2.7.2。在机器A上,我可以使用Python2.6通过urllib2.urlopen('https://fed.princeton.edu')获得一个SSLv3加密的网站。6但不是2.7.2。在机器B上,我无法使用任一Python版本获取该网站。通过无法获取,我的意思是我获取错误:Traceback:File"/usr/local/lib/python2.7/dist-packages/Django-1.3.1-py2.7.egg/dja

python - Urllib 的 urlopen 在某些站点上中断(例如 StackApps api): returns garbage results

我正在使用urllib2的urlopen函数尝试从StackOverflowapi获取JSON结果。我使用的代码:>>>importurllib2>>>conn=urllib2.urlopen("http://api.stackoverflow.com/0.8/users/")>>>conn.readline()我得到的结果:'\x1f\x8b\x08\x00\x00\x00\x00\x00\x04\x00\xed\xbd\x07`\x1cI\x96%&/m\xca{\x7fJ\...我是urllib的新手,但这似乎不是我应该得到的结果。我已经在其他地方尝试过了,我得到了我所期望的结果

python - 为什么 urllib 会出现这个错误?

我在使用urllib时遇到一个奇怪的错误:INFO2011-12-0707:02:45,101main.py:884]urlhttp://maps.googleapis.com/maps/api/geocode/json?latlng=59.3333,18.05&sensor=falseWARNING2011-12-0707:02:45,103urlfetch_stub.py:428]StrippedprohibitedheadersfromURLFetchrequest:['Host']ERROR2011-12-0707:02:45,210main.py:346]HTTPRespon

Python:在 urllib2 中禁用 http_proxy

我正在使用代理集作为环境变量(exporthttp_proxy=example.com)。对于使用urllib2的一次调用,我需要暂时禁用它,即。取消设置http_proxy。我尝试了文档和互联网中建议的各种方法,但到目前为止无法取消设置代理。到目前为止我已经尝试过:#doesn'tworkreq=urllib2.Request('http://www.google.com')req.set_proxy(None,None)urllib2.urlopen(req)#alsodoesn'tworkurllib.getproxies=lambdax=None:{}

python - 使用 urllib2 节流

使用urllib2时是否可以轻松限制kbps?如果是,如果您能指导我使用任何代码示例或资源,我们将不胜感激。 最佳答案 urllib模块中有urlretrieve(url,filename=None,reporthook=None,data=None)函数。如果您将reporthook-函数/对象实现为tokenbucket,或者一个漏桶,你有你的全局速率限制。编辑:经过仔细检查,我发现使用reporthook进行全局速率限制并不像我想象的那么容易。reporthook仅提供下载量和总大小,这些信息本身不足以用于token桶。解决它

Python urllib2 > HTTP 代理 > HTTPS 请求

这个工作正常:importurllib2opener=urllib2.build_opener(urllib2.HTTPHandler(),urllib2.HTTPSHandler(),urllib2.ProxyHandler({'http':'http://user:pass@proxy:3128'}))urllib2.install_opener(opener)printurllib2.urlopen('http://www.google.com').read()但是,如果http更改为https:...printurllib2.urlopen('https://www.googl

python - urllib HTTPS 请求 : <urlopen error unknown url type: https>

我在python3.4上有一个脚本,它一直很好,直到我从中下载文件的网站决定使用https,现在我收到错误但无法弄清楚如何检索文件。我的脚本导入以下库并使用urlretrive获取先前的文件。因为它现在通过302重定向转发到https。我遇到了一些错误。importurllibimporturllib.requesturllib.request.urlretrieve("http://wordpress.org/latest.tar.gz","/thefile.gz")我的错误:-Traceback(mostrecentcalllast):File"",line1,inFile"/us