urllib3

python - urllib2 POST进度监控

我正在通过POST将一个带有urllib2的相当大的文件上传到服务器端脚本。我想显示一个进度指示器，显示当前上传进度。是否有urllib2提供的Hook或回调允许我监控上传进度？我知道您可以通过连续调用连接的read()方法来下载，但我没有看到write()方法，您只需将数据添加到请求即可。最佳答案这是可能的，但你需要做一些事情:伪造urllib2子系统，通过附加一个__len__属性将文件句柄向下传递给httplib，这使得len(data)返回正确的大小，用于填充内容长度header。覆盖文件句柄上的read()方法:当ht

python - 如何使用 python 请求执行限时响应下载？

当使用python下载大文件时，我不仅要为连接过程设置时间限制，还要为下载设置时间限制。我正在尝试使用以下python代码:importrequestsr=requests.get('http://ipv4.download.thinkbroadband.com/1GB.zip',timeout=0.5,prefetch=False)printr.headers['content-length']printlen(r.raw.read())这不起作用(下载没有时间限制)，正如文档中正确指出的那样:https://requests.readthedocs.org/en/latest/us

python 如何 thinkbroadband download url python-requests urllib3

python - urllib.request.urlopen 出现 500 错误

以下代码:req=urllib.request.Request(url=r"http://borel.slu.edu/cgi-bin/cc.cgi?foirm_ionchur=im&foirm=Seol&hits=1&format=xml",headers={'User-Agent':'Mozilla/5.0(WindowsNT6.1;WOW64;rv:12.0)Gecko/20100101Firefox/12.0'})handler=urllib.request.urlopen(req)给我以下异常:Traceback(mostrecentcalllast):File"C:/User

request urlopen urllib section python python-3.x

python - 带有身份验证的 urllib.request.urlopen(url)

这几天一直在玩美汤和解析网页。我一直在使用一行代码，它是我编写的所有脚本中的救星。代码行是:r=requests.get('some_url',auth=('my_username','my_password')).但是...我想用(打开一个带有身份验证的URL)做同样的事情:(1)sauce=urllib.request.urlopen(url).read()(1)(2)soup=bs.BeautifulSoup(sauce,"html.parser")(2)我无法打开url并读取需要身份验证的网页。我如何实现这样的目标:(3)sauce=urllib.request.urlopen

request urlopen code section python python-3.x url beautifulsoup

python - 为什么urllib.urlopen.read()与源码不对应？

我正在尝试获取以下网页:importurlliburllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read()结果与我在使用GoogleChrome检查网页源代码时看到的结果不一致。您能告诉我为什么会发生这种情况以及我如何改进我的代码来解决这个问题吗？感谢您的帮助。最佳答案您从urlopen获得的是原始网页，这意味着没有执行javascript没

urlopen python section code urllib

Python urllib2.urlopen() 很慢，需要一个更好的方法来读取多个 url

正如标题所示，我正在开发一个用python编写的网站，它会多次调用urllib2模块来读取网站。然后我用BeautifulSoup解析它们。由于我必须阅读5-10个站点，因此页面需要一段时间才能加载。我只是想知道是否有一种方法可以同时阅读所有站点？或者任何让它更快的技巧，比如我应该在每次阅读后关闭urllib2.urlopen还是保持打开状态？已添加:此外，如果我只是切换到php，从其他站点获取和解析HTML和XML文件会更快吗？我只是想让它加载得更快，而不是目前需要大约20秒最佳答案我正在使用threading和Queue等现

urllib2 urlopen code section url python http concurrency

Python 3 urllib 忽略 SSL 证书验证

我有一个用于测试的服务器设置，带有自签名证书，并且希望能够对其进行测试。Python3版本urlopen如何忽略SSL验证？我找到的所有关于此的信息一般都是关于urllib2或Python2。python3中的urllib已从urllib2更改为:Python2，urllib2:urllib2.urlopen(url[,data[,timeout[,cafile[,capath[,cadefault[,context]]]]])https://docs.python.org/2/library/urllib2.html#urllib2.urlopenPython3:urllib.req

Python urllib code urllib2 python-3.x ssl ssl-certificate

python - urllib2 - 发布请求

我尝试使用urllib2执行一个简单的POST请求。然而，服务器响应表明它收到了一个简单的GET。我检查了传出请求的类型，但它被设置为POST。为了检查服务器的行为是否像我期望的那样，我尝试使用连接到url的(以前的POST-)数据执行GET请求。这给了我预期的答案。有人知道我误解了什么吗？defconnect(self):url='http://www.mitfahrgelegenheit.de/mitfahrzentrale/Dresden/Potsdam.html/'user_agent='Mozilla/4.0(compatible;MSIE5.5;WindowsNT)'hea

urllib2 python 39 urllib 34 http-request

python - 使用 urllib2 加载 URL 时如何设置 TCP_NODELAY 标志？

我正在使用urllib2加载网页，我的代码是:httpRequest=urllib2.Request("http:/www....com")pageContent=urllib2.urlopen(httpRequest)pageContent.readline()如何获取套接字属性以设置TCP_NODELAY？在普通套接字中我会使用函数:socket.setsockopt(socket.IPPROTO_TCP,socket.TCP_NODELAY,1) 最佳答案如果您需要访问所用套接字上的此类低级属性，则必须重载一些对象。首先，您

TCP_NODELAY NODELAY urllib2 urllib code python sockets urlopen setsockopt

python - 如何修复 ImportError : No module named packages. urllib3？

我在Ubuntu机器上运行Python2.7.6。当我在终端中运行twill-sh(Twill是一种用于测试网站的浏览器)时，我得到以下信息:Traceback(mostrecentcalllast):File"dep.py",line2,inimporttwill.commandsFile"/usr/local/lib/python2.7/dist-packages/twill/__init__.py",line52,infromshellimportTwillCommandLoopFile"/usr/local/lib/python2.7/dist-packages/twill/s

ImportError packages section twill python urllib2 urllib3

6 7 8910 11 12