Urllib2_草庐IT

python - 使用 urllib2 从 URL 写入 PDF 文件

我正在尝试使用python模块urllib2保存从网络服务器生成的动态pdf文件。我使用以下代码从服务器获取数据并将该数据写入文件以便将pdf存储在本地磁盘中。:importurllib2importcookielibtheurl='https://myweb.com/?pdf&var1=1'cj=cookielib.CookieJar()opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))opener.addheaders.append(('Cookie',cookie))request=urllib2.Reques

python - urllib.urlopen 有效，但 urllib2.urlopen 无效

我有一个正在测试的简单网站。它在本地主机上运行，我可以在我的网络浏览器中访问它。索引页就是简单的“运行”二字。urllib.urlopen将成功读取页面，但urllib2.urlopen不会。这是演示问题的脚本(这是实际脚本，而不是不同测试脚本的简化):importurllib,urllib2printurllib.urlopen("http://127.0.0.1").read()#prints"running"printurllib2.urlopen("http://127.0.0.1").read()#throwsanexception这是堆栈跟踪:Traceback(mos

python - 获取 Urllib2.Request 的请求 header ？

有没有办法从使用Urllib2创建的请求中获取header或确认使用urllib2.urlopen发送的HTTPheader？最佳答案查看请求(和响应header)的简单方法是启用调试输出:opener=urllib2.build_opener(urllib2.HTTPHandler(debuglevel=1))然后您可以看到发送/接收的精确header:>>>opener.open('http://python.org')send:'GET/HTTP/1.1\r\nAccept-Encoding:identity\r\nHos

python - 强制 python mechanize/urllib2 只使用 A 请求？

这是一个相关问题，但我不知道如何将答案应用于mechanize/urllib2:howtoforcepythonhttpliblibrarytouseonlyArequests基本上，给出这个简单的代码:#!/usr/bin/pythonimporturllib2printurllib2.urlopen('http://python.org/').read(100)这导致wireshark说出以下内容:0.00000010.102.0.79->8.8.8.8DNSStandardqueryApython.org0.00002310.102.0.79->8.8.8.8DNSStandar

python - 在 Python 2.4 中使用 urllib 解析查询字符串

使用Python2.4.5(不要问!)我想解析一个查询字符串并得到一个字典作为返回。我是否必须像下面这样“手动”执行此操作？>>>qs='first=1&second=4&third=3'>>>d=dict([x.split("=")forxinqs.split("&")])>>>d{'second':'4','third':'3','first':'1'}在urlparse中没有找到任何有用的方法。最佳答案你有两个选择:>>>cgi.parse_qs(qs){'second':['4'],'third':['3'],'firs

Python Requests/urllib — 监控带宽使用

我想记录我的Python脚本下载和上传的总字节数。total_downloaded_bytes=0defbandwidth_hook(r,*args,**kwargs):globaltotal_downloaded_bytestotal_downloaded_bytes+=len(r.content)req=requests.session()req.hooks={'response':bandwidth_hook}上面的代码没有考虑HTTP压缩(如果我是对的)和header的大小。有没有办法计算从requests.session上传和下载的总字节数？如果不是，脚本范围内的计数如何？

python 3 : AttributeError: 'module' object has no attribute '__path__' using urllib in terminal

我的代码在PyCharm中运行完美，但我在尝试在终端中打开它时收到错误消息。我的代码有什么问题，或者我哪里出错了？importurllib.requestwithurllib.request.urlopen('http://python.org/')asresponse:html=response.read()print(html)终端输出:λpythonDesktop\url1.pyTraceback(mostrecentcalllast):File"",line2218,in_find_and_load_unlockedAttributeError:'module'objectha

python - 没有名为 urllib3 的模块

上周我写了一个调用API的脚本并运行成功。这周，它不会运行。我收到以下错误消息:Traceback(mostrecentcalllast):File"user_audit.py",line2,inimportrequestsFile"c:\Python27\lib\site-packages\requests\__init__.py",line60,infrom.packages.urllib3.exceptionsimportDependencyWarningFile"c:\Python27\lib\site-packages\requests\packages\__init__.p

python - 在 urllib2 中使用来自 selenium 的 session cookie

我正在尝试使用Selenium登录网站，然后使用urllib2发出RESTy请求。不过，为了使其正常工作，我需要urllib2才能使用与Selenium相同的session。使用selenium登录效果很好，我可以调用self.driver.get_cookies()我有一个selenium知道的所有cookie的列表，它最终看起来有点像这样:[{u'domain':u'my.awesome.web.app.local',u'expiry':1319230106,u'name':u'ci_session',u'path':u'/',u'secure':False,u'value':u'

python - 无法导入 requests.packages.urllib3.util 'Retry'

我在Windows8上使用Python2.764位。我安装了Requests2.3版。我正在尝试运行此导入语句作为在我的代码中引入重试次数的一部分:fromrequests.packages.urllib3.utilimportRetry我还安装了urllib3(我现在刚刚通过Pip安装了它)。我收到错误消息:Traceback(mostrecentcalllast):File"C:\Python27\counter.py",line3,infromrequests.packages.urllib3.utilimportRetryImportError:cannotimportname