草庐IT

python - 为什么 urllib 会出现这个错误?

我在使用urllib时遇到一个奇怪的错误:INFO2011-12-0707:02:45,101main.py:884]urlhttp://maps.googleapis.com/maps/api/geocode/json?latlng=59.3333,18.05&sensor=falseWARNING2011-12-0707:02:45,103urlfetch_stub.py:428]StrippedprohibitedheadersfromURLFetchrequest:['Host']ERROR2011-12-0707:02:45,210main.py:346]HTTPRespon

Python:在 urllib2 中禁用 http_proxy

我正在使用代理集作为环境变量(exporthttp_proxy=example.com)。对于使用urllib2的一次调用,我需要暂时禁用它,即。取消设置http_proxy。我尝试了文档和互联网中建议的各种方法,但到目前为止无法取消设置代理。到目前为止我已经尝试过:#doesn'tworkreq=urllib2.Request('http://www.google.com')req.set_proxy(None,None)urllib2.urlopen(req)#alsodoesn'tworkurllib.getproxies=lambdax=None:{}

python - 使用 urllib2 节流

使用urllib2时是否可以轻松限制kbps?如果是,如果您能指导我使用任何代码示例或资源,我们将不胜感激。 最佳答案 urllib模块中有urlretrieve(url,filename=None,reporthook=None,data=None)函数。如果您将reporthook-函数/对象实现为tokenbucket,或者一个漏桶,你有你的全局速率限制。编辑:经过仔细检查,我发现使用reporthook进行全局速率限制并不像我想象的那么容易。reporthook仅提供下载量和总大小,这些信息本身不足以用于token桶。解决它

Python urllib2 > HTTP 代理 > HTTPS 请求

这个工作正常:importurllib2opener=urllib2.build_opener(urllib2.HTTPHandler(),urllib2.HTTPSHandler(),urllib2.ProxyHandler({'http':'http://user:pass@proxy:3128'}))urllib2.install_opener(opener)printurllib2.urlopen('http://www.google.com').read()但是,如果http更改为https:...printurllib2.urlopen('https://www.googl

python - urllib HTTPS 请求 : <urlopen error unknown url type: https>

我在python3.4上有一个脚本,它一直很好,直到我从中下载文件的网站决定使用https,现在我收到错误但无法弄清楚如何检索文件。我的脚本导入以下库并使用urlretrive获取先前的文件。因为它现在通过302重定向转发到https。我遇到了一些错误。importurllibimporturllib.requesturllib.request.urlretrieve("http://wordpress.org/latest.tar.gz","/thefile.gz")我的错误:-Traceback(mostrecentcalllast):File"",line1,inFile"/us

python - 使用 urllib 和 BeautifulSoup 通过 Python 从 web 检索信息

我可以使用urllib获取html页面,并使用BeautifulSoup解析html页面,看起来我必须生成要从BeautifulSoup读取的文件。importurllibsock=urllib.urlopen("http://SOMEWHERE")htmlSource=sock.read()sock.close()-->writetofile有没有办法在不从urllib生成文件的情况下调用BeautifulSoup? 最佳答案 fromBeautifulSoupimportBeautifulSoupsoup=BeautifulSo

python - urllib2 和 asyncore 之间的性能差异

我对这个简单的python脚本的性能有一些疑问:importsys,urllib2,asyncore,socket,urlparsefromtimeitimporttimeitclassHTTPClient(asyncore.dispatcher):def__init__(self,host,path):asyncore.dispatcher.__init__(self)self.create_socket(socket.AF_INET,socket.SOCK_STREAM)self.connect((host,80))self.buffer='GET%sHTTP/1.0\r\n\r\

Python:为什么 “~” 现在包含在 urllib.parse.quote() 的保留字符集中?

最recentdocumentationforurllib状态:Changedinversion3.7:MovedfromRFC2396toRFC3986forquotingURLstrings.“~”isnowincludedinthesetofreservedcharacters.为什么会这样?在RFC3986,~不是保留字符:reserved=gen-delims/sub-delimsgen-delims=":"/"/"/"?"/"#"/"["/"]"/"@"sub-delims="!"/"$"/"&"/"'"/"("/")"/"*"/"+"/","/";"/"="明确在then

python - Alpine 3.3、Python 2.7.11、urllib2 导致 SSL : CERTIFICATE_VERIFY_FAILED

我有这个小DockerfileFROMalpine:3.3RUNapk--updateaddpythonCMD["python","-c","importurllib2;response=urllib2.urlopen('https://www.python.org')"]使用dockerbuild-talpine-py/01.构建它,然后使用dockerrun-it--rmalpine-py/01运行它创建以下内容输出Traceback(mostrecentcalllast):File"",line1,inFile"/usr/lib/python2.7/urllib2.py",lin

python - 无法在 Python 中导入 urllib

我想导入urllib以使用函数“request”。但是,我在尝试通过Pycharm下载时遇到错误:"Couldnotfindaversionthatsatisfiestherequirementurllib(fromversions:)Nomatchingdistributionfoundforurllib"我尝试了pipinstallurllib但仍然有同样的错误。我正在使用Python2.7.11。非常感谢任何帮助 最佳答案 一些事情:如评论中所述,urllib不是通过pip安装的,它是标准库的一部分,因此您只需执行import