草庐IT

python - 使用 urlopen.read 中的 "byte-like object"和 JSON?

这个问题在这里已经有了答案:TypeError:can'tuseastringpatternonabytes-likeobjectinre.findall()(4个回答)关闭上个月。只是尝试测试非常简单的PythonJSON命令,但遇到了一些麻烦。urlopen('http://www.similarsitesearch.com/api/similar/ebay.com').read()应该输出'{"num":20,"status":"ok","r0":"http:\\/\\/www.propertyroom.com\\/","r1":"http:\\/\\/www.ubid.com\

python - Python 2.6 之前版本中 urllib2.urlopen() 的超时

urllib2documentation表示timeout参数是在Python2.6中添加的。不幸的是,我的代码库一直在Python2.5和2.4平台上运行。是否有任何替代方法来模拟超时?我要做的就是让代码与远程服务器通话一段固定的时间。也许有任何替代的内置库?(不想安装3rd方,比如pycurl) 最佳答案 您可以使用以下方法为所有套接字操作(包括HTTP请求)设置全局超时:socket.setdefaulttimeout()像这样:importurllib2importsocketsocket.setdefaulttimeout

python - 我应该用什么来打开 url 而不是 urllib3 中的 urlopen

我想写一段如下代码:frombs4importBeautifulSoupimporturllib2url='http://www.thefamouspeople.com/singers.php'html=urllib2.urlopen(url)soup=BeautifulSoup(html)但我发现我现在必须安装urllib3包。此外,我找不到任何教程或示例来理解如何重写上述代码,例如,urllib3没有urlopen。有什么解释或例子吗?!P/S:我使用的是python3.4。 最佳答案 urllib3是与urllib和urlli

Python:从 urllib2.urlopen 调用中获取 HTTP header ?

urllib2是否在调用urlopen时获取整个页面?我想只读取HTTP响应header而不获取页面。看起来urllib2打开了HTTP连接,然后获得了实际的HTML页面......还是它只是开始使用urlopen调用缓冲页面?importurllib2myurl='http://www.kidsidebyside.org/2009/05/come-and-draw-the-circle-of-unity-with-us/'page=urllib2.urlopen(myurl)//openconnection,getheadershtml=page.readlines()//strea

python - 我需要使用 urllib2.Request/urlopen 处理哪些错误/异常?

我有以下代码可以回发到远程URL:request=urllib2.Request('http://www.example.com',postBackData,{'User-Agent':'MyUserAgent'})try:response=urllib2.urlopen(request)excepturllib2.HTTPError,e:checksLogger.error('HTTPError='+str(e.code))excepturllib2.URLError,e:checksLogger.error('URLError='+str(e.reason))excepthttpl

python - 我应该在 urllib.urlopen() 之后调用 close() 吗?

我是Python新手,正在阅读别人的代码:urllib.urlopen()后面应该跟urllib.close()吗?否则,会泄漏连接,对吗? 最佳答案 close方法必须在urllib.urlopen的result上调用,不是在urllib上您正在考虑的模块本身(正如您提到的urllib.close-它不存在)。最好的方法:而不是x=urllib.urlopen(u)等等,使用:importcontextlibwithcontextlib.closing(urllib.urlopen(u))asx:...usexatwillhere

python - 属性错误 : 'module' object has no attribute 'urlopen'

我正在尝试使用Python下载网站的HTML源代码,但收到此错误。Traceback(mostrecentcalllast):File"C:\Users\Sergio.Tapia\Documents\NetBeansProjects\DICParser\src\WebDownload.py",line3,infile=urllib.urlopen("http://www.python.org")AttributeError:'module'objecthasnoattribute'urlopen'我在这里遵循指南:http://www.boddie.org.uk/python/HTML

python - 让 JSON 对象接受字节或让 urlopen 输出字符串

使用Python3,我从URL请求一个json文档。response=urllib.request.urlopen(request)response对象是一个类文件对象,具有read和readline方法。通常可以使用以文本模式打开的文件来创建JSON对象。obj=json.load(fp)我想做的是:obj=json.load(response)但这不起作用,因为urlopen以二进制模式返回文件对象。解决方法当然是:str_response=response.read().decode('utf-8')obj=json.loads(str_response)但这感觉很糟糕.....

json - 在 Python 中解析 HTTP 响应

我想处理THIS的信息网址。我可以成功打开它并阅读它的内容。但我真正想做的是把我不想要的东西都扔掉,把我想保留的东西操纵起来。有没有办法将字符串转换为dict以便我可以对其进行迭代?还是我只需要按原样解析它(str类型)?fromurllib.requestimporturlopenurl='http://www.quandl.com/api/v1/datasets/FRED/GDP.json'response=urlopen(url)print(response.read())#returnsstringwithinfo 最佳答案

json - 在 Python 中解析 HTTP 响应

我想处理THIS的信息网址。我可以成功打开它并阅读它的内容。但我真正想做的是把我不想要的东西都扔掉,把我想保留的东西操纵起来。有没有办法将字符串转换为dict以便我可以对其进行迭代?还是我只需要按原样解析它(str类型)?fromurllib.requestimporturlopenurl='http://www.quandl.com/api/v1/datasets/FRED/GDP.json'response=urlopen(url)print(response.read())#returnsstringwithinfo 最佳答案