草庐IT

utf8Bytes

全部标签

Python Scrapy : TypeError: to_bytes must receive a unicode, str 或 bytes 对象,得到 int

我不知道这段代码有什么问题。我正在尝试从99acres.com抓取数据。我已经通过了帖子参数。这是代码fromscrapyimportSpiderfromscrapy.httpimportFormRequestfromscrapy.selectorimportHtmlXPathSelectorclassaagSpider(Spider):name="acre"start_urls=["http://www.99acres.com"]defparse(self,response):frmdata3={"Refine_Localities":"RefineLocalities","acti

python - 用于 Python 的 IMAP 文件夹路径编码 (IMAP UTF-7)

我想知道Python中是否存在用于IMAP4UTF-7文件夹路径编码的“官方”函数/库。在imapInstance.list()中,我得到以下路径IMAPUTF-7编码:'(\\HasNoChildren)".""[Mails].Test&AOk-"',如果我执行以下编码:(u"[Mails].Testé").encode('utf-7')我明白了:'[Mails].Test+AOk-'它是UTF-7但不是IMAPUTF-7编码。Test+AOk-而不是Test&AOk-我需要官方函数或库来获取IMAPUTF-7编码版本。 最佳答案

python - Unicode解码错误: 'utf8' codec can't decode byte 0xc3 in position 34: unexpected end of data

我正在尝试编写一个scraper,但我遇到了编码问题。当我试图将要查找的字符串复制到我的文本文件中时,python2.7告诉我它无法识别编码,尽管没有特殊字符。不知道这是否有用。我的代码是这样的:fromurllibimportFancyURLopenerimportosclassMyOpener(FancyURLopener):#spoofsarealbrowseronWindowversion='Mozilla/5.0(Windows;U;WindowsNT5.1;it;rv:1.8.1.11)Gecko/20071127Firefox/2.0.0.11'print"Whatist

python - Python中的Unicode utf-8/utf-16编码

在python中:u'\u3053\n'是utf-16吗?我不是很了解所有unicode/编码的东西,但这种东西出现在我的数据集中,就像我有a=u'\u3053\n'一样。print给出一个异常并且解码给出异常。a.encode("utf-16")>'\xff\xfeS0\n\x00'a.encode("utf-8")>'\xe3\x81\x93\n'printa.encode("utf-8")>πüôprinta.encode("utf-16")> ■S0这是怎么回事? 最佳答案 这是一个unicode字符,在您的终端编码中似乎无

python - 凯拉斯 model.to_json() 错误 : 'rawunicodeescape' codec can't decode bytes in position 94-98: truncated\uXXXX

model.to_json()对于模型____________________________________________________________________________________________________Layer(type)OutputShapeParam#Connectedto====================================================================================================lambda_1(Lambda)(None,3,160,320)0lambd

python - 将 Python 3.5 项目转换为 Jython - UnicodeDecodeError : 'unicodeescape' codec can't decode bytes in position 4-10: illegal Unicode character

我的最终目的是将正在运行的Python项目转换为Jython解释器,因为将添加一些JavaAPI。详细信息:最新的Jython是2.7我的项目可以用Python3.5运行所以我采取了以下方法:第一件事是利用future模块将我的项目转换为Python2.7,并对可执行文件进行巴氏杀菌。这一步成功完成。第二件事是将Python2.7项目转换为Jython2.7项目。在Eclipsemars切换解释器,提示如下错误:console:Failedtoinstall'':java.nio.charset.UnsupportedCharsetException:cp0.要解决它,来自thispo

python - 'utf- 8' codec can' t 解码字节 0x89

我想读取一个csv文件并处理一些列,但我总是遇到问题。遇到以下错误:Traceback(mostrecentcalllast):File"C:\Users\Sven\Desktop\Python\readcsv.py",line5,inforrowinreader:File"C:\Python34\lib\codecs.py",line313,indecode(result,consumed)=self._buffer_decode(data,self.errors,final)UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0x89inpo

Python 3 bytes.index : better way?

刚学Python37天,感觉对字节串的理解有点坑。在Python3中,假设我有一个字节字符串b'1234'。它的迭代器返回整数:Python3.2.3(default,May262012,18:49:27)[GCC4.2.1(AppleInc.build5666)(dot3)]ondarwinType"help","copyright","credits"or"license"formoreinformation.>>>forzinb'1234':...print(type(z))...我可以在字节串中找到一个整数(in的定义是它搜索相等):>>>0x32inb'1234'True但是

python - Pycharm 预期类型 'optional[bytes]' 得到了 'str' 而不是

我正在使用rsplit来拆分路径名,rootPath=os.path.abspath(__file__)rootPath=(rootPath.rsplit('/',1)[0]).rsplit('/',1)[0]但是Pycharm警告,expectedtypeoptional[bytes],gotstrinstead在python文档中,它声明使用sep作为分隔符字符串。那么如何解决这个问题呢? 最佳答案 似乎rootPath被视为一个字节对象(也许是一个小错误?)或者警告是针对另一部分的。一般来说,PyCharm和错误本质上是在警告

python - Python 正则表达式中的 UTF

我知道Python3修复了很多UTF问题,但是我不能使用Python3,我使用的是2.5.1我正在尝试对文档进行正则表达式处理,但文档中包含UTF连字符-而不是-。Python无法匹配这些,如果我将它们放在正则表达式中,它会抛出一个不稳定的问题。如何强制Python使用UTF字符串或以某种方式匹配这样的字符?谢谢你的帮助 最佳答案 您必须对有问题的字符(–)进行转义,并在字符串文字前面放置一个u以使其成为unicode字符串。所以,例如,这个:re.compile("–")变成这样:re.compile(u"\u2013")