草庐IT

UTF8Encoding

全部标签

java - 从 String.getBytes ("UTF-8"处理 UnsupportedEncodingException 的推荐方法)

处理UnsupportedEncodingException的推荐方法是什么?在库方法中调用String.getBytes("UTF-8")时?如果我正在阅读http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html正确地,UTF-8编码应该始终可用,这使我相信没有理由将此异常传递给库的使用者(即添加一个throws子句到方法签名)。似乎任何使UTF-8编码设施不可用的故障模式都将是灾难性的,导致我编写这个处理程序:try{....return"blah".getBytes("UTF-8");

python - 列出设备时 PyAudio 'utf8' 错误

当使用支持ASIO+DirectSound的PyAudio(Portaudio绑定(bind))时,此代码:importpyaudiop=pyaudio.PyAudio()foriinrange(p.get_device_count()):printp.get_device_info_by_index(i)...产生此错误:UnicodeDecodeError:'utf8'codeccan'tdecodebyte0xe9inposition1:invalidcontinuationbyte我们如何解决这个问题?问题可能来自“pyaudio.py”,第990行,因为utf8解码失败:re

附加到末尾时文件中间的python utf-8-sig BOM

我最近注意到,当使用utf-8-sig编码附加到文件时,Python的行为方式并不明显。见下文:>>>importcodecs,os>>>os.path.isfile('123')False>>>codecs.open('123','a',encoding='utf-8-sig').write('123\n')>>>codecs.open('123','a',encoding='utf-8-sig').write('123\n')以下文本以文件结尾:123123这不是一个错误吗?这太不合逻辑了。谁能向我解释为什么这样做?为什么他们不设法仅在文件不存在且需要创建时才添加BOM?

python - 用于 Python 的 IMAP 文件夹路径编码 (IMAP UTF-7)

我想知道Python中是否存在用于IMAP4UTF-7文件夹路径编码的“官方”函数/库。在imapInstance.list()中,我得到以下路径IMAPUTF-7编码:'(\\HasNoChildren)".""[Mails].Test&AOk-"',如果我执行以下编码:(u"[Mails].Testé").encode('utf-7')我明白了:'[Mails].Test+AOk-'它是UTF-7但不是IMAPUTF-7编码。Test+AOk-而不是Test&AOk-我需要官方函数或库来获取IMAPUTF-7编码版本。 最佳答案

python - Unicode解码错误: 'utf8' codec can't decode byte 0xc3 in position 34: unexpected end of data

我正在尝试编写一个scraper,但我遇到了编码问题。当我试图将要查找的字符串复制到我的文本文件中时,python2.7告诉我它无法识别编码,尽管没有特殊字符。不知道这是否有用。我的代码是这样的:fromurllibimportFancyURLopenerimportosclassMyOpener(FancyURLopener):#spoofsarealbrowseronWindowversion='Mozilla/5.0(Windows;U;WindowsNT5.1;it;rv:1.8.1.11)Gecko/20071127Firefox/2.0.0.11'print"Whatist

python - Python中的Unicode utf-8/utf-16编码

在python中:u'\u3053\n'是utf-16吗?我不是很了解所有unicode/编码的东西,但这种东西出现在我的数据集中,就像我有a=u'\u3053\n'一样。print给出一个异常并且解码给出异常。a.encode("utf-16")>'\xff\xfeS0\n\x00'a.encode("utf-8")>'\xe3\x81\x93\n'printa.encode("utf-8")>πüôprinta.encode("utf-16")> ■S0这是怎么回事? 最佳答案 这是一个unicode字符,在您的终端编码中似乎无

python - 'utf- 8' codec can' t 解码字节 0x89

我想读取一个csv文件并处理一些列,但我总是遇到问题。遇到以下错误:Traceback(mostrecentcalllast):File"C:\Users\Sven\Desktop\Python\readcsv.py",line5,inforrowinreader:File"C:\Python34\lib\codecs.py",line313,indecode(result,consumed)=self._buffer_decode(data,self.errors,final)UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0x89inpo

python转换编码:LookupError: unknown encoding: ansi

因为我的cdv文件编码为utf-8,用Excel打开会出现乱码,再转成标准的ANSI编码时,我得到这个错误:代码:importchardetdefconvertEncoding(from_encode,to_encode,old_filepath,target_file):f1=file(old_filepath)content2=[]whileTrue:line=f1.readline()content2.append(line.decode(from_encode).encode(to_encode))iflen(line)==0:breakf1.close()f2=file(ta

python - Python 正则表达式中的 UTF

我知道Python3修复了很多UTF问题,但是我不能使用Python3,我使用的是2.5.1我正在尝试对文档进行正则表达式处理,但文档中包含UTF连字符-而不是-。Python无法匹配这些,如果我将它们放在正则表达式中,它会抛出一个不稳定的问题。如何强制Python使用UTF字符串或以某种方式匹配这样的字符?谢谢你的帮助 最佳答案 您必须对有问题的字符(–)进行转义,并在字符串文字前面放置一个u以使其成为unicode字符串。所以,例如,这个:re.compile("–")变成这样:re.compile(u"\u2013")

python - 呈现形式 ('utf-8' 中的 Django UnicodeEncodeError )

我在使用表单呈现页面时遇到UnicodeEncodeError。UnicodeEncodeErrorat/individual/acc/'ascii'codeccan'tencodecharacteru'\u0142'inposition2:ordinalnotinrange(128)这是HTML的片段(表单的标准用法):{{user_form.as_table}}{{individual_form.as_table}}在我看来,我是这样创建它们的:user_form=UserCreationForm(request.POST)individual_form=IndividualFor