UTF8Encoding

java - 从 String.getBytes ("UTF-8"处理 UnsupportedEncodingException 的推荐方法)

处理UnsupportedEncodingException的推荐方法是什么？在库方法中调用String.getBytes("UTF-8")时？如果我正在阅读http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html正确地，UTF-8编码应该始终可用，这使我相信没有理由将此异常传递给库的使用者(即添加一个throws子句到方法签名)。似乎任何使UTF-8编码设施不可用的故障模式都将是灾难性的，导致我编写这个处理程序:try{....return"blah".getBytes("UTF-8");

python - 列出设备时 PyAudio 'utf8' 错误

当使用支持ASIO+DirectSound的PyAudio(Portaudio绑定(bind))时，此代码:importpyaudiop=pyaudio.PyAudio()foriinrange(p.get_device_count()):printp.get_device_info_by_index(i)...产生此错误:UnicodeDecodeError:'utf8'codeccan'tdecodebyte0xe9inposition1:invalidcontinuationbyte我们如何解决这个问题？问题可能来自“pyaudio.py”，第990行，因为utf8解码失败:re

amp PyAudio 39 device section python audio binding portaudio

附加到末尾时文件中间的python utf-8-sig BOM

我最近注意到，当使用utf-8-sig编码附加到文件时，Python的行为方式并不明显。见下文:>>>importcodecs,os>>>os.path.isfile('123')False>>>codecs.open('123','a',encoding='utf-8-sig').write('123\n')>>>codecs.open('123','a',encoding='utf-8-sig').write('123\n')以下文本以文件结尾:123123这不是一个错误吗？这太不合逻辑了。谁能向我解释为什么这样做？为什么他们不设法仅在文件不存在且需要创建时才添加BOM？

时文末尾 code 39 section python utf-8 byte-order-mark

python - 用于 Python 的 IMAP 文件夹路径编码 (IMAP UTF-7)

我想知道Python中是否存在用于IMAP4UTF-7文件夹路径编码的“官方”函数/库。在imapInstance.list()中，我得到以下路径IMAPUTF-7编码:'(\\HasNoChildren)".""[Mails].Test&AOk-"',如果我执行以下编码:(u"[Mails].Testé").encode('utf-7')我明白了:'[Mails].Test+AOk-'它是UTF-7但不是IMAPUTF-7编码。Test+AOk-而不是Test&AOk-我需要官方函数或库来获取IMAPUTF-7编码版本。最佳答案

IMAP python code section encoding utf-7

python - Unicode解码错误: 'utf8' codec can't decode byte 0xc3 in position 34: unexpected end of data

我正在尝试编写一个scraper，但我遇到了编码问题。当我试图将要查找的字符串复制到我的文本文件中时，python2.7告诉我它无法识别编码，尽管没有特殊字符。不知道这是否有用。我的代码是这样的:fromurllibimportFancyURLopenerimportosclassMyOpener(FancyURLopener):#spoofsarealbrowseronWindowversion='Mozilla/5.0(Windows;U;WindowsNT5.1;it;rv:1.8.1.11)Gecko/20071127Firefox/2.0.0.11'print"Whatist

amp unexpected 34 39 code python utf-8 character-encoding decoding

python - Python中的Unicode utf-8/utf-16编码

在python中:u'\u3053\n'是utf-16吗？我不是很了解所有unicode/编码的东西，但这种东西出现在我的数据集中，就像我有a=u'\u3053\n'一样。print给出一个异常并且解码给出异常。a.encode("utf-16")>'\xff\xfeS0\n\x00'a.encode("utf-8")>'\xe3\x81\x93\n'printa.encode("utf-8")>πüôprinta.encode("utf-16")> ■S0这是怎么回事？最佳答案这是一个unicode字符，在您的终端编码中似乎无

utf Unicode code section utf-8 python encoding decoding

python - 'utf- 8' codec can' t 解码字节 0x89

我想读取一个csv文件并处理一些列，但我总是遇到问题。遇到以下错误:Traceback(mostrecentcalllast):File"C:\Users\Sven\Desktop\Python\readcsv.py",line5,inforrowinreader:File"C:\Python34\lib\codecs.py",line313,indecode(result,consumed)=self._buffer_decode(data,self.errors,final)UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0x89inpo

amp 39 value section python csv

python转换编码:LookupError: unknown encoding: ansi

因为我的cdv文件编码为utf-8，用Excel打开会出现乱码，再转成标准的ANSI编码时，我得到这个错误:代码:importchardetdefconvertEncoding(from_encode,to_encode,old_filepath,target_file):f1=file(old_filepath)content2=[]whileTrue:line=f1.readline()content2.append(line.decode(from_encode).encode(to_encode))iflen(line)==0:breakf1.close()f2=file(ta

LookupError encoding section code encode python character-encoding codepages

python - Python 正则表达式中的 UTF

我知道Python3修复了很多UTF问题，但是我不能使用Python3，我使用的是2.5.1我正在尝试对文档进行正则表达式处理，但文档中包含UTF连字符-而不是-。Python无法匹配这些，如果我将它们放在正则表达式中，它会抛出一个不稳定的问题。如何强制Python使用UTF字符串或以某种方式匹配这样的字符？谢谢你的帮助最佳答案您必须对有问题的字符(–)进行转义，并在字符串文字前面放置一个u以使其成为unicode字符串。所以，例如，这个:re.compile("–")变成这样:re.compile(u"\u2013")

python section 中包 regex

python - 呈现形式 ('utf-8' 中的 Django UnicodeEncodeError )

我在使用表单呈现页面时遇到UnicodeEncodeError。UnicodeEncodeErrorat/individual/acc/'ascii'codeccan'tencodecharacteru'\u0142'inposition2:ordinalnotinrange(128)这是HTML的片段(表单的标准用法):{{user_form.as_table}}{{individual_form.as_table}}在我看来，我是这样创建它们的:user_form=UserCreationForm(request.POST)individual_form=IndividualFor

UnicodeEncodeError amp Workspace mknapczyk site-packages python django forms unicode utf-8

99 100 101102103 104 105