草庐IT

utf8_unicode_cs

全部标签

python - 不要 argparse 从命令行读取 unicode?

运行Python2.7执行时:$pythonclient.pyget_emails-a"åäö"我得到:usage:client.pyget_emails[-h][-aAREA][-t{rfc2822,plain}]client.pyget_emails:error:argument-a/--area:invalidunicodevalue:'\xc3\xa5\xc3\xa4\xc3\xb6'这是我的解析器:def_argparse():desc="""SimpleCLI-clientfor..."""argparser=argparse.ArgumentParser(descript

python - 带有unicode转义序列的文本到python中的unicode

这个问题在这里已经有了答案:ProcessescapesequencesinastringinPython(8个答案)关闭4个月前。假设我有字符串test'\\u0259'注意转义的反斜杠。如何将其转换为相应的unicode字符串?

python - 将 hash.digest() 转换为 unicode

importhashlibstring1=u'test'hashstring=hashlib.md5()hashstring.update(string1)string2=hashstring.digest()unicode(string2)UnicodeDecodeError:'ascii'codeccan'tdecodebyte0x8finposition1:ordinalnotinrange(128)字符串必须是unicode才能对我有用,可以这样做吗?如果有帮助,请使用python2.7... 最佳答案 Ignacio给出了

python - 使用 unicode 文件名打开文件?

我似乎无法打开具有unicode文件名的文件。假设我愿意:foriinos.listdir():open(i,'r')当我尝试搜索一些解决方案时,我总是得到关于如何读取unicode字符串并将其写入文件的页面,而不是如何使用file()或打开文件open()它有一个unicode名称。 最佳答案 只需将文件名的unicode字符串传递给open():在Python2.x中:>>>open(u'someUnicodeFilenameλ')在Python3.x中,所有字符串都是Unicode,因此实际上没有任何意义。一如既往,请注意打开

python - 有没有一种简单的方法可以使 unicode 在 python 中工作?

我正在尝试处理python2.7.2中的unicode。我知道有.encode('utf-8')东西,但是有1/2的时间我添加它时出现错误,有1/2的时间我不添加它我收到错误。有什么方法可以告诉python-我认为这是一种最新的现代语言,只对字符串使用unicode而不是让我不得不用.encode('utf-8')东西?我知道...python3.0应该可以做到这一点,但我不能使用3.0,而且2.7也不是那么旧...例如:url="http://en.wikipedia.org//w/api.php?action=query&list=search&format=json&srlimi

python - 如何迭代 Python 3 中的 Unicode 字符?

我需要一次一个字符地遍历Python字符串,但是一个简单的“for”循环却给了我UTF-16代码单元:str="abc\u20ac\U00010302\U0010fffd"forchinstr:code=ord(ch)print("U+{:04X}".format(code))打印:U+0061U+0062U+0063U+20ACU+D800U+DF02U+DBFFU+DFFD当我想要的是:U+0061U+0062U+0063U+20ACU+10302U+10FFFD有没有办法让Python给我Unicode代码点的序列,而不管字符串实际上是如何编码的?我在这里在Windows上进行测

python - 如何处理 mako 中的 unicode?

我经常在使用mako时遇到这个错误:UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\xe0'inposition6:ordinalnotinrange(128)我已经告诉mako我正在以任何可能的方式使用unicode:mylookup=TemplateLookup(directories=['plugins/stl/templates'],input_encoding='utf-8',output_encoding='utf-8',default_filters=['decode.utf8'],encoding_errors

python - 为什么这种到 utf8 的转换不起作用?

我有一个输出一些字符的子进程命令,例如'\xf1'。我试图将其解码为utf8,但出现错误。s='\xf1's.decode('utf-8')上面的抛出:UnicodeDecodeError:'utf8'codeccan'tdecodebyte0xf1inposition0:unexpectedendofdata当我使用“latin-1”时它可以工作,但utf8不应该也能工作吗?我的理解是latin1是utf8的一个子集。我是不是漏掉了什么?编辑:prints#ñrepr(s)#returns"'\\xa9'" 最佳答案 您混淆了Un

python - 如何在 Python 中处理 Unicode(非 ASCII)字符?

我在Python编程我正在通过urllib2从网页获取信息图书馆。问题是该页面可以为我提供非ASCII字符,例如'ñ'、'á'等。就在这一刻urllib2获取这个字符,它会引发异常,如下所示:File"c:\Python25\lib\httplib.py",line711,insendself.sock.sendall(str)File"",line1,insendall:UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\xf1'inposition74:ordinalnotinrange(128)我需要处理这些字符。我的意思是

Python:UnicodeDecodeError: 'utf8' 编解码器无法解码字节

我正在将一堆RTF文件读入python字符串。在某些文本上,我收到此错误:Traceback(mostrecentcalllast):File"11.08.py",line47,inX=vectorizer.fit_transform(texts)File"C:\Python27\lib\site-packages\sklearn\feature_extraction\text.py",line716,infit_transformX=super(TfidfVectorizer,self).fit_transform(raw_documents)File"C:\Python27\lib