unicode_literals

python - 如何在 Python 中获取组合 Unicode 字符串的 "visible"长度？

如果我有一个包含组合字符的PythonUnicode字符串，len会报告一个与“已看到”的字符数不对应的值。例如，如果我有一个组合了上划线和下划线的字符串，例如u'A\u0332\u0305BC'，len(u'A\u0332\u0305BC')报告5；但显示的字符串只有3个字符长。如何在Python中获取包含组合字形的Unicode字符串的“可见”长度(即用户看到的字符串所占据的不同位置的数量)？最佳答案如果您有支持匹配grapheme的正则表达式风格,你可以使用\XDemo虽然默认的Pythonre模块不支持\X，但Matth

何在 amp code section 39 python python-2.7 unicode

python - 如何在 Python 中打印 Unicode 字符代码？

我想打印一个unicode的字符代码，而不是它在Python中表示的实际字形。例如，如果u是一个unicode字符列表:>>>u[0]u'\u0103'>>>printu[0]ă我想将字符代码输出为原始字符串:u'\u0103'。我曾尝试将它打印到一个文件中，但如果不将它编码为UTF-8，这是行不通的。>>>w=open('~/foo.txt','w')>>>print>>w,u[0].decode('utf-8')Traceback(mostrecentcalllast):File"",line1,inprint>>w,u[0].decode('utf-8')File"/Librar

何在 Unicode gt code section python

python - 将 Python 3 Unicode 字节字符串 - `str(utf8_encoded_str)` 转换回 unicode

那我先介绍一下问题我通过POST/GET请求获得了一些数据。数据是UTF-8编码的字符串。我不知道，只是通过str()方法将其转换。现在我拥有完整的“废话数据”数据库，找不到返回的方法。示例代码:unicode_str-这是我应该获取的字符串encoded_str-这是我通过POST/GET请求获得的字符串-初始数据bad_str-我目前在数据库中的数据，我需要从中获取unicode。显然我知道如何转换:unicode_str=(encode)=>encoded_str=(str)=>bad_str但我无法想出解决方案:bad_str=(???)=>encoded_str=(decod

utf8_encoded_str str strong code python string unicode

python - 2.7 CSV 模块想要 unicode，但不想要 unicode

csvfile_=open(finishedFileName+num+".csv","w",newline='')writ=csv.writer(csvfile_,dialect='excel')firstline=unicode(str(firstline))try:writ.writerow(firstline)exceptTypeError:printfirstlineprinttype(firstline)raise我得到一个TypeError:mustbeunicode,notstr使用此代码。打印第一行的类型时，我看到.当我打印第一行时，我看到['project_numbe

unicode python code firstline section csv python-2.7 error-handling

python - 标准库中的所有内容都会在 Python 3.0 中将字符串视为 unicode 吗？

现在Python(从3.0开始)是基于unicode的，我对标准库的行为方式感到有点困惑。CGI和urllib等模块会使用unicode字符串，还是会使用新的“字节”类型并仅提供编码数据？最佳答案从逻辑上讲，很多东西，如MIME编码的邮件消息、URL、XML文档等，都应该以bytes而不是字符串的形式返回。这可能会引起一些panic，因为库开始为Python3确定，并且人们发现他们必须比以前更了解bytes/string转换str/unicode... 关于python-标准库中的所

视为 unicode section code python string cgi python-3.x

python - 返回 unicode 字符串的前 N 个字符

我有一个unicode字符串，我需要返回前N个字符。我这样做:result=unistring[:5]但当然是unicode字符串的长度!=字符的长度。有任何想法吗？唯一的解决方案是使用re?编辑:更多信息unistring="Μεταλλικα"#MetallicawritteninGreeklettersresult=unistring[:1]返回->?我认为unicode字符串是两个字节(char)，这就是为什么会发生这种情况。如果我这样做:result=unistring[:2]我明白了M这是正确的，那么，我应该始终slice*2还是应该转换成某种东西？

unicode python code section unistring python-2.x

python - Pandas v0.17.0 : AttributeError: 'unicode' object has no attribute 'version'

我在我的linuxsuse13.264位上直接从源代码安装了pandasv0.17.0。我之前使用yast安装了v0.14.1。现在>>>importpandasTraceback(mostrecentcalllast):File"",line1,inFile"/usr/lib64/python2.7/site-packages/pandas-0.17.0-py2.7-linux-x86_64.egg/pandas/__init__.py",line44,infrompandas.core.apiimport*File"/usr/lib64/python2.7/site-package

amp 39 pandas site-packages python

python - 将 unicode 字符串转换为字节字符串

我从函数中得到一个字符串，它表示为u'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'，但是为了处理它我需要它是字节串(如'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0')。如何在不更改的情况下转换它？到目前为止，我最好的猜测是采用s.encode('unicode_escape')，它将返回'\\xd0\\xbc\\xd0\\xb0\\xd1\\x80\\xd0\\xba\\xd0\\xb0'并每5个字符处理一次，以便'\xd0'成为表示为'\xd0'的一个字符。最佳答案

unicode python xd0 xd section

python - 从 Python 中的 unicode 字符串替换非 ascii 字符

如何在Python中替换unicode字符串中的非ascii字符？这是我对给定输入的输出:音乐->音乐纸箱->纸箱卡诺->卡诺Myaybe有一个字典，其中'á'是键，'a'是值？最佳答案如果您只想将重音字符降级为非重音字符:>>>importunicodedata>>>unicodedata.normalize('NFKD',u"m\u00fasica").encode('ascii','ignore')'musica' 关于python-从Python中的unicode字符串替换非

unicode python section 卡诺重音 ascii

python - 如何在 Windows 控制台中用 python 打印 unicode 字符串

这个问题在这里已经有了答案:Python,Unicode,andtheWindowsconsole(15个答案)关闭8年前。我正在开发一个python应用程序，它可以将多种语言的文本打印到多个平台的控制台。该程序在所有UNIX平台上运行良好，但在Windows中，在命令行中打印unicode字符串时出现错误。关于这个已经有一个相关的线程:(WindowscmdencodingchangecausesPythoncrash)但我在那里找不到我的具体答案。例如，对于以下亚洲文本，在Linux中，我可以运行:>>>printu"\u5f15\u8d77\u7684\u6216".encode

python 中用 section 34 Windows unicode encoding