草庐IT

unicode_normalize

全部标签

python - 获取 Unicode 字符串所需的字节数

我有一个像u'정정'这样编码为Unicode的韩语字符串。我怎么知道需要多少字节来表示这个字符串?我需要知道确切的字节数,因为我正在使用iOS推送通知的字符串,并且它对有效负载的大小有限制。len('정정')不起作用,因为它返回字符数,而不是字节数。 最佳答案 您需要知道您想要测量字节大小的编码:>>>printu'\uC815\uC815'정정>>>printlen(u'\uC815\uC815')2>>>printlen(u'\uC815\uC815'.encode('UTF-8'))6>>>printlen(u'\uC815\

python - 如何在 python 字符串中使用 Unicode 字符

我希望能够在我的python字符串中使用unicode。例如我有一个图标:icon='▲'printicon应该创建icon='▲'但它实际上以字符串形式返回它:▲如何让这个字符串识别unicode?提前感谢您的帮助。 最佳答案 您可以使用字符串转义序列,如the“stringandbytesliterals”section中所述的语言引用。对于Python3,这将像这样简单地工作:>>>icon='\u25b2'>>>print(icon)▲在Python2这只适用于unicode字符串。Unicode字符串在引号前

python - 如何打开 zip 中的 unicode 文本文件?

我试过了withzipfile.ZipFile("5.csv.zip","r")aszfile:fornameinzfile.namelist():withzfile.open(name,'rU')asreadFile:line=readFile.readline()print(line)split=line.split('\t')它回答:b'$0.0\t1822\t1\t1\t1\n'Traceback(mostrecentcalllast)File"zip.py",line6split=line.split('\t')TypeError:Typestrdoesn'tsupportt

python - 我的 python 网络应用程序是否应该对所有字符串使用 unicode?

我看到像Django这样的框架到处都在使用unicode,所以这似乎是个好主意。另一方面,让所有这些额外的“你”到处漂浮似乎是一件很痛苦的事情。如果我不这样做会有什么问题?如果我这样做会出现什么问题吗?我现在正在使用Pylons作为我的框架。 最佳答案 您可以通过以下方式避免python2.6中的u'':from__future__importunicode_literals这将使'stringliterals'成为unicode对象,就像在python3中一样; 关于python-我的

python - Scrapy 输出提要国际 unicode 字符(例如日语字符)

我是python和scrapy的新手,我正在学习dmoz教程。作为教程建议的开始URL的一个小变体,我从dmoz示例站点中选择了一个日语类别,并注意到我最终获得的提要导出显示了unicode数值而不是实际的日语字符。看来我需要使用TextResponse不知何故,但我不确定如何让我的蜘蛛使用该对象而不是基本Response对象。我应该如何修改我的代码以在我的输出中显示日语字符?如何去掉方括号、单引号和包装输出值的“u”?最终,我想要输出sayオンラインシェップ(这些是日文字符)代替的当前输出[u'\u30aa\u30f3\u30e9\u30a4\u30f3\u30b7\u30e7\u3

python - 将 Python 3.5 项目转换为 Jython - UnicodeDecodeError : 'unicodeescape' codec can't decode bytes in position 4-10: illegal Unicode character

我的最终目的是将正在运行的Python项目转换为Jython解释器,因为将添加一些JavaAPI。详细信息:最新的Jython是2.7我的项目可以用Python3.5运行所以我采取了以下方法:第一件事是利用future模块将我的项目转换为Python2.7,并对可执行文件进行巴氏杀菌。这一步成功完成。第二件事是将Python2.7项目转换为Jython2.7项目。在Eclipsemars切换解释器,提示如下错误:console:Failedtoinstall'':java.nio.charset.UnsupportedCharsetException:cp0.要解决它,来自thispo

python - to_excel() read_excel() 出现 Pandas Unicode 导入导出错误

早上好。我将一个更大的情况浓缩为以下内容:我有一个包含数据框的文件,其中包含一些值。df=pd.DataFrame({'joe':[['dog'],['cat'],['fish'],['rabbit']],'ben':[['dog'],['fish'],['fish'],['bear']]})df:benjoe0[dog][dog]1[fish][cat]2[fish][fish]3[bear][rabbit]此数据框中包含的数据类型如下:type(df.iloc[2,1]),df.iloc[2,1]>>>(list,['fish'])当我使用pd.to_excel()将数据框保存到e

python - 使用 Python SimpleXMLRPCServer 的无效 Unicode/XML?

当我将无效的XML字符传递给PythonSimpleXMLRPCServer时,客户端出现以下错误:Fault::notwell-formed(invalidtoken):line6,column15">为什么?我是否必须更改SimpleXMLRPCServer库代码才能解决此问题?这是我的XML-RPC服务器代码:fromSimpleXMLRPCServerimportSimpleXMLRPCServerimportlogginglogging.basicConfig(level=logging.DEBUG)deftt(text):return"cool"server=SimpleX

Python 子进程回显一个 unicode 文字

我知道以前有人问过这样的问题。但我没有找到解决方案。我想将在我的python文件中定义的unicode文字与subprocess模块一起使用。但我没有得到我需要的结果。比如下面的代码#-*-coding:utf-8-*-importsysimportcodecsimportsubprocesscmd=['echo',u'你好']new_cmd=[]forcincmd:ifisinstance(c,unicode):c=c.encode('utf-8')new_cmd.append(c)subprocess.call(new_cmd)打印出来你好如果我将代码更改为#-*-codi

python - 什么库创建简单的 2D 图形,并在 Pythonista 和 "normal"Python 中工作

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭4年前。Improvethisquestion我想生成非常简单的二维图形。什么Python库可以在Pythonista和普通Python中工作?我是Pythonista的粉丝,但也是在PC上为“普通”Python编写应用程序的粉丝,并且希望我的代码能够在两者上运行.,..我知道Pythonista指导人们使用Scene模块,但这在其他地方的Python中行不通,我很确定......非常感谢!