草庐IT

unicode_normalize

全部标签

python - NameError:名称 'unicode' 未定义

这个问题在这里已经有了答案:NameError:globalname'unicode'isnotdefined-inPython3(7个答案)关闭6年前。fileMain=open("dictionary_15k.txt","r")forline1infileMain:dictWords.append(unicode(line1.strip(),"utf-8"))编译后显示NameError:name'unicode'isnotdefined

python - 将 UTF-8 八位字节转换为 unicode 代码点

我有一组UTF-8八位字节,我需要将它们转换回unicode代码点。我如何在python中执行此操作。例如UTF-8八位字节['0xc5','0x81']应转换为0x141代码点。 最佳答案 python3.x:在Python3.x中,str是Unicode文本的类,bytes是用于包含八位字节。如果您所说的“八位字节”是指“0xc5”(而不是“\xc5”)形式的字符串,您可以像这样转换为字节:>>>bytes(int(x,0)forxin['0xc5','0x81'])b'\xc5\x81'然后您可以使用str构造函数转换为str

python - python 2.7中的base64编码unicode字符串

我使用requestsmodule从Web服务检索了一个unicode字符串,其中包含二进制文档的字节(碰巧是PCL)。其中一个字节的值为248,尝试对其进行base64编码会导致以下错误:In[68]:base64.b64encode(response_dict['content']+'\n')---------------------------------------------------------------------------UnicodeEncodeErrorTraceback(mostrecentcalllast)C:\...\in()---->1base64.b

python - Django 1.9 JSONfield 存储的字典改为返回 unicode

我们刚刚升级到Django1.9并将内容移至其内置的JSONfield,我们用它来存储字典。但是,当我尝试从中读取数据时,它返回字典的unicode。我的JSONfield定义为:classSmsInfo(models.Model):[...]json=JSONField(default=dict)数据被写入:params=dict(request.POST)SmsInfo.objects.create([...],json=params,[...])后面是这样读的:incoming_smsses=SmsInfo.objects.select_related('game').defer

python - python 和 debian 9 的 Unicode 版本

对于我的debian9中的unicode版本ls/usr/share/doc/unicode-datachangelog.Debian.gzcopyright提取changelog.Debian.gz,一些版本信息如下:unicode-data(9.0-1)unstable;urgency=medium*Newupstreamrelease.Closes:#827098.*MovetoStandards-Version:3.9.6.Nochangesrequired.--AlastairMcKinstryWed,22Jun201614:49:26+0100unicode-data(8.

python - 在基于 Debian 的系统上,如何找到一种字体具有字形的 Unicode 代码点?

从基于Debian的系统上的脚本语言(比如Python或Ruby),我想找到以下任一种:特定字体具有字形的所有Unicode代码点所有具有特定Unicode代码点字形的字体(显然1或2可以从另一个推导出来,所以越简单越好。)我过去通过运行来完成此操作:fc-list:filecharset...并根据thiscodefromfontconfig解析每行末尾的输出但在我看来,应该有一种更简单的方法来做到这一点。(我不完全确定这是解决此问题的正确StackExchange站点,但我正在寻找可以以编程方式使用的答案。) 最佳答案 我会尝试

python - pandas to_sql 给出 unicode 解码错误

我有一个通过read_csv加载的pandas数据框,我试图在尝试时通过to_sql将其推送到数据库df.to_sql("assessmentinfo_pivot",util.ENGINE)我得到一个unicodeDecodeError:UnicodeEncodeError:'ascii'codeccan'tencodecharactersinposition83-84:ordinalnotinrange(128)to_sql没有编码选项来为to_sql指定utf-8,并且引擎是在编码设置为utf-8的情况下创建的ENGINE=create_engine("mssql+pymssql:

python - 字典中的 "TypeError: ' unicode ' object does not support item assignment"

我正在尝试构建/更新字典。我将昵称作为temp_dict中的键并寻找要添加的ID。摘self的代码。我认为你看到我的错误就足够了。d1={u'status':u'ok',u'count':1,u'data':[{u'nickname':u'45sss',u'account_id':553472}]}temp_dict={}forkey,valueind1.iteritems():if"data"==key:fordic2invalue:x=dic2['nickname']y=dic2['account_id']temp_dict[x]=y;我的错误:Traceback(mostrece

python - Unicode 文件名到 python subprocess.call()

这个问题在这里已经有了答案:UnicodefilenamesonWindowswithPython&subprocess.Popen()(5个答案)关闭7年前。我正在尝试使用unicode文件名运行subprocess.call(),这里是简化的问题:n=u'c:\\windows\\notepad.exe'f=u'c:\\temp\\nèw.txt'subprocess.call(n+f)这引发了著名的错误:UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\xe8'编码为utf-8会产生错误的文件名,而mbcs将文件名作为不带

python - slugs 和 unicode 的规则

在研究了人们对标题的不同处理方式之后,我注意到人们常常遗漏了如何处理非英语标题。url编码非常严格。参见http://www.blooberry.com/indexdot/html/topics/urlencoding.htm因此,例如,人们如何处理诸如此类的标题标签“Unalágrimacayóenlaarena”人们可以为印欧语言制定一个合理的表格,即。可以通过ISO-8859-1编码的东西。例如,转换表会翻译'á'=>'a',因此slug将是“una-lagrima-cayo-en-la-arena”但是,我使用的是unicode(特别是使用UTF-8编码),所以不能保证我将获得