草庐IT

unicode_normalize

全部标签

python - 如何将 numpy 对象数组转换为 str/unicode 数组?

更新:在最新版本的numpy(例如v1.8.1)中,这不再是问题。此处提到的所有方法现在都正常工作。原问题:有时使用对象dtype存储字符串数组很方便,尤其是当需要修改大数组的内容而无需事先了解字符串的最大长度时,例如,>>>importnumpyasnp>>>a=np.array([u'abc',u'12345'],dtype=object)在某些时候,可能想要将dtype转换回unicode或str。然而,简单的转换将截断长度为4或1的字符串(为什么?),例如>>>b=np.array(a,dtype=unicode)>>>barray([u'abc',u'1234'],dtype

对于单个 Unicode 字符串,Python 返回长度为 2

在Python2.7中:In[2]:utf8_str='\xf0\x9f\x91\x8d'In[3]:print(utf8_str)?In[4]:unicode_str=utf8_str.decode('utf-8')In[5]:print(unicode_str)?In[6]:unicode_strOut[6]:u'\U0001f44d'In[7]:len(unicode_str)Out[7]:2既然unicode_str只包含一个unicode代码点(0x0001f44d),为什么len(unicode_str)返回2而不是1? 最佳答案

python - 如何让 PyC​​harm 在其控制台中显示 unicode 数据?

我已经切换到PyCharm并且非常喜欢使用它。我为使用英语以外的语言(即希伯来语和阿拉伯语)的项目编码,并且需要偶尔调试编码。由于某些原因,PyCharm不会在其调试控制台中显示Unicode字符。我已将IDE编码设置为UTF-8,但没有帮助。有什么想法吗? 最佳答案 已接受的答案不再正确。在默认字体中,它们都没有区别。我只是花了一段时间来解决同样的问题,最好的解决方案是修改您的.bash_profile(或.zshrc)并包含以下行:exportPYTHONIOENCODING=UTF-8理论上,您还可以将其添加到您的环境变量中,

python - 使用 Django 将 Unicode 字符存储到 MySQL 时出现问题

我有字符串u"PlayedMirror'sEdge\u2122"应该显示为PlayedMirror'sEdge™但这是另一个问题。我手头的问题是我将其放入模型中,然后尝试将其保存到数据库中。又名:a=models.Achievement(name=u"PlayedMirror'sEdge\u2122")a.save()我得到了:'ascii'codeccan'tencodecharacteru'\u2122'inposition13:ordinalnotinrange(128)完整的堆栈跟踪(根据要求):Traceback:File"/var/home/ptarjan/django/m

python:Windows终端中的unicode,使用的编码?

我在Windows7终端中使用Python解释器。我正在努力思考unicode和编码。我输入:>>>s='ë'>>>s'\x89'>>>u=u'ë'>>>uu'\xeb'问题一:为什么字符串s和unicode字符串u使用的编码不同?我继续,然后输入:>>>us=unicode(s)Traceback(mostrecentcalllast):File"",line1,inUnicodeDecodeError:'ascii'codeccan'tdecodebyte0x89inposition0:ordinalnotinrange(128)>>>us=unicode(s,'latin-1')

python - django:gettext 和强制转换为 unicode

我的Django应用程序中有以下代码。classStatus(object):def__init__(self,id,desc):self.id=idself.desc=descdef__unicode__(self):returnself.descSTATUS=Status(0,_(u"Sometext"))当我尝试显示某些状态(或什至将其强制转换为unicode)时,我得到:TypeError:coercingtoUnicode:needstringorbuffer,__proxy__found谁能解释一下,我做错了什么? 最佳答案

python - 带有 unicode 字符的源文件使 Django 抛出 SyntaxError 异常

UTF-8编码的文件在Python的注释定界符中嵌入了一个è字符(e带有重音符号)。Django提示这个字符,不会渲染页面。我该如何解决这个问题? 最佳答案 Django引发的SyntaxError已经为您指明了正确的方向。实际读取异常总是一件好事。在你的情况下,它会说一些类似的内容Non-ASCIIcharacter'\xc3'infile/home/zakx/../views.pyonline84,butnoencodingdeclared;seehttp://www.python.org/peps/pep-0263.htmlf

C++ - 如何使用 C++ 读取 Unicode 字符(例如印地语脚本),或者是否有更好的方法通过其他一些编程语言?

我有一个这样的印地文脚本文件:3.भारतकाइतिहासकाफीसमृद्धएवंविस्तृतहै।我必须编写一个程序,为每个句子中的每个单词添加一个位置。因此,特定单词位置的每一行的编号应以括号中的1开头。输出应该是这样的。3.भारत(1)का(2)इतिहास(3)काफी(4)समृद्ध(5)एवं(6)विस्तृत(7)है(8)।(9)上面这句话的意思是:3.Indiahasalongandrichhistory.如果您观察到“।”(印地语中的句号相当于英语中的“.”)也有一个单词位置,类似地,其他特殊符号也会有,因为我正在尝试进行英语-印地语单词对齐(自然语言处理

python - Flake8 属性错误 : 'module' object has no attribute 'normalize_paths'

这是我在验证期间flake8的输出:Traceback(mostrecentcalllast):File"/usr/local/bin/flake8",line11,insys.exit(main())File"/usr/local/lib/python2.7/dist-packages/flake8/main.py",line25,inmainflake8_style=get_style_guide(parse_argv=True,config_file=DEFAULT_CONFIG)File"/usr/local/lib/python2.7/dist-packages/flake8

python - 如何在 Python 2 上使用 psutil.Popen 和 unicode 命令

嘿,我正在尝试执行以下命令(使用psutil.Popen和python2.7):"C:\ProgramFiles(x86)\MicrosoftOffice\root\Office16\EXCEL.EXE""C:\docs\ת.xlsm"使用这段代码:dir=u"C:\\docs"doc=os.listdir(dir)[0]full_path=os.path.join(dir,doc)command=u"\"C:\\ProgramFiles(x86)\\MicrosoftOffice\\root\\Office16\\EXCEL.EXE\"\"{}\"".format(full_path