unicode_normalize

python - 从 python 3 中的字符串中删除 unicode 表示的最简单方法？

我在python3中有一个字符串，其中有几个unicode表示，例如:t='R\\u00f3is\\u00edn'我想转换t以便在打印时它具有正确的表示形式，即:>>>print(t)Róisín但是我只是取回了原始字符串。我试过re.sub和其他一些，但我似乎无法找到一种方法来更改这些字符而不必遍历每个字符。最简单的方法是什么？最佳答案您想使用内置编解码器unicode_escape。如果t已经是一个bytes(8位字符串)，就这么简单:>>>print(t.decode('unicode_escape'))Róisín如果t

带有UTF-8的Python unicode字符串？

我从图书馆取回了一个看起来不正确的unicode字符串:>>>titleu'Sopet\xc3\xb3n'现在，这两个十六进制转义符是U+00F3带尖音符号的拉丁文小写字母O的UTF-8编码。据我所知，Python中的unicode字符串应该具有实际字符，而不是字符的UTF-8编码，所以我认为这是不正确的，并且可能是库或我的输入中的错误，对吧？问题是，我如何(a)识别我的unicode字符串中有UTF-8编码的文本，以及(b)将其转换为正确的unicode字符串？我对(a)感到困惑，因为在编码方面，原始字符串没有任何问题(即，它们本身都是有效字符，u'\xc3\xb3'==Ã³，但它们

UTF-8 unicode section python

Python:如何将具有 unicode 文件名的文件移动到 unicode 文件夹

我在Windows下的Python脚本中在unicode命名的文件夹之间移动一个unicode命名的文件时遇到了麻烦...您将使用什么语法来查找文件夹中所有*.ext类型的文件并将它们移动到相对位置？假设文件和文件夹是unicode。最佳答案基本问题是Unicode和字节串之间未转换的混合。解决方案可以转换为单一格式或使用一些技巧来避免问题。我所有的解决方案都包括glob和shutil标准库。例如，我有一些以ods结尾的Unicode文件名，我想将它们移动到名为א的子目录(希伯来文Aleph，一个unicode字符).第一个解决

unicode Python code gt shutil file-manipulation

python - 转换或去除 "illegal"Unicode 字符

我在MSSQL中有一个数据库，我正在将其移植到SQLite/Django。我正在使用pymssql连接到数据库并将文本字段保存到本地SQLite数据库。但是对于某些角色，它会爆炸。我收到这样的投诉:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0x97inposition1916:ordinalnotinrange(128)有什么方法可以将字符转换为正确的unicode版本？还是剥离它们？最佳答案一旦你有了字节串s，不要直接将它用作unicodeobj，而是使用正确的编解码器显式转换

去除 amp code section stackoverflow python unicode pymssql

python - 如何控制包含东亚字符的 Unicode 字符串的填充

我得到了三个UTF-8字符串:hello,worldhello,世界hello,世rld我只想要前10个ascii-char-width，这样一列中的括号:[hello,wor][hello,世][hello,世r]在控制台中:width('世界')==width('worl')width('世')==width('wor')#awhitespacebehind'世'一个汉字是三个字节，但在控制台显示时只有2个ascii字符的宽度:>>>bytes("hello,世界",encoding='utf-8')b'hello,\xe4\xb8\x96\xe7\x95\x8c'当UTF-8字符

Unicode python 39 code hello string-formatting

Python 2 如何将 values_list 操作返回的 unicode 列表更改为字符串列表

我执行此操作以检索查询集:Name.objects.values_list('name',flat=True)它返回这些结果:[u'accelerate',u'acute',u'bear',u'big']结果都是unicode(u')。如何将它们全部删除以便获得结果:['accelerate','acute','bear','big'] 最佳答案如果你想在utf8中编码，你可以简单地做:definitions_list=[definition.encode("utf8")fordefinitionindefinitions.obj

values_list unicode section 39 code python django django-views django-queryset

Python3 将 Unicode String 转换为 int 表示

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visitthehelpcenter.关闭10年前。众所周知，计算机处理数字。我现在正在输入这段文字，服务器从中生成一个数字，当你想阅读它时，你将从服务器获得文本。我怎样才能自己做这件事？我想用我自己的算法加密一些东西，我的算法可以很好地处理整数，但现在我想加密一个字符串，但我不知道如何将Unicode字符串转换为整数，反之亦然。我正在使用Python3。有人知道解决我的问题的优雅方法吗？

Python3 Unicode section notice class python string python-3.x int

python - 在 Python 2.7 中使用 unicodedata.normalize

再一次，我对一个unicode问题很困惑。我不知道如何成功使用unicodedata.normalize按预期转换非ASCII字符。例如，我想转换字符串u"Cœur"到u"Coeur"我很确定unicodedata.normalize是执行此操作的方法，但我无法让它工作。它只是让字符串保持不变。>>>s=u"Cœur">>>unicodedata.normalize('NFKD',s)==sTrue我做错了什么？最佳答案你可以试试Unidecode:#-*-coding:utf-8-*-fromunidecodeimportun

unicodedata normalize section code python python-2.7 unicode normalization unicode-normalization

python - 在 python 中使用 re 删除 unicode 表情符号

我尝试从unicode推文文本中删除表情符号并使用python2.7打印出结果myre=re.compile(u'[\u1F300-\u1F5FF\u1F600-\u1F64F\u1F680-\u1F6FF\u2600-\u26FF\u2700-\u27BF]+',re.UNICODE)printmyre.sub('',text)但似乎几乎所有字符都从文本中删除了。我检查了其他帖子的几个答案，不幸的是，它们在这里都不起作用。我在re.compile()中做错了什么吗？这是一个所有字符都被删除的示例输出:“'//./”!###… 最佳答案

python unicode 39 code 0001 regex emoji tweets

Mac OS X 终端中的 Python unicode

谁能给我解释一下这个奇怪的事情:在pythonshell中输入以下西里尔字符串:>>>print'абвгд'абвгд但是当我输入时:>>>printu'абвгд'Traceback(mostrecentcalllast):File"",line1,inUnicodeEncodeError:'ascii'codeccan'tencodecharactersinposition0-9:ordinalnotinrange(128)由于第一个字符串正确出现，我认为我的OSX终端可以表示unicode，但事实证明在第二个情况下它不能。为什么？最佳答案

unicode Python code section pre macos terminal

155 156 157158159 160 161