草庐IT

unicode_literals

全部标签

python - 如何将 unicode 类型与 python 中的字符串进行比较?

我正在尝试使用比较字符串对象的列表理解,但其中一个字符串是utf-8,它是json.loads的副产品。场景:us=u'MyString'#istheutf-8string我的问题之一是,为什么这会返回False?:us.encode('utf-8')=="MyString"##False第二部分-如何在列表理解中进行比较?myComp=[utfStringforutfStringinjsonLoadsObjifutfString.encode('utf-8')=="MyString"]#wrappedtoreadonS.O.编辑:我使用的是使用Python2.7的GoogleAppE

python - 如何在 Python 中找出 unicode 字符的编号/名称?

在Python中:>>>"\N{BLACKSPADESUIT}"'♠'>>>"\u2660"'♠'现在,假设我有一个我不知道名称或编号的角色。是否有一个Python函数可以提供这样的信息?>>>wanted_function('♠')["BLACKSPADESUIT","u2660"] 最佳答案 您可以找到unicodedata模块方便:>>>s="\N{BLACKSPADESUIT}">>>s'♠'>>>importunicodedata>>>unicodedata.name(s)'BLACKSPADESUIT'>>>ord(s)

python - 如何用其他python替换字符串中的unicode字符?

由于项目符号列表,我有一个字符串,该字符串是通过阅读带有符号“•”的项目符号的HTML网页获得的。请注意,该文本是来自使用Python2.7的urllib2.read(webaddress)网页的HTML源代码。我知道项目符号字符的unicode字符为U+2022,但我该如何用其他字符替换该unicode字符?我试着做str.replace("•","something")但它似乎不起作用......我该怎么做? 最佳答案 将字符串解码为Unicode。假设它是UTF-8编码的:str.decode("utf-8")调用replac

python - 在python2.7中删除字符串中的unicode\u2026之类的字符

这个问题在这里已经有了答案:Replacenon-ASCIIcharacterswithasinglespace(12个回答)Howtoremove\xa0fromstringinPython?(15个回答)关闭2年前。我在python2.7中有一个这样的字符串,Thisissome\u03c0textthathastobecleaned\u2026!it\u0027sannoying!如何转换成这个,Thisissometextthathastobecleaned!itsannoying! 最佳答案 Python2.x>>>s'T

python - 当我将列表分配给变量时,为什么 Pycharm 会给我一个提示 "this list creation could be rewritten as a list literal"?

我是一名Python初学者并且有一个难题。当我写这样的代码时:lst=[1,2,3,4]Pycharm给我一个提示“这个列表创建可以重写为列表文字”。但是如果它被替换为lst=list([1,2,3,4])Pycharm什么也没说。谁能告诉我为什么?像lst=[1,2,3,4]这样的代码在Python中合法吗?我可以忽略提示吗? 最佳答案 在Python中编写这样的代码是完全合法的。但是,编写类似的代码lst=[1,2,3,4,12]会比“更好”lst=[1,2,3,4]...#codehasnothingdotowithlstls

python - Python 2.6 中对 csv 文件的通用 Unicode/UTF-8 支持

当涉及UTF-8/Unicode时,Python中的csv模块无法正常工作。我发现,在Pythondocumentation在其他网页上,适用于特定情况的代码段,但您必须充分了解您正在处理的编码并使用适当的代码段。如何从Python2.6中“正常工作”的.csv文件读取和写入字符串和Unicode字符串?或者这是Python2.6的限制,没有简单的解决方案? 最佳答案 http://docs.python.org/library/csv.html#examples给出的如何读取Unicode的示例代码看起来已经过时,因为它不适用于P

python - urllib.urlencode 不喜欢 unicode 值 : how about this workaround?

如果我有这样的对象:d={'a':1,'en':'hello'}...那我可以传给urllib.urlencode,没问题:percent_escaped=urlencode(d)printpercent_escaped但如果我尝试传递一个类型为unicode的对象,游戏结束:d2={'a':1,'en':'hello','pt':u'olá'}percent_escaped=urlencode(d2)printpercent_escaped#ThisfailswithaUnicodeEncodingError所以我的问题是关于准备传递给urlencode的对象的可靠方法。我想出了这个

python - 如何在python中取消引用urlencoded unicode字符串?

我有一个像“Tanım”这样的unicode字符串,它以某种方式编码为“Tan%u0131m”。如何将此编码字符串转换回原始unicode。显然urllib.unquote不支持unicode。 最佳答案 %uXXXX是non-standardencodingscheme已被w3c拒绝,尽管实现仍然存在于JavaScript领域。更常见的技术似乎是对字符串进行UTF-8编码,然后使用%XX对结果字节进行%转义。urllib.unquote支持此方案:>>>urllib2.unquote("%0a")'\n'不幸的是,如果你真的需要支

匹配 Unicode 属性的 Python 正则表达式

Perl和其他一些当前的正则表达式引擎支持正则表达式中的Unicode属性,例如类别。例如。在Perl中,您可以使用\p{Ll}匹配任意小写字母,或使用p{Zs}匹配任何空格分隔符。我在Python的2.x和3.x行中都没有看到对此的支持(很遗憾)。有人知道获得类似效果的好策略吗?欢迎使用本土解决方案。 最佳答案 regex模块(标准re模块的替代方案)支持具有\p{}语法的Unicode代码点属性。 关于匹配Unicode属性的Python正则表达式,我们在StackOverflow上

python - 如何比较具有不同字节但值相同的 Unicode 字符串?

我正在比较JSON对象之间的Unicode字符串。它们具有相同的值:a='人口じんこうに膾炙かいしゃする'b='人口じんこうに膾炙かいしゃする'但它们有不同的Unicode表示:Stringa:u'\u4eba\u53e3\u3058\u3093\u3053\u3046\u306b\u81be\u7099\u304b\u3044\u3057\u3083\u3059\u308b'Stringb:u'\u4eba\u53e3\u3058\u3093\u3053\u3046\u306b\u81be\uf9fb\u304b\u3044\u3057\u3083\u3059\u308b'如何比较两