草庐IT

unicode_normalize

全部标签

Python 瓶请求和 unicode

我正在用python构建一个带有bottle的小型RESTfulAPI,目前在处理请求对象时遇到字符编码问题。打开http://server.com/api?q=äöü并查看服务器上的request.query['q']让我“äã¶Ã¼”,这显然不是我要找的。对于包含表单urlencoded键q和值äöü的POST请求也是如此。request.forms.get('q')包含“äöü”。这是怎么回事?我真的没有选择用不同的编码解码这些元素,或者我可以吗?Bottle是否有通用选项以unicode格式存储这些内容?谢谢。 最佳答案

python - 在 python 中查找类型 - TypeError 'unicode' 对象不可调用

我试图确保一个对象是Python中的字符串类型(对于谷歌应用引擎)。我这样做是为了在超过500字节时将其更改为db.Text类型。但是,我不断收到错误消息:TypeError'unicode'objectisnotcallableiftype(value)intypes.StringTypesandlen(value)>499:value=db.Text(value)setattr(entity,key,value)我应该用什么来判断对象的类型是不是字符串? 最佳答案 我认为您只需要从types.StringTypes中删除括号,因

python - Python 中的 Unicode 和 `decode()`

>>>a="我"#chinese>>>b=unicode(a,"gb2312")>>>a.__class__>>>b.__class__#bisunicode>>>a'\xce\xd2'>>>bu'\u6211'>>>c=u"我">>>c.__class__#cisunicode>>>cu'\xce\xd2'b和c都是unicode,但是>>>b输出u'\u6211',而>>>c输出u'\xce\xd2',为什么? 最佳答案 当您输入"I"时,Python解释器从终端获取该字符在您的本地字符集中的表示,由于“”。在我的UTF-8系统

javascript - 将 unicode 字符串从 django 传递到 javascript

我的数据中有一堆unicode字符串,我需要将它们从我的djangoView传递到模板,以便在JavaScriptscriptlet中使用,然后将它来回传递到web。问题是我希望字符串以JavaScriptunicode形式表示,但我从python中获得了带有u前缀的字符串。例如,对于字符串mężczyźni,Python将其存储为u'm\u0119\u017cczy\u017ani'但当它传递给模板时,它不会删除u前缀,这会在处理JavaScript时产生问题。我希望它只是'm\u0119\u017cczy\u017ani'以便模板中的JavaScript代码可以使用它。我尝试使用u

python - 如何打印包含 unicode 字符的变量?

printu'\u0D05'a='\u0D05'printaprinta将\u0D05作为输出,但我想打印它代表的unicode字符,即അ。我怎样才能做到这一点? 最佳答案 \u转义符在非unicode字符串中没有意义。您需要执行a=u'\u0D05'。如果你说你从其他地方获取字符串并且需要解释其中的unicode转义,那么执行printa.decode('unicode-escape') 关于python-如何打印包含unicode字符的变量?,我们在StackOverflow上找到一

python - 如何引发包含 Unicode 字符串的异常?

我正在使用Unicode字符串编写Python2代码,导入unicode_literals,但我遇到了引发异常的问题。#-*-coding:utf-8-*-from__future__importunicode_literalsraiseException('Tést')执行此操作时,“Tést”字符串会从终端中剥离。我可以解决这个问题raiseException('Tést'.encode('utf-8'))我宁愿找到一个全局解决方案,也不愿在所有raiseException语句中都这样做。(由于我在异常消息中使用了PyQt的tr()函数,所以必须处理特殊字符,我无法在编码时知道en

python - Gensim: TypeError: doc2bow 期望输入的是一个 unicode 标记数组,而不是单个字符串

我从一些python任务开始,我在使用gensim时遇到问题。我正在尝试从我的磁盘加载文件并处理它们(拆分它们并小写()它们)我的代码如下:dictionary_arr=[]forfile_pathinglob.glob(os.path.join(path,'*.txt')):withopen(file_path,"r")asmyfile:text=myfile.read()forwordsintext.lower().split():dictionary_arr.append(words)dictionary=corpora.Dictionary(dictionary_arr)列表(

Python 3.x : Using string. maketrans() 以创建 unicode 字符转换

我想写下面的代码:importstringfrm=b'acdefhnoprstuw'to='אקדיפהנופרסתאו'trans_table=string.maketrans(frm,to)hebrew_phrase='fearcutsdeeperthanswords'.translate(trans_table)上面的代码不起作用,因为string.maketrans(frm,to)的to参数必须是字节序列,而不是字符串。问题是字节序列只能包含ASCII文字字符。因此,我无法进行将英语字符串翻译为希伯来语字符串的转换。原因是string.maketrans()返回一个字节对象。是

Python 打印 unicode 列表

用下面的代码lst=[u'\u5de5',u'\u5de5']msg=repr(lst).decode('unicode-escape')printmsg我得到了[u'工',u'工']如何删除前导u以便msg的内容为:['工','工'] 最佳答案 >>>importsys>>>lst=[u'\u5de5',u'\u5de5']>>>msg=repr([x.encode(sys.stdout.encoding)forxinlst]).decode('string-escape')>>>printmsg['工','工']

Python:如何检查unicode字符串是否包含大小写字符?

我正在做一个过滤器,其中我检查unicode(utf-8编码)字符串是否不包含大写字符(在所有语言中)。如果字符串根本不包含任何大小写字符,我也没问题。例如:“你好!”不会通过过滤器,而是“!”应该通过过滤器,因为“!”不是大小写字符。我计划使用islower()方法,但在上面的示例中,"!".islower()将返回False。根据Python文档,“如果unicode字符串的大小写字符全部为小写且字符串包含至少一个大小写字符,则pythonunicode方法islower()返回True,否则返回False。”因为当字符串不包含任何大小写字符时,该方法也会返回False,即。“!”