草庐IT

unicode_normalize

全部标签

python - 为什么 unicode() 只在我的对象上使用 str() 而没有给出编码?

我首先创建一个字符串变量,其中包含一些非asciiutf-8编码数据:>>>text='á'>>>text'\xc3\xa1'>>>text.decode('utf-8')u'\xe1'在其上使用unicode()会引发错误...>>>unicode(text)Traceback(mostrecentcalllast):File"",line1,inUnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc3inposition0:ordinalnotinrange(128)...但是如果我知道编码,我可以将它用作第二个参数:>>>unicode

python - 在 ModelChoiceField Django 中使用 __unicode__ 以外的方法

我正在使用Django处理一些表单。一个字段是模型中的ForeignKey,因此在表单中表示为ModelChoiceField。ModelChoiceField当前使用模型的__unicode__方法来填充列表,这不是我想要的行为。我希望能够使用模型的另一种方法。从文档中,我似乎可以强制使用自己的QuerySet,但我看不出这将如何帮助我使用__unicode__以外的方法。如果可能的话,我真的宁愿避免将其与默认表单方法分开。有什么建议吗? 最佳答案 您可以覆盖label_from_instance以指定不同的方法:fromdjan

python - 在 Python 正则表达式的 unicode 文本中使用的字边界

我想在正则表达式中使用单词边界来匹配一些unicode文本。Unicode字母在Python正则表达式中被检测为单词边界,如下所示:>>>re.search(r"\by\b","üyü")>>>re.search(r"\by\b","ğyğ")>>>re.search(r"\by\b","uyu")>>>如何使单词边界符号不匹配unicode字母? 最佳答案 使用re.UNICODE:>>>re.search(r"\by\b","üyü",re.UNICODE)>>> 关于python-

python - 如何在 Python 2.7 中编写 unicode csv

我想将数据写入文件,其中CSV中的一行应类似于此列表(直接来自Python控制台):row=['\xef\xbb\xbft_11651497','http://kozbeszerzes.ceu.hu/entity/t/11651497.xml',"SzabolcsMag'98Kft.",'ny\xc3\xadregyh\xc3\xa1za','ny\xc3\xadregyh\xc3\xa1za','4400','t\xc3\xbcndeutca20.',47.935175,21.744975,u'Ny\xedregyh\xe1za',u'Borb\xe1nya',u'Szabolcs-

Python:将 Unicode 转换为 ASCII,对于 CSV 文件没有错误

我一直在StackOverflow的此处阅读有关使用Python从Unicode转换为CSV的所有问题,但我仍然迷路了。每次我收到“UnicodeEncodeError:'ascii'编解码器无法对位置12中的字符u'\xd1'进行编码:序号不在范围内(128)”buffer=cStringIO.StringIO()writer=csv.writer(buffer,csv.excel)cr.execute(query,query_param)while(1):row=cr.fetchone()writer.writerow([s.encode('ascii','ignore')fors

python - Flask 0.10 在 session cookie 上给出 unicode 错误

升级到Flask0.10后,我得到这个错误:flask.debughelpers.UnexpectedUnicodeErrorUnexpectedUnicodeError:Abytestringwithnon-ASCIIdatawaspassedtothesessionsystemwhichcanonlystoreunicodestrings.Considerbase64encodingyourstring(Stringwas'iB\rOU#\xf7BO\x08^\xa6\xd1)v\xad')Traceback(mostrecentcalllast)File"/srv/www/li/

python - 如何从 Python 的字典中删除 u' (unicode)?

我有一本字典{u'value1':{u'Capacity1':0,u'E1':'None',u'status':u'ONLINE',u'name':u'value1',u'perf':'None',u'Id':u'2005',u'id1':u'3000',u'Capacity2':4}}如何从键和值(它本身是另一个字典?))中删除u'谢谢! 最佳答案 一种可能是(假设Python2):defencode_dict(d,codec='utf8'):ks=d.keys()forkinks:val=d.pop(k)ifisinstance

python UnicodeEncodeError > 我怎样才能简单地删除麻烦的 unicode 字符?

这是我做的..>>>soup=BeautifulSoup(html)>>>soupTraceback(mostrecentcalllast):File"",line1,inUnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\xae'inposition96953:ordinalnotinrange(128)>>>>>>soup.find('div')Traceback(mostrecentcalllast):File"",line1,inUnicodeEncodeError:'ascii'codeccan'tencodechara

python - 正则表达式以获取具有特定字母的所有单词列表(unicode 字素)

我正在为FOSS语言学习计划编写Python脚本。假设我有一个XML文件(或者为了简单起见,一个Python列表),其中包含特定语言的单词列表(在我的例子中,这些单词是泰米尔语,它使用基于婆罗米语的印度脚本)。我需要画出仅使用这些字母即可拼写的那些单词的子集。一个英文例子:words=["cat","dog","tack","coat"]get_words(['o','c','a','t'])shouldreturn["cat","coat"]get_words(['k','c','t','a'])shouldreturn["cat","tack"]泰米尔语示例:words=[u"மர

python - 如何使用 SQLAlchemy 保存 unicode?

我遇到过这样的错误:File"/vagrant/env/local/lib/python2.7/site-packages/sqlalchemy/engine/default.py",line435,indo_executecursor.execute(statement,parameters)exceptions.UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\u2013'inposition8410:ordinalnotinrange(128)当我尝试使用指定的Python的unicode字符串保存ORM对象时,会发生这种