草庐IT

ensure_ascii

全部标签

Python (nltk) - UnicodeDecodeError : 'ascii' codec can't decode byte

我是NLTK的新手。我遇到了这个错误,我四处搜索编码/解码,特别是UnicodeDecodeError,但这个错误似乎特定于NLTK源代码。这是错误:Traceback(mostrecentcalllast):File"A:\Python\Projects\Test\main.py",line2,inprint(pos_tag(word_tokenize("John'sbigideaisn'tallthatbad.")))File"A:\Python\Python\lib\site-packages\nltk\tag\__init__.py",line100,inpos_tagtagg

python - 格式化包含非 ascii 字符的列

所以我想对齐包含非ascii字符的字段。以下似乎不起作用:forword1,word2in[['hello','world'],['こんにちは','世界']]:print"{:有解决办法吗? 最佳答案 您正在格式化一个多字节编码的字符串。您似乎正在使用UTF-8对文本进行编码,并且该编码每个代码点使用多个字节(在1到4之间,具体取决于特定字符)。格式化字符串计算字节,而不是代码点,这是您的字符串最终未对齐的原因之一:>>>len('hello')5>>>len('こんにちは')15>>>len(u'こんにちは')5改为将您的文本格式

python - 在 asyncio.ensure_future 中捕获错误

我有这个代码:try:asyncio.ensure_future(data_streamer.sendByLatest())exceptValueErrorase:logging.debug(repr(e))data_streamer.sendByLatest()可以引发ValueError,但不会被捕获。 最佳答案 ensure_future-只需创建Task并立即返回。您应该等待创建的任务以获取其结果(包括引发异常的情况):importasyncioasyncdeftest():awaitasyncio.sleep(0)rais

python - 非 ASCII Python 标识符和反射率

这个问题在这里已经有了答案:Identifiernormalization:WhyisthemicrosignconvertedintotheGreeklettermu?(2个答案)关闭4年前。我从PEP3131中学到了Python支持非ASCII标识符,尽管它不被认为是最佳实践。但是,我遇到了这种奇怪的行为,我的?标识符(U+1D70F)似乎自动转换为τ(U+03C4)。classBase(object):def__init__(self):self.?=5#definedwithU+1D70Fa=Base()print(a.?)#5#(U+1D70F)print(a.τ)#5asw

用于将纯文本(ASCII)转换为 GSM 7 位字符集的 Python 库?

是否有将ascii数据编码为7位GSM字符集(用于发送SMS)的python库? 最佳答案 现在有:)感谢Chad指出这不太正确Python2版本#-*-coding:utf8-*-gsm=(u"@£$¥èéùìòÇ\nØø\rÅåΔ_ΦΓΛΩΠΨΣΘΞ\x1bÆæßÉ!\"#¤%&'()*+,-./0123456789:;"u"?¡ABCDEFGHIJKLMNOPQRSTUVWXYZÄÖÑܧ¿abcdefghijklmnopqrstuvwxyzäöñüà")ext=(u"````````````````````^````````

python - 在 python 中将 ASCII 字符串写为二进制

我有一个ASCII字符串="abcdefghijk"。我想使用python将其写入二进制格式的二进制文件。我试过以下:str="abcdefghijk"fp=file("test.bin","wb")hexStr="".join((("\\x%s")%(x.encode("hex")))forxinstr)fp.write(hexStr)fp.close()但是,当我打开test.bin时,我看到的是ascii格式而不是二进制格式。\x61\x62\x63\x64\x65\x66\x67我理解它是因为这里有两个斜杠("\\x%s")。我该如何解决这个问题?提前致谢。更新:以下给了我预期

python - Python 中的文本到 ASCII 艺术生成器

我想在我们开发人员的命令行工具中添加一个彩蛋,如果某个日期匹配,它会向用户致意。基本上,我正在寻找:>>>printbig_text("Happy\nBirthday").__________....___________...._.'|\|.''-.\|.''-..-..-是否有相应的软件包?Creditwherecreditisdue. 最佳答案 您在此处链接的TAAG应用程序的作者。TAAG中的大多数字体都是FIGlet字体(figlet.org)。FIGlet是一个命令行linux应用程序,但FIGlet驱动程序已用多种语言

python - 编译语法错误 : non ASCII letters in a string

我有一个包含一长串HTML的Python文件。当我编译并运行这个文件/脚本时,我得到这个错误:_SyntaxError:Non-ASCIIcharacter'\x92'infileC:\Users...\GlobalVars.pyonline2509,butnoencodingdeclared;seehttp://www.python.org/peps/pep-0263.htmlfordetails_我已按照说明访问了建议的网址。但是把这样的东西放在我的脚本的顶部仍然不起作用:#!/usr/bin/python#-*-coding:latin-1-*-你认为我可以做些什么来阻止这个编译

Python:string.uppercase 与 string.ascii_uppercase

这可能是一个愚蠢的问题,但我不明白字符串模块中的string.uppercase和string.ascii_uppercase之间有什么区别。打印两个函数的文档字符串打印相同的东西。甚至printstring.uppercase和printstring.ascii_uppercase的输出也是一样的。谢谢。 最佳答案 对于Python2.7,区别是:(参见https://docs.python.org/2.7/library/string.html)string.ascii_uppercase:大写字母“ABCDEFGHIJKLMN

python - 统一码编码错误 : 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128)

当我运行我的代码时,我得到这个错误:UserId="{}".format(source[1])UnicodeEncodeError:'ascii'codeccan'tencodecharactersinposition0-3:ordinalnotinrange(128)我的代码是:defview_menu(type,source,parameters):ADMINFILE='static/users.txt'fp=open(ADMINFILE,'r')users=ast.literal_eval(fp.read())ifnotparameters:ifnotsource[1]inuse