草庐IT

IME_FLAG_FORCE_ASCII

全部标签

python - PIP 安装 Numpy 抛出错误 "ascii codec can' t decode byte 0xe2"

我在新构建的计算机上安装了新安装的Ubuntu。我刚刚使用apt-get安装了python-pip。现在,当我尝试pipinstallNumpy和Pandas时,它会出现以下错误。我在SO和Google上的很多地方都看到过这个错误,但我一直无法找到解决方案。有人提到这是一个错误,一些线程只是死了......这是怎么回事?Traceback(mostrecentcalllast):File"/usr/bin/pip",line9,inload_entry_point('pip==1.5.4','console_scripts','pip')()File"/usr/lib/python2.

python - 将二进制转换为 ASCII,反之亦然

使用此代码获取字符串并将其转换为二进制:bin(reduce(lambdax,y:256*x+y,(ord(c)forcin'hello'),0))这个输出:0b110100001100101011011000110110001101111如果我把它放入thissite(在右侧站点上)我收到了hello的消息。我想知道它使用什么方法。我知道我可以将二进制字符串拼接成8个,然后将其与bin(ord(character))或其他方式的相应值匹配。真的在寻找更简单的东西。 最佳答案 对于Python2上[-~]范围内的ASCII字符:>>

python - UnicodeEncodeError : 'ascii' codec can't encode character u'\u2013' in position 3 2: ordinal not in range(128)

我正在使用xlrd解析XSL文件。大多数事情都运行良好。我有一本字典,其中键是字符串,值是字符串列表。所有的键和值都是Unicode。我可以使用str()方法打印大部分键和值。但是有些值有Unicode字符\u2013我得到了上述错误。我怀疑这种情况正在发生,因为这是嵌入在Unicode中的Unicode,Python解释器无法对其进行解码。那么我该如何摆脱这个错误呢? 最佳答案 你也可以打印Unicode对象,你不需要在它周围做str()。假设你真的想要一个str:当您执行str(u'\u2013')时,您正在尝试将Unicode

python - 如何删除非 ASCII 字符但保留句点和空格?

我正在处理一个.txt文件。我想要文件中没有非ASCII字符的文本字符串。但是,我想留下空格和句号。目前,我也在剥离这些。代码如下:defonlyascii(char):iford(char)127:return''else:returnchardefget_my_string(file_path):f=open(file_path,'r')data=f.read()f.close()filtered_data=filter(onlyascii,data)filtered_data=filtered_data.lower()returnfiltered_data我应该如何修改onlya

python - Python 的 "best ASCII for this Unicode"数据库在哪里?

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提出有关书籍、工具、软件库等方面的建议的问题。您可以编辑问题,以便用事实和引用来回答它。关闭1年前。Improvethisquestion我有一些使用Unicode标点符号的文本,例如左双引号、右单引号作为撇号等等,我需要它的ASCII格式。Python是否有这些字符的数据库以及明显的ASCII替代品,所以我可以做得比将它们全部变成“?”更好。? 最佳答案 Unidecode看起来像一个完整的解决方案。它将花哨的引号转换为ascii引号,

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xd1 in position 2: ordinal not in range(128)

我正在尝试处理一个非常大的数据集,其中包含一些非标准字符。根据工作规范,我需要使用unicode,但我很困惑。(而且很可能做错了。)我使用以下方法打开CSV:15ncesReader=csv.reader(open('geocoded_output.csv','rb'),delimiter='\t',quotechar='"')然后,我尝试使用以下代码对其进行编码:name=school_name.encode('utf-8'),street=row[9].encode('utf-8'),city=row[10].encode('utf-8'),state=row[11].encode

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xef in position 1

我在尝试将字符串编码为UTF-8时遇到了一些问题。我尝试了很多东西,包括使用string.encode('utf-8')和unicode(string),但我得到了错误:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xefinposition1:ordinalnotinrange(128)这是我的字符串:(。・ω・。)ノ我不知道出了什么问题,知道吗?编辑:问题是按原样打印字符串无法正确显示。另外,当我尝试转换它时出现这个错误:Python2.7.1+(r271:86832,Apr112011,18:13:53)[GCC4.5.2]onli

Python - 'ascii' 编解码器无法解码字节

我真的很困惑。我尝试编码,但错误提示can'tdecode...。>>>"你好".encode("utf8")Traceback(mostrecentcalllast):File"",line1,inUnicodeDecodeError:'ascii'codeccan'tdecodebyte0xe4inposition0:ordinalnotinrange(128)我知道如何避免字符串上带有“u”前缀的错误。我只是想知道为什么调用编码时错误是“无法解码”。Python在后台做什么? 最佳答案 "你好".encode('utf-8')

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xe2 in position 13: ordinal not in range(128)

我正在使用NLTK对我的文本文件执行kmeans聚类,其中每一行都被视为一个文档。例如,我的文本文件是这样的:belongfingerdeathpunchhastymikehastywallsjerichojägermeisterrulesrulesbandsfollowperformingjägermeisterstageapproach现在我要运行的演示代码是这样的:importsysimportnumpyfromnltk.clusterimportKMeansClusterer,GAAClusterer,euclidean_distanceimportnltk.corpusfro

java - 将 Java 字符串转换为 ascii

我需要将包含某些特定于某些语言的字母(例如HÄSTDJUR-注意Ä)的String转换为没有这些特殊字母的String(在这种情况下哈斯特朱尔)。我怎样才能在Java中做到这一点?感谢您的帮助!这与它的声音无关。场景如下-您想使用该应用程序,但没有瑞典语键盘。因此,您无需查看字符映射,而是通过将特殊字母替换为拉丁字母表中的典型字母来键入它。 最佳答案 我觉得你的问题和这个一样:Java-gettingridofaccentsandconvertingthemtoregularletters因此答案也是一样的:解决方案Stringco