草庐IT

IME_FLAG_FORCE_ASCII

全部标签

python - 从 Python 中的 unicode 字符串替换非 ascii 字符

如何在Python中替换unicode字符串中的非ascii字符?这是我对给定输入的输出:音乐->音乐纸箱->纸箱卡诺->卡诺Myaybe有一个字典,其中'á'是键,'a'是值? 最佳答案 如果您只想将重音字符降级为非重音字符:>>>importunicodedata>>>unicodedata.normalize('NFKD',u"m\u00fasica").encode('ascii','ignore')'musica' 关于python-从Python中的unicode字符串替换非

字符串中所有字符的ASCII值的Python总和

我正在寻找一种更有效的方法来总结ASCII给定字符串中所有字符的值,仅使用标准python(最好是2.7)。目前我有:printsum(ord(ch)forchintext)我想强调的是,我在这个问题上的主要关注点和方面是我上面写的。以下是这个问题不太重要的方面,应该这样对待:那我为什么要问呢?!我比较了这种方法与嵌入一个简单的C代码函数,后者具有相同的功能here使用PyInline,一个简单的C嵌入式函数似乎快了17倍。如果没有比我建议的更快的Python方法(仅使用标准Python),Python开发人员没有在核心中添加这样的实现似乎很奇怪。建议答案的当前结果。在我的Window

python - 统一码编码错误 : 'ascii' codec can't encode characters in position 0-5: ordinal not in range(128)

这个问题在这里已经有了答案:UnicodeerrorOrdinalnotinrange(1个回答)关闭5年前。我只是想解码类似\uXXXX\uXXXX\uXXXX的字符串。但是我得到一个错误:$pythonPython2.7.6(default,Sep92014,15:04:36)[GCC4.2.1CompatibleAppleLLVM6.0(clang-600.0.39)]ondarwinType"help","copyright","credits"or"license"formoreinformation.>>>printu'\u041e\u043b\u044c\u0433\u0

Python wheel force ABI 到 "none"

我认为这是一个简单的问题,但我还没有找到答案,所以我在这里发帖。我有一个Python3应用程序,我将其打包到平台轮中。我有setup.py,一切都按预期工作。我唯一想不通的是生成的wheel总是包含一个ABI标签(如“cp34m”),当它被包含时我发现我实际上无法通过pip安装wheel。(我的构建脚本在运行前安装了最新的pip、setuptools和wheel。)解决方法很简单。我只是更改了车轮的文件名,将“cp34m”更改为“无”。这显然很容易添加到我的构建脚本中,但我想知道是否可以为bdist_wheel或其他东西设置一个选项,以便生成的.whl文件本身没有任何设置?我用来创建轮

python - 在 Python 中将 ASCII 字符转换为 Unicode FULLWIDTH 拉丁字母?

你能轻松地在ASCII字符和它们的亚洲全角Unicode宽字符之间转换吗?喜欢:0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&()*+,-./:;?@[\\]^_`{|}~到0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!゛#$%&()*+、ー。/:;〈==〉?@[\\]^_‘{|}~ 最佳答案 那些“宽”字符被命名为FULLWIDTHLATINLETTER:http

Python 正则表达式替换为 ASCII 值

我的输入字符串类似于He#108##108#o,输出应该是Hello。基本上我想用##中数字的相关ASCII字符替换每个#[0-9]+#。 最佳答案 在正则表达式中使用替换函数,它提取数字,将它们转换为整数,然后转换为字符:importres="He#108##108#o"print(re.sub("#(\d+)#",lambdax:chr(int(x.group(1))),s))结果:Hello 关于Python正则表达式替换为ASCII值,我们在StackOverflow上找到一个类

python - 如何在 Python 中处理 Unicode(非 ASCII)字符?

我在Python编程我正在通过urllib2从网页获取信息图书馆。问题是该页面可以为我提供非ASCII字符,例如'ñ'、'á'等。就在这一刻urllib2获取这个字符,它会引发异常,如下所示:File"c:\Python25\lib\httplib.py",line711,insendself.sock.sendall(str)File"",line1,insendall:UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\xf1'inposition74:ordinalnotinrange(128)我需要处理这些字符。我的意思是

python - 一个有弹性的、实际工作的非 ascii 的 CSV 实现?

[更新]感谢所有的答案和输入,但工作代码将是最受欢迎的。如果您可以提供可以读取示例文件的代码,那么您就是国王(或王后)。[更新2]感谢您的出色回答和讨论。我需要用这些做的是读入它们,解析它们,并将它们的一部分保存在Django模型实例中。我相信这意味着将它们从它们的native编码转换为unicode,以便Django可以处理它们,对吗?有severalquestions在Stackoverflow上已经讨论了非asciipythonCSV读取的主题,但是那里和python文档中显示的解决方案不适用于我正在尝试的输入文件。解决方案的要点似乎是对CSV阅读器的输入进行编码('utf-8'

python - 用于从两端删除非 ASCII 字符的正则表达式

我必须使用这段代码循环多次,有没有更好的方法?item='!@#$abc-123-4;5.def)(*&^;\n'或'!@#$abc-123-4;5.def)(*&^;\n_'或'!@#$abc-123-4;5.def)_(*&^;\n_'我的那个没用item=re.sub('^\W|\W$','',item)期待abc-123-4;5.def最终目标是只保留从两端删除不是[a-zA-Z0-9]的任何内容,同时保留中间的任何字符。第一个和最后一个字母在[a-zA-Z0-9]类中 最佳答案 Thisexpression不受左侧限制,如

Python - Unicode 到 ASCII 的转换

我无法在不丢失数据的情况下将以下Unicode转换为ASCII:u'ABRA\xc3OJOS\xc9'我试过encode和decode,他们都不行。有人有什么建议吗? 最佳答案 Unicode字符u'\xce0'和u'\xc9'没有任何对应的ASCII值。因此,如果您不想丢失数据,则必须以某种有效的ASCII方式对该数据进行编码。选项包括:>>>prints.encode('ascii',errors='backslashreplace')ABRA\xc3OJOS\xc9>>>prints.encode('ascii',errors