草庐IT

US_ASCII

全部标签

python - 用等效的 ASCII 替换特殊字符

是否有任何库可以将特殊字符替换为ASCII等价物,例如:"Cześć"到:"Czesc"我当然可以创建map:{'ś':'s','ć':'c'}并使用一些替换功能。但我不想将所有等价物硬编码到我的程序中,如果有一些功能已经这样做了。 最佳答案 #!/usr/bin/envpython#-*-coding:utf-8-*-importunicodedatatext=u'Cześć'printunicodedata.normalize('NFD',text).encode('ascii','ignore')

python - UnicodeEncodeError : 'ascii' codec can't encode character u'\u2026'

我正在学习urllib2和BeautifulSoup,在第一次测试中遇到如下错误:UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\u2026'inposition10:ordinalnotinrange(128)似乎有很多关于这种类型错误的帖子,我已经尝试了我能理解的解决方案,但似乎有22个问题,例如:我想打印post.text(其中text是一种漂亮的汤方法,只返回文本)。str(post.text)和post.text产生unicode错误(在右撇号的'和...)。所以我在str(post.text)上面加上post=un

python - 在 Python 中将 Unicode URL 转换为 ASCII(UTF-8 百分比转义)的最佳方法?

我想知道最好的方法是什么——或者标准库是否有一种简单的方法——将域名和路径中带有Unicode字符的URL转换为等效的ASCIIURL,用域编码为IDNA和根据RFC3986编码的路径。我从用户那里得到一个UTF-8格式的URL。因此,如果他们输入http://➡.ws/♥我会得到'http://\xe2\x9e\xa1.ws/\xe2\x99\xa5'在Python中。我想要的是ASCII版本:'http://xn--hgi.ws/%E2%99%A5'。我目前所做的是通过正则表达式将URL拆分为多个部分,然后手动对域进行IDNA编码,并使用不同的urllib.quote()分别对路径

python - Python中将字符串转换为全小写以去除所有非ASCII字母字符的最有效方法是什么?

我有一个简单的任务需要在Python中执行,即将字符串转换为全小写并去除所有非ascii非字母字符。例如:"ThisisaTest"->"thisisatest""A235th@#$&(erRa{}|?>ndom"->"atherrandom"我有一个简单的功能来做到这一点:importstringimportsysdefstrip_string_to_lowercase(s):tmpStr=s.lower().strip()retStrList=[]forxintmpStr:ifxinstring.ascii_lowercase:retStrList.append(x)return'

python - UnicodeEncodeError : 'ascii' codec can't encode character u'\u201c' in position 34: ordinal not in range(128)

我一直在开发一个从StackOverflow检索问题的程序。直到昨天程序运行良好,但从今天开始我收到错误"MessageFileNameLinePositionTracebackC:\Users\DPT\Desktop\questions.py13UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\u201c'inposition34:ordinalnotinrange(128)"目前正在显示问题,但我似乎无法将输出复制到新的文本文件中。importsyssys.path.append('.')importstackexchang

用于将 UTF-8 转换为 ASCII 的 Python 脚本

这个问题在这里已经有了答案:ConvertUnicodetoASCIIwithouterrorsinPython(12个回答)关闭8年前。我正在尝试在python中编写一个脚本来将utf-8文件转换为ASCII文件:#!/usr/bin/envpython#*-*coding:iso-8859-1*-*importsysimportosfilePath="test.lrc"fichier=open(filePath,"rb")contentOfFile=fichier.read()fichier.close()fichierTemp=open("tempASCII","w")fichi

python - 如何在python中获取一个小的ascii文件的内容?

假设我们要实现PHP的file_get_content的等价物。.最佳做法是什么?(优雅可靠)这里有一些命题,对吗?使用with语句:deffile_get_contents(filename):withfile(filename)asf:s=f.read()returns使用标准open()安全吗?deffile_get_contents(filename):returnopen(filename).read()两种解决方案中的文件描述符会发生什么变化? 最佳答案 在当前的CPython实现中,两者通常都会立即关闭文件。但是,Py

python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128)

在我的一台机器上,当我使用google应用程序引擎或django时出现错误。例如:app.yamlapplication:demas1252cversion:1runtime:pythonapi_version:1handlers:-url:/imagesstatic_dir:images-url:/cssstatic_dir:css-url:/jsstatic_dir:js-url:/.*script:demas1252c.pydemas1252c.pyimportcgiimportwsgiref.handlersfromgoogle.appengine.ext.webappimpo

Python - 'ascii' 编解码器无法解码字节

我正在使用Python2.6和Jinja2创建HTML报告。我为模板提供了许多结果,模板循环通过它们并创建HTML表格在调用template.render时,我突然开始收到这个错误。{{result.result_str}}UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc4inposition0:ordinalnotinrange(128)奇怪的是,即使我将result.result_str设置为每个结果的简单ascii字符串(如“abc”),我仍然会看到此错误。我是Jinja2和Python的新手,如果我有任何关于如何着手调查问题以找

python - 如何在 Python 中将单个字符转换为其十六进制 ASCII 值?

我有兴趣接受单个角色。c='c'#forexamplehex_val_string=char_to_hex_string(c)printhex_val_string输出:63解决这个问题的最简单方法是什么?任何预定义的字符串库的东西? 最佳答案 有几种方法可以做到这一点:>>>hex(ord("c"))'0x63'>>>format(ord("c"),"x")'63'>>>importcodecs>>>codecs.encode(b"c","hex")b'63'在Python2上,您还可以使用hexencoding像这样(不适用于P