草庐IT

US_ASCII

全部标签

python - 在 Python 中将 Unicode 转换为 ASCII 而不会出错

我的代码只是抓取网页,然后将其转换为Unicode。html=urllib.urlopen(link).read()html.encode("utf8","ignore")self.response.out.write(html)但我得到一个UnicodeDecodeError:Traceback(mostrecentcalllast):File"/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_app

python - 在 Python 中将 Unicode 转换为 ASCII 而不会出错

我的代码只是抓取网页,然后将其转换为Unicode。html=urllib.urlopen(link).read()html.encode("utf8","ignore")self.response.out.write(html)但我得到一个UnicodeDecodeError:Traceback(mostrecentcalllast):File"/Applications/GoogleAppEngineLauncher.app/Contents/Resources/GoogleAppEngine-default.bundle/Contents/Resources/google_app

python - 如何检查Python中的字符串是否为ASCII?

我想检查一个字符串是否是ASCII码。我知道ord(),但是当我尝试ord('é')时,我有TypeError:ord()需要一个字符,但找到长度为2的字符串。我知道这是由我构建Python的方式引起的(如ord()'sdocumentation中所述)。还有其他方法可以检查吗? 最佳答案 我认为你没有问正确的问题--python中的字符串没有对应于'ascii'、utf-8或任何其他编码的属性。您的字符串的来源(无论您是从文件中读取它,还是从键盘输入等)可能已经在ascii中编码了一个unicode字符串来生成您的字符串,但这就是

python - 如何检查Python中的字符串是否为ASCII?

我想检查一个字符串是否是ASCII码。我知道ord(),但是当我尝试ord('é')时,我有TypeError:ord()需要一个字符,但找到长度为2的字符串。我知道这是由我构建Python的方式引起的(如ord()'sdocumentation中所述)。还有其他方法可以检查吗? 最佳答案 我认为你没有问正确的问题--python中的字符串没有对应于'ascii'、utf-8或任何其他编码的属性。您的字符串的来源(无论您是从文件中读取它,还是从键盘输入等)可能已经在ascii中编码了一个unicode字符串来生成您的字符串,但这就是

python - 用一个空格替换非 ASCII 字符

我需要用空格替换所有非ASCII(\x00-\x7F)字符。我很惊讶这在Python中并不容易,除非我遗漏了一些东西。以下函数简单地删除所有非ASCII字符:defremove_non_ascii_1(text):return''.join(iforiintextiford(i)并且这个根据字符代码点中的字节数将非ASCII字符替换为空格数(即-字符替换为3个空格):defremove_non_ascii_2(text):returnre.sub(r'[^\x00-\x7F]','',text)如何用一个空格替换所有非ASCII字符?OfthemyriadofsimilarSOques

python - 用一个空格替换非 ASCII 字符

我需要用空格替换所有非ASCII(\x00-\x7F)字符。我很惊讶这在Python中并不容易,除非我遗漏了一些东西。以下函数简单地删除所有非ASCII字符:defremove_non_ascii_1(text):return''.join(iforiintextiford(i)并且这个根据字符代码点中的字节数将非ASCII字符替换为空格数(即-字符替换为3个空格):defremove_non_ascii_2(text):returnre.sub(r'[^\x00-\x7F]','',text)如何用一个空格替换所有非ASCII字符?OfthemyriadofsimilarSOques

php - 从字符串中删除非ASCII字符

从网站提取数据时出现奇怪的字符:Â如何删除非非扩展ASCII字符的任何内容?可以在这里找到更合适的问题:PHP-replaceallnon-alphanumericcharsforalllanguagessupported 最佳答案 正则表达式替换将是最佳选择。使用$str作为示例字符串并使用:print:匹配它,它是POSIXCharacterClass:$str='aAÂ';$str=preg_replace('/[[:^print:]]/','',$str);//shouldbeaA:print:的作用是查找所有可打印字符。反

php - 从字符串中删除非ASCII字符

从网站提取数据时出现奇怪的字符:Â如何删除非非扩展ASCII字符的任何内容?可以在这里找到更合适的问题:PHP-replaceallnon-alphanumericcharsforalllanguagessupported 最佳答案 正则表达式替换将是最佳选择。使用$str作为示例字符串并使用:print:匹配它,它是POSIXCharacterClass:$str='aAÂ';$str=preg_replace('/[[:^print:]]/','',$str);//shouldbeaA:print:的作用是查找所有可打印字符。反

php - 用于创建 "Pretty"目录树的 ASCII 库?

是否有一些*nix工具或perl/php库可以让您轻松创建如下所示的目录树可视化?www|--private||--app|||--php||||--classes|||+--scripts|||--settings||+--sql|+--lib|+--ZendFramework-HEAD+--public|--css|--images+--scripts 最佳答案 UnixTree/LinuxTree中的这个例子怎么样?:ls-R|grep":$"|sed-e's/:$//'-e's/[^-][^\/]*\//--/g'-e's/

php - 用于创建 "Pretty"目录树的 ASCII 库?

是否有一些*nix工具或perl/php库可以让您轻松创建如下所示的目录树可视化?www|--private||--app|||--php||||--classes|||+--scripts|||--settings||+--sql|+--lib|+--ZendFramework-HEAD+--public|--css|--images+--scripts 最佳答案 UnixTree/LinuxTree中的这个例子怎么样?:ls-R|grep":$"|sed-e's/:$//'-e's/[^-][^\/]*\//--/g'-e's/