草庐IT

utf8_unicode_cs

全部标签

python - 在 python 2.7 中导入 Pandas 时出现 "ValueError: unknown locale: UTF-8"

这个问题在这里已经有了答案:IPythonNotebooklocaleerror[duplicate](4个回答)关闭6年前。我是python的新手,想学习使用pandas,但我什至无法在我的python中正确使用包。在我尝试过的终端中$condainstallpandas结果是:Fetchingpackagemetadata.......Solvingpackagespecifications:..........#Allrequestedpackagesalreadyinstalled.#packagesinenvironmentat/Users/rudyyuan/anaconda

python - 仅包含 ASCII 字符的 UNICODE 字符串是否总是等于 ASCII 字符串?

我注意到以下内容:>>>u'abc'=='abc'True>>>'abc'==u'abc'True这是否总是正确的,还是可能取决于系统区域设置?(似乎字符串在python3中是unicode:例如thisquestion,但在2.x中是字节) 最佳答案 Python2在比较两种类型时使用ASCII编解码器在unicode和str之间进行强制转换。所以是的,这是总是正确的。也就是说,除非你搞砸了你的Python安装并使用了sys.setdefaultencoding()更改该默认值。您不能正常这样做,因为sys.setdefaulte

python - 将python脚本输出输出到文件时出现Unicode错误

这是代码:print'"'+title.decode('utf-8',errors='ignore')+'",'\'"'+title.decode('utf-8',errors='ignore')+'",'\'"'+desc.decode('utf-8',errors='ignore')+'")'title和desc由BeautifulSoup3(p[0].text和p[0].prettify)返回,据我所知BeautifulSoup3文档是UTF-8编码的。如果我运行python.exescript.py>out.txt我收到以下错误:Traceback(mostrecentcall

python - 在 python 中查找 utf-16 文件。如何?

由于某种原因,我无法找到我的utf16文件。它产生“UnicodeException:UTF-16流不以BOM开头”。我的代码:f=codecs.open(ai_file,'r','utf-16')seek=self.ai_map[self._cbClass.Text]#seekisvalidintf.seek(seek)whileTrue:ln=f.readline().strip()我尝试了一些随机的东西,比如先从流中读取一些东西,但没有帮助。我检查了使用十六进制编辑器寻求的偏移量-字符串从字符开始,而不是空字节(我猜它的好兆头,对吗?)那么如何在python中寻找utf-16呢?

python - 找出一个字符的unicode脚本

给定一个unicode字符,返回其script的最简单方法是什么?(如“拉丁语”、“韩语”等)?unicodedata似乎没有提供这种功能。 最佳答案 我希望有人以前做过,但显然没有,所以这就是我最终的结果。下面的模块(我称之为unicodedata2)扩展了unicodedata并提供了script_cat(chr),它返回一个元组(脚本名称,类别)Unicode字符。示例:#coding=utf8importunicodedata2printunicodedata2.script_cat(u'Ф')#('Cyrillic','L

python获取unicode字符串大小

我有一个二进制文件。此文件包含一个UTF-8字符串。而且,保证这个字符串只是一个单词。在python中,如何获取这个字符串中的字母数?假设我打开了这个文件并读取了字节:bytes=open("1.dat","rb").read()接下来我要做什么来找出UTF-8字符串的长度(以字母为单位,而不是字节)? 最佳答案 unicode_string=bytes.decode("utf-8")printlen(unicode_string) 关于python获取unicode字符串大小,我们在S

python - Json.dump 失败并出现 'must be unicode, not str' TypeError

我有一个json文件,其中恰好有大量中文和日文(以及其他语言)字符。我正在使用io.open将它加载到我的python2.7脚本中,如下所示:withio.open('multiIdName.json',encoding="utf-8")asjson_data:cards=json.load(json_data)我在json中添加了一个新属性,一切都很好。然后我尝试将其写回另一个文件:withio.open("testJson.json",'w',encoding="utf-8")asoutfile:json.dump(cards,outfile,ensure_ascii=False)

python - 将 unicode 转换为 datetime 正确的 strptime 格式

我正在尝试将unicode对象转换为datetime对象。我通读了文档:http://docs.python.org/2/library/time.html#time.strptime试过了datetime.strptime(date_posted,'%Y-%m-%dT%H:%M:%SZ')但我收到错误消息ValueError:timedata'2014-01-15T01:35:30.314Z'doesnotmatchformat'%Y-%m-%dT%H:%M:%SZ'对什么是正确的格式有任何反馈吗?我很感激时间和专业知识。 最佳答案

python - Unicode 字符串等价于 contains

尝试在python中使用包含时出现错误。s=u"someutf8words"k=u"oneutf8word"ifs.contains(k):print"contains"我如何获得相同的结果?普通ASCII字符串示例s="hahaiamgoinghome"k="haha"ifs.contains(k):print"contains"我正在使用python2.7.x 最佳答案 ascii和utf8字符串也一样:ifkins:print"contains"在ascii或uft8字符串上都没有contains():>>>"strrting

python - 是否有用于 Unicode 空白的 Python 常量?

string模块包含一个whitespace属性,该属性是一个字符串,由所有被视为空白的ASCII字符组成。是否有相应的常量也包含Unicode空格,例如no-breakspace(U+00A0)?我们可以从问题“strip()andstrip(string.whitespace)givedifferentresults”中看到,至少strip知道额外的Unicode空白字符。此问题被识别为与InPython,howtolistallcharactersmatchedbyPOSIXextendedregex[:space:]?重复,但该问题的答案确定了搜索空格字符以生成您自己的列表的方