草庐IT

commons-codec

全部标签

python - 'utf- 8' codec can' t 解码字节 0x89

我想读取一个csv文件并处理一些列,但我总是遇到问题。遇到以下错误:Traceback(mostrecentcalllast):File"C:\Users\Sven\Desktop\Python\readcsv.py",line5,inforrowinreader:File"C:\Python34\lib\codecs.py",line313,indecode(result,consumed)=self._buffer_decode(data,self.errors,final)UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0x89inpo

python - (找不到)python 可数属性 most_common()

这里是新手。我正在浏览nltk书和另一本Python介绍书。我在nltk书中早些时候遇到过most_common(),虽然当时我无法让它工作也找不到解决方案,但我创建了一个小函数来完成那个特定练习并继续前进。现在我又需要它了,但我认为我不会那么容易地绕过它(练习是关于特定文本中最常见的单词长度),而且我知道我会在后面的例子中再次找到它,我希望能够遵循,因为正如我所说,我是新手。理论上,我应该能够做到这一点:fdist=FreqDist(len(w)forwintext1)fdist.most_common()[(3,50223),(1,47933),(4,42345),(2,38513

python - Unicode解码错误: 'ascii' codec can't decode byte 0xc5

UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc5inposition537:ordinalnotinrange(128),referer:...当我尝试用字符“č”输出我的整个网站时,我总是会遇到这个错误。我正在使用mako模板。怎么办? 最佳答案 发生错误是因为某处代码将您的unicode模板字符串强制转换为python2str;您需要自己将呈现的模板编码为UTF-8字节串:ifisinstance(rendered,unicode):rendered=rendered.enco

Python 3 统一码解码错误 : 'ascii' codec can't decode byte 0xe2 in position 0: ordinal not in range(128)

我正在实现这个notebook在使用Python3.5.3的Windows上,在load_vectors()调用中出现跟随错误。我尝试了不同的解决方案,但都没有奏效。inload_vectors(loc)1defload_vectors(loc):2return(load_array(loc+'.dat'),---->3pickle.load(open(loc+'_words.pkl','rb')),4pickle.load(open(loc+'_idx.pkl','rb')))UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xe2inpo

python - Python 2.7 中的 Open() 和 codecs.open() 行为异常不同

我有一个文本文件,第一行是unicode字符,所有其他行都是ASCII。我尝试将第一行作为一个变量读取,将所有其他行作为另一个变量读取。但是,当我使用以下代码时:#-*-coding:utf-8-*-importcodecsimportosfilename='1.txt'f=codecs.open(filename,'r3',encoding='utf-8')printfnames_f=f.readline().split('')data_f=f.readlines()printlen(names_f)printlen(data_f)f.close()print'Andnowforso

python - Unicode解码错误: 'ascii' codec can't decode

我正在使用file.readline()在Python中读取一个包含罗马尼亚语单词的文件。由于编码,我遇到了很多字符的问题。示例:>>>a="aberație"#type'str'>>>a->'abera\xc8\x9bie'>>>printsys.stdin.encodingUTF-8我试过使用utf-8、cp500等进行encode(),但它不起作用。我找不到我必须使用的正确字符编码?提前致谢。编辑:目的是将文件中的单词存储在字典中,并在打印时获取aberaşie而不是'abera\xc8\x9bie' 最佳答案 你想做什么?这

python - Unicode解码错误: 'utf8' codec can't decode byte "0xc3"

在python2.7中我有这个:#-*-coding:utf-8-*-fromnltk.corpusimportabcwithopen("abc.txt","w")asf:f.write("".join(i.words()))然后我尝试在Python3中阅读此文档:withopen("abc.txt",'r',encoding='utf-8')asf:f.read()只为得到:File"C:\Python32\lib\codecs.py",line300,indecode(result,consumed)=self._buffer_decode(data,self.errors,fin

python - Selenium 崩溃与 selenium.common.exceptions.WebDriverException : Message: newSession

操作系统:Ubuntu16.04.3LTS(GNU/Linux4.4.0-1066-awsx86_64)Selenium版本:Selenium==3.6.0浏览器:MozillaFirefox63.0壁虎驱动版本:geckodriver-v0.19.0-linux64预期行为-创建一个新的firefox浏览器并执行一些步骤-解析网站。实际行为-日志崩溃:-self.driver=webdriver.Firefox()File"/home/ubuntu/env/local/lib/python2.7/site-packages/selenium/webdriver/firefox/web

python - 统一码编码错误 : 'ascii' codec can't encode character u'\xe7' in position 17710: ordinal not in range(128)

我正在尝试从archivedwebcrawl打印一个字符串,但是当我这样做时,我得到了这个错误:printpage['html']UnicodeEncodeError:'ascii'codeccan'tencodecharacteru'\xe7'inposition17710:ordinalnotinrange(128)当我尝试打印unicode(page['html'])时,我得到:printunicode(page['html'],errors='ignore')TypeError:decodingUnicodeisnotsupported知道如何正确编码这个字符串,或者至少让它打

python - 'utf- 8' codec can' t 解码字节 0x80

我正在尝试下载BVLC训练的模型,但我遇到了这个错误UnicodeDecodeError:'utf-8'codeccan'tdecodebyte0x80inposition110:invalidstartbyte我认为这是因为以下功能(completecode)#Closure-dfunctionforcheckingSHA1.defmodel_checks_out(filename=model_filename,sha1=frontmatter['sha1']):withopen(filename,'r')asf:returnhashlib.sha1(f.read()).hexdig