我正在使用最近添加了UnicodeBOMheader(U+FEFF)的数据提要,现在我的rake任务被它搞砸了。我可以使用file.gets[3..-1]跳过前3个字节,但是是否有更优雅的方式来读取Ruby中的文件,它可以正确处理这个问题,无论BOM是有没有? 最佳答案 在ruby1.9.2中,您可以使用模式r:bom|utf-8text_without_bom=nil#definethevariableoutsidetheblocktokeepthedataFile.open('file.txt',"r:bom|utf-8")
我正在尝试解析从Excel电子表格生成的CSV文件。这是我的代码require'csv'file=File.open("input_file")csv=CSV.parse(file)但是我得到这个错误ArgumentError:invalidbytesequenceinUTF-8我认为错误是因为Excel将文件编码为ISO8859-1(Latin-1)而不是UTF-8谁能帮我解决这个问题提前致谢。 最佳答案 您需要告诉Ruby该文件在ISO-8859-1中。将您的文件打开行更改为:file=File.open("input_file
我一直在阅读所有与UTF-8相关的问题和博客文章,并且在test.rb文件中有以下示例:#encoding:UTF-8File.open("test.txt","w")do|f|f.write"test©foo"endFile.open("test.txt","r")do|f|putsf.readend这非常有效。是在文件中正确生成©符号,并将©读回给我并将其打印在屏幕上。但是当我在我的实际项目中使用相同的代码时,我将其写入文件而不是©符号:\u00A9FWIW:我在针对我的代码运行rspec(v1.2.9)测试时得到了这个结果。规范生成一个带有©符号的文件,然后读回该文件以检查内容。
我正在编写一个使用Hpricot的爬虫。它从某个网页下载字符串列表,然后我尝试将其写入文件。编码有问题:"\xC3"fromASCII-8BITtoUTF-8我有在网页上呈现并以这种方式打印的项目:Développementstr.encoding返回UTF-8,因此force_encoding('UTF-8')没有帮助。我如何将其转换为可读的UTF-8? 最佳答案 您的字符串似乎被错误地编码了:"Développement".encode("iso-8859-1").force_encoding("utf-8")#=>"Dév
我有一些由中文机器人触发的错误:http://www.easou.com/search/spider.html当它滚动我的网站时。我的应用程序版本都是Ruby1.9.3和Rails3.2.X这里是堆栈跟踪:AnArgumentErroroccurredinlistings#show:invalidbytesequenceinUTF-8rack(1.4.5)lib/rack/utils.rb:104:in`normalize_params'-------------------------------Request:-------------------------------*URL:
我正在使用ruby1.9.2我正在尝试解析包含一些法语单词(例如spécifié)的CSV文件,并将内容放入MySQL数据库中。当我从CSV文件中读取行时,file_contents=CSV.read("csvfile.csv",col_sep:"$")返回的元素是ASCII-8BIT编码的字符串(spécifié变为sp\xE9cifi\xE9),然后像“spécifié”这样的字符串没有正确保存到我的MySQL数据库中。YehudaKatz表示ASCII-8BIT实际上是“二进制”数据,这意味着CSV不知道如何读取适当的编码。所以,如果我尝试让CSV强制编码如下:file_cont
因此matz决定在ruby1.9.1中将upcase和downcase限制为/[A-Z]/i。ActiveSupport::Multibyte长期以来在ruby1.8.x中通过String#mb_chars进行了很好的i18n大小写调整。但是在ruby1.9.1下试了一下,好像不行。这是我编写的一个简单的测试脚本,以及我得到的输出:$cattest.rb#encoding:UTF-8puts("@#{RUBY_VERSION}"+(__ENCODING__rescue$KCODE).to_s)sd,su="Iñtërnâtiônàlizætiøn","IÑTËRNÂTIÔNÀL
我们允许用户通过csv导入数据(使用ruby1.9.2,因此它是更快的csv)。作为用户数据,当然,它可能没有得到适当的清理。当我们尝试在/index方法中显示数据时,我们有时会收到错误“UTF-8中的无效字节序列”,指向我们显示字段widget.name之一的erb当我们进行导入时,我们希望强制传入的数据有效...是否有一个ruby运算符可以将字符串映射到有效的utf8字符串,例如,类似goodstring=badstring.no_more_invalid_bytes“坏”数据的一个示例是char,它看起来像连字符,但不是常规的ascii连字符。我们更愿意将非utf-8字符
我使用Ruby1.9.2和Rails3.0.5我有以下错误:incompatiblecharacterencodings:ASCII-8BITandUTF-8我认为这与数据库无关。错误发生在View中的这一行(只是一个divhaml调用):#content全栈:ActionView::Template::Error(incompatiblecharacterencodings:ASCII-8BITandUTF-8):21:-flash.eachdo|name,msg|22:=content_tag:div,msg,:id=>"flash_#{name}"23:%div.clear24:
我有一个ActiveRecord模型,Foo,它有一个name字段。我希望用户能够按名称搜索,但我希望搜索忽略大小写和任何重音。因此,我还存储了一个用于搜索的canonical_name字段:classFoovalidates_presence_of:namebefore_validate:set_canonical_nameprivatedefset_canonical_nameself.canonical_name||=canonicalize(self.name)ifself.nameenddefcanonicalize(x)x.downcase.#somethinghereen