草庐IT

ruby - 使用 Ruby 1.9.3 和邮件 gem 进行字符编码

我正在尝试使用Rubymailgem解析电子邮件字符串,而且我在字符编码方面遇到了麻烦。获取以下电子邮件:MIME-Version:1.0Sender:foobar@example.comReceived:by10.142.239.17withHTTP;Thu,14Jun201206:00:18-0700(PDT)Date:Thu,14Jun201209:00:18-0400Delivered-To:foobar@gmail.comX-Google-Sender-Auth:MxfFrMybNjBoBt4O4GwAn9cMskoMessage-ID:Subject:Re:[LoremIp

ruby-on-rails - rails : encoding woes with serialized hashes despite UTF8

我刚刚从ruby​​1.9.2更新到ruby​​1.9.3p0(2011-10-30修订版33570)。我的Rails应用程序使用postgresql作为其数据库后端。系统区域设置为UTF8,数据库编码也是如此。Rails应用程序的默认编码也是UTF8。我有中国用户输入汉字和英文字符。字符串存储为UTF8编码字符串。rails版本:3.0.9自更新以来,数据库中的一些现有中文字符串不再正确显示。这不会影响所有字符串,只会影响那些属于序列化哈希的字符串。存储为普通字符串的所有其他字符串看起来仍然是正确的。示例:这是一个序列化的散列,在数据库中存储为UTF8字符串:broken="---!

ruby - 如何将 Net::HTTP 响应转换为 Ruby 1.9.1 中的特定编码?

我有一个Sinatra应用程序(http://analyzethis.espace-technologies.com)执行以下操作检索HTML页面(通过net/http)从response.body创建一个Nokogiri文档提取一些信息并在响应中发回。响应应采用UTF-8编码所以我在尝试阅读使用windows-1256编码的网站(如www.filfan.com或www.masrawy.com)时遇到了问题。问题是编码转换的结果不正确,虽然没有抛出错误。net/httpresponse.body.encoding给出了ASCII-8BIT,无法转换为UTF-8如果我执行Nokogiri

ruby-on-rails - 使用带有无效字符的 Net::FTP gettextfile(ASCII-8BIT 与 UTF-8)

我有一个通过FTP从大型机获取平面文件的进程。这通常工作正常,但有时文件会包含一些重音字符。如果我尝试获取包含口音的文件,整个过程会失败并出现以下错误:Encoding::UndefinedConversionError:"\x88"fromASCII-8BITtoUTF-8那是使用Net::FTP的gettextfile方法。许多人建议简单地切换到getbinaryfile-这样做将允许我下载文件,但生成的文件是我无法再解析的东西(说它是UTF-8,但内容使没有意义)。有没有什么方法可以简单地获取文件并将其保存为ASCII,而无需让Rails自动将输出转换为UTF-8?这是我的代码:

ruby-on-rails - Ruby 2.2:PG::CharacterNotInRepertoire:错误:编码 "UTF8"的无效字节序列

我正在升级Rails4.1应用程序以使用Ruby2.2。在升级期间,事实证明该应用程序使用了旧版本的pggem(0.12),并且gem没有使用Ruby2.2安装。所以我尝试使用更新版本的pggem(0.17.1)。现在在系统中创建新用户时有时会出现以下错误:PG::CharacterNotInRepertoire:ERROR:invalidbytesequenceforencoding"UTF8"Ruby2.2和Postgres是否存在任何已知问题?看起来应用程序配置为使用unicode:config.encoding="utf-8"在application.rb中设置,encodin

ruby-on-rails - 编码::UndefinedConversionError: "\xE4"从 ASCII-8BIT 到 UTF-8

我试图获取这个CSV-File使用Net::HTTP。File.open(file,"w:UTF-8")do|f|content=Net::HTTP.get_response(URI.parse(url)).bodyf.write(content)end再次读取我的本地csv文件后,我得到了一些奇怪的输出。Nationalit\xE4t;Alter0-5我尝试将其编码为UTF-8,但出现错误Encoding::UndefinedConversionError:"\xE4"fromASCII-8BITtoUTF-8rchardetgem告诉我内容是ISO-8859-2。但转换为UTF-8

ruby - 检测编码

我从网络上获取了一些字符串数据,我怀疑它并不总是像它所说的那样。我不知道问题出在哪里,我也不再关心了。从这个项目的第一天起,我就一直在与Ruby字符串编码作斗争。我真的想要某种方式来表达:“这是一个字符串。它是什么?”,然后使用该数据将其转换为UTF-8,这样它就不会爆炸gsub()2,000行在我的应用程序的深处。我已经查看了rchardet,但即使它现在应该适用于1.9,它也会在给定任何多字节输入的情况下崩溃......这没有帮助。 最佳答案 您无法真正检测到编码。你只能假设它。对于大多数西方语言应用程序,以下构造将工作。传统的

Ruby on Rails 上传文件问题 奇数 utf8 转换错误

我正在尝试上传文件,但出现以下错误:"\xFF"fromASCII-8BITtoUTF-8我非常关注Rails指南的工作。这是我正在使用的代码。file=params[:uploaded_file]File.open(Rails.root.join('public','images',file.original_filename),'w')do|f|f.write(file.read)end我不明白为什么它不起作用。我做错了什么?更新--这是应用程序跟踪app/controllers/shows_controller.rb:16:in`write'app/controllers/sho

ruby-on-rails - 编码未定义的转换错误 - Ruby on Rails,写入错误

所以我试图从网站下载一个zip文件并将该数据放入一个表中。下载之前一直在工作,但突然之间,它不再是了。我得到一个“‘write’:“\xB6”fromASCII-8BITtoUTF-8(Encoding::UndefinedConversionError)”的问题。很奇怪,自从我上次运行脚本以来没有任何变化。这是有问题的代码部分。我正在使用一个gem,它允许我在zip文件中解析DBF文件。代码如下:`write':"\xB6"fromASCII-8BITtoUTF-8(Encoding::UndefinedConversionError)感谢帮助更新:显然,我在rails内运行。我在r

ruby-on-rails - 如何在 ruby​​ 中使用 utf8 的正则表达式

在RoR中,如何使用utf8代码验证中文或日文单词用于发布表单。在GBK编码中,它使用[\u4e00-\u9fa5]+来验证中文单词。在Php中,它使用/^[\x{4e00}-\x{9fa5}]+$/u用于utf-8页面。 最佳答案 Ruby1.8对UTF-8字符串的支持很差。您需要在正则表达式中单独编写字节,而不是完整的代码:>>"acentuação".scan(/\xC3\xA7/)=>["ç"]要匹配您指定的范围,表达式会变得有点复杂:/([\x4E-\x9E][\x00-\xFF])|(\x9F[\x00-\xA5])/#