草庐IT

java - 使用外部 DTD 中的实体将大型 XML 从 ISO-8859-1 转换为 UTF-8

全部标签

ruby - 如何在 Roo (Rails) : invalid byte sequence in UTF-8 中编码 csv 文件

我正在尝试上传一个csv文件,但收到UTF-8中的无效字节序列错误。我正在使用“roo”gem。我的代码是这样的:defupload_results_csvfilespreadsheet=MyFileUtil.open_file(file)header=spreadsheet.row(1)#THISLINERAISESTHEERROR(2..spreadsheet.last_row).eachdo|i|row=Hash[[header,spreadsheet.row(i)].transpose]......endclassMyFileUtildefself.open_file(file

ruby - 使用 ruby​​ 流式传输和解压缩大型 csv 文件

我遇到问题,我需要下载、解压缩,然后逐行处理一个非常大的CSV文件。我认为让您了解文件有多大很有用:big_file.zip~700mbbig_file.csv~23gb这是我希望发生的一些事情:解压缩前不必下载整个文件在解析csv行之前不必解压缩整个文件在执行所有这些操作时不要占用太多内存/磁盘我不知道这是否可能。这是我的想法:require'open-uri'require'rubyzip'require'csv'open('http://foo.bar/big_file.zip')do|zipped|Zip::InputStream.open(zipped)do|unzipped

ruby-on-rails - 如何处理 UTF-8 电子邮件 header (如主题 :) using Ruby?

我是一个电子邮件n00b,但我正在开发一个发送带有Unicode字符的HTML电子邮件的应用程序(正如我friend所说的“享受编码hell”)。Subject:header来自用户输入,因此可能包含Unicode字符。一些邮件客户端(如GMail和Outlook2007)对此没有问题,但从我的阅读来看,执行此操作的正确方法似乎是使用MIMEEncoded-Wordencoding对于标题。我找不到Ruby库来执行此操作。有吗?此外,是否有要添加的header告诉邮件客户端在显示消息时使用UTF-8?我们要发送多部分电子邮件,所以我们的Content-Type是multipart/mi

ruby - 如何使用 XPath 和 Nokogiri 获取 XML 节点的内容

我有这样的代码:@doc=Nokogiri::HTML(open(url)@doc.xpath(query).eachdo|html|putshtml#howgetcontentofanodeend我如何获取节点的内容而不是像这样: 最佳答案 这是READMEfile中的概要示例为Nokogiri展示了一种使用CSS、XPath或混合的方法:require'nokogiri'require'open-uri'#GetaNokogiri::HTML:Documentforthepagewe’reinterestedin...doc=N

Ruby 将字符串编码从 ISO-8859-1 转换为 UTF-8 不起作用

我正在尝试将字符串从ISO-8859-1编码转换为UTF-8,但似乎无法正常工作。这是我在irb中所做的示例。irb(main):050:0>string='Norrlandsvägen'=>"Norrlandsvägen"irb(main):051:0>string.force_encoding('iso-8859-1')=>"Norrlandsv\xC3\xA4gen"irb(main):052:0>string=string.encode('utf-8')=>"Norrlandsvägen"我不确定为什么iso-8859-1中的Norrlandsvägen会被转换为utf-8中

ruby-on-rails - 如何检查字符是否为utf-8

如何通过ruby|ror查看字符集是否为utf-8编码? 最佳答案 检查UTF-8有效性对于大多数多字节编码,可以通过编程方式检测无效字节序列。由于Ruby默认将所有字符串视为UTF-8,您可以检查字符串是否以有效的UTF-8格式给出:#encoding:UTF-8#-------------------------------------------str="Partlyvalid\xE4UTF-8encoding:äöüß"str.valid_encoding?#=>falsestr.scrub('').valid_encodi

ruby-on-rails - Heroku 上的不兼容编码正则表达式匹配(ASCII-8BIT 正则表达式与 UTF-8 字符串)

我有一个Rails应用程序,我在其中使用基于正则表达式的规则对事务进行分类。在我的seeds.rb中,我创建了一些类别和规则,然后从CSV文件(也是utf8编码)导入交易并允许对它们进行分类。这个过程在我的开发机器上运行良好,但是当我在Heroku上运行它时,我得到:incompatibleencodingregexpmatch(ASCII-8BITregexpwithUTF-8string)我正在运行CedarStack,Rails2.3.15。我放了#encoding:utf-8在我所有源文件的顶部,我在我的应用程序配置中将编码设置为utf-8,所以我不确定还有什么可能导致此问题。

ruby-on-rails - 发现未经许可的参数 : utf8, authenticity_token 仅用于更新方法

我在用户管理Controller中有这样的更新方法defupdate@user.update(user_permitted_params)redirect_toadmin_user_managements_pathend我的强参数设置为defuser_permitted_paramsparams.require(:user).permit(:name,:email,:password,:password_confirmation,:address,:zip_code,:phone_number,:role_id)end我遇到了以下问题Unpermittedparameters:utf8

ruby 1.9.2 : irb throws ArgumentError: invalid byte sequence in UTF-8 when entering German Umlaut

我想在我的irb中输入德语变音符号,但出现奇怪的错误。我可以毫无问题地输入äöü的任何字符,但是每个ÄÖÜß都会导致以下错误:$irbruby-1.9.2-p136:001>?#hereIenteredÜbutitdisplaysonly?/Users/lorenz/.rvm/rubies/ruby-1.9.2-p136/lib/ruby/1.9.1/irb/ruby-lex.rb:728:in`blockinlex_int2':invalidbytesequenceinUTF-8(ArgumentError)我已经查看了很多关于Ruby、rvm和UTF-8的SO问题,但都没有帮助。大

ruby - 使用 Ruby 向网络服务器发送 XML 请求

恐怕我没有太多通过网络服务器发布文档(例如XML)的经验,所以如果我对HTTP的理解不足,我深表歉意。我在127.0.0.1上的ruby​​应用程序中设置了一个基本的MongrelWeb服务器端口2000.(服务器)。我在同一台计算机上运行一个单独的Ruby应用程序。(客户)。我需要客户端向服务器发送XML文档。我曾尝试使用Net::HTTP来执行此操作,但我找不到一个明确的示例来告诉我应该做什么。我试过了,但遇到了错误。我已将请求分解,使其尽可能基本:http=Net::HTTP.new("127.0.0.1",2000)http.post('file','query=foo')#x