草庐IT

支持 UTF-8 的 C++ 解析库

全部标签

ruby - 在 Heroku 中将 UTF-8 设置为默认字符串编码

我需要在Heroku中将默认的ruby​​字符串编码更改为UTF-8。由于某种原因,它是US-ASCII。$herokuconsoleRubyconsoleformyapp.heroku.com>>"a".encoding=>#但是,如果我在本地运行irb,我会得到不同的结果:$irbruby-1.9.2-p136:001>"a".encoding=>#两者都在ruby​​1.9.2上运行。我也试过设置这个,但没用:Encoding.default_internal=Encoding.default_external="UTF-8"想法?谢谢,菲利普 最佳答

Ruby CSV 解析带有转义引号的字符串

我的CSV文件中有一行包含一些转义引号:173,"Yukihiro\"TheRubyGuy\"Matsumoto","Japan"当我尝试使用RubyCSV解析器解析它时:require'csv'CSV.foreach('my.csv',headers:true,header_converters::symbol)do|row|putsrowend我收到这个错误:.../1.9.3-p327/lib/ruby/1.9.1/csv.rb:1914:in`block(2levels)inshift':Missingorstrayquoteinline122(CSV::MalformedCS

ruby - 如何解析 URL 并提取所需的子字符串

假设我有这样一个字符串:"http://something.example.com/directory/"我想做的是解析这个字符串,并从字符串中提取"something"。第一步,显然要检查以确保字符串包含"http://"-否则,它应该忽略该字符串。但是,我如何才能提取该字符串中的"something"?假设这将要评估的所有字符串都具有相似的结构(即我正在尝试提取URL的子域-如果正在检查的字符串确实是一个有效的URL-其中有效以"http://").谢谢。附言我知道如何检查第一部分,即我可以简单地在"http://"处拆分字符串,但这并不能解决全部问题,因为这会产生"http://

ruby-on-rails - 在带有 HTTPParty 的 Controller 中解析 JSON

在我的Controller中,我有以下代码...response=HTTParty.get('https://graph.facebook.com/zuck')logger.debug(response.body.id)我收到一个NoMethodError/undefined方法`id'如果我这样做...logger.debug(response.body)它按预期输出...{"id":"4","name":"MarkZuckerberg","first_name":"Mark","last_name":"Zuckerberg","link":"http:\/\/www.faceboo

ruby-on-rails - Rails 如何解析文本/事件流?

我有一个APIurl,它是内容类型为数据流的:text/event-stream。怎么可能收听流?喜欢订阅每个事件来打印数据?我尝试使用ruby​​库em-eventsource我的test.rb文件:require"em-eventsource"EM.rundosource=EventMachine::EventSource.new("my_api_url_goes_here")source.messagedo|message|puts"newmessage#{message}"endsource.startend当我访问我的apiurl时,我可以看到每秒更新的数据。但是当我在终端中

ruby - 如何在 Ruby 中删除 4 字节的 utf-8 字符?

由于MySQL的utf8不支持4字节字符,我正在寻找一种方法来检测和消除Ruby字符串中的任何4字节utf8字符。我知道我可以更新我的表以使用utf8m4,但由于一些不可能或所需的解决方案的原因。简单地将字符串编码为ASCII会删除这些字符,但也会删除所有其他非ASCII字符,这并不好。 最佳答案 以下似乎适用于Ruby1.9.3:input.each_char.select{|c|c.bytes.count例如:input="hello\xF0\xA9\xB6\x98world"#includesU+29D98input.each

ruby - 解析 HTTParty 响应

我正在使用HTTParty提取Facebook用户的图书列表,但我在解析响应时遇到问题:Facebook以这种方式返回数据:{"data":[{"name":"Title","category":"Book","id":"21192118877902","created_time":"2011-11-11T20:50:47+0000"},{"name":"Title2","category":"Book","id":"1886126860176","created_time":"2011-11-05T02:35:56+0000"},然后HTTParty将其解析为ruby​​对象。我试过

ruby-on-rails - will_paginate JSON 支持?

我想知道是否有人可以告诉我will_paginate是否可以开箱即用地支持JSON,或者是否必须对其进行破解?我想将页面数据添加到JSON响应中,而will_paginate管理分页。 最佳答案 内容如下:@posts=Post.paginate:page=>params[:page]respond_todo|format|format.json{render:json=>{:current_page=>@posts.current_page,:per_page=>@posts.per_page,:total_entries=>@p

ruby - UTF-8 中的无效字节序列 (ArgumentError)

我正在尝试运行Ruby脚本,但总是在这一行出现错误:file_content.gsub(/dr/i,'med')我试图用“med”替换“dr”的地方。错误是:program.rb:4:in`gsub':invalidbytesequenceinUTF-8(ArgumentError)这是为什么,我该如何解决这个问题?我正在使用Ruby2.2.1p85的MACOSXYosemite机器上工作。 最佳答案 可能你的字符串不是UTF-8格式,所以使用if!file_content.valid_encoding?s=file_content

ruby-on-rails - 如何全局忽略 UTF-8 字符串中的无效字节序列?

我有一个Rails应用程序从Rails版本1开始迁移,我想忽略它上面的所有无效字节序列,以保持向后兼容性。我不知道输入编码。例子:>"-Men\xFC-".split("n")ArgumentError:invalidbytesequenceinUTF-8from(irb):4:in`split'from(irb):4from/home/fotanus/.rvm/rubies/ruby-2.0.0-rc2/bin/irb:16:in`'我可以在一行中解决这个问题,例如:>"-Men\xFC-".unpack("C*").pack("U*").split("n")=>["-Me","ü-