草庐IT

character-encoding

全部标签

ruby - 正则表达式 : Any characters except sequence

[^abc]Anysinglecharacterexcept:a,b,orc但是我如何为除序列abc之外的任何字符制作正则表达式所以,类似的东西"Helloabcawesomeworld".scan/[^(abc)]+/将返回“Hello”和“awesomeworld”。PS:而且不是分割字符串 最佳答案 这叫做lookaround,在您的情况下,您需要使用负前瞻。我不确定Ruby中的确切语法,但(?!abc)中的某些内容可能会起作用。请注意,lookaround不会消耗任何输入,因此您需要在其后跟任何您想要匹配的模式。也许(?:(

ruby-on-rails - 将字符串 "2½"(两个半)转换为 2.5

现在我正在构建一个从电子表格导入数据的小应用程序,由于原始条目的性质,有一个正在读取的字符串具有8½、2½等值。例如,我使用简单函数的目标是将2½转换为float2.5。我已经尝试过.to_f方法,但它给我留下了一个奇怪的值2.02½。如有任何见解或建议,我们将不胜感激! 最佳答案 Unicode只支持smallnumberofvulgarfractions所以一个简单的查找表就可以解决问题:#Youmightwanttodoublecheckthismappingvulgar_to_float={"\u00BC"=>1.0/4.0

ruby - 为什么 Ruby/[[ :punct:]]/miss some punctuation characters?

ruby/[[:punct:]]/应该匹配所有“标点字符”。根据Wikipedia,这意味着/[\]\[!"#$%&'()*+,./:;?@\^_`{|}~-]/根据POSIX标准。匹配:-[]\;',./!@#%&*()_{}::"?.但是,它不匹配:=`~$^+|(至少在ruby​​1.9.3p194中是这样)。什么给了? 最佳答案 标点字符类由语言环境定义。公开组LC_TYPEdefinitionforpunct说:Definecharacterstobeclassifiedaspunctuationcharacters.In

ruby-on-rails - Ruby 1.8.7(或 Rails 2.x)中的 String.force_encoding()

是否有在Ruby1.8.7(或Rails2.x)中使用String.force_encoding()的解决方案,以便它像在Ruby1.9中一样工作?我读了一些关于requireactive_support的内容,但这不起作用$>gem列表--本地|grep'rails\|activesupport'activesupport(3.0.3,2.3.8,2.3.5)rails(2.3.8,2.3.5)$>ruby-vruby1.8.7(2010-08-16patchlevel302)[i686-darwin10.4.0]$>rails-vRails2.3.8IRB:>require"rub

ruby 1.9 : Regular Expressions with unknown input encoding

在输入编码未知的Ruby1.9中,是否有一种公认的方法来处理正则表达式?假设我的输入恰好是UTF-16编码的:x="foobarbaz"y=x.encode('UTF-16LE')re=/(.*)/x.match(re)=>#bar"1:"bar">y.match(re)Encoding::CompatibilityError:incompatibleencodingregexpmatch(US-ASCIIregexpwithUTF-16LEstring)我目前的方法是在内部使用UTF-8并在必要时重新编码(副本)输入:ify.methods.include?(:encode)#Rub

ruby - Ruby 中的 URI.escape 和 URI.encode 有什么区别?

我试图找出URI.escape和URI.encode之间的区别ruby。两者都没有按照我的意愿进行,即对URL进行完全编码。例如,我希望http://my.web.com为http%3A%2F%2Fmy%2Eweb%2Ecom 最佳答案 没有区别。在Ruby1.9.3中encodeissimplyanaliasforescape.[编辑]请注意,这些方法允许对字符的“不安全”描述符进行编码:URI.encode('http://my.web.com',/\W/)#=>"http%3A%2F%2Fmy%2Eweb%2Ecom"谢谢@m

使用 Base64.encode 时的 Ruby 字符编码

查看Ruby的Base64.encode的源代码,我无法确定字符串转换为哪种字符编码,如果有的话,在Base64中对该数据进行编码之前。以Base64编码的Utf-8字符串与以Base64编码的Utf-16字符串有很大不同。Ruby是否对此操作做出任何promise? 最佳答案 在base64中编码和解码utf-8字符串的示例:text="intérnalionálização"=>"intérnalionálização"text.encoding=>#encoded=Base64.encode64(text)=>"aW50w6l

ruby - 如何在 Ruby 中删除 4 字节的 utf-8 字符?

由于MySQL的utf8不支持4字节字符,我正在寻找一种方法来检测和消除Ruby字符串中的任何4字节utf8字符。我知道我可以更新我的表以使用utf8m4,但由于一些不可能或所需的解决方案的原因。简单地将字符串编码为ASCII会删除这些字符,但也会删除所有其他非ASCII字符,这并不好。 最佳答案 以下似乎适用于Ruby1.9.3:input.each_char.select{|c|c.bytes.count例如:input="hello\xF0\xA9\xB6\x98world"#includesU+29D98input.each

ruby - 如何在 Ruby 中检测字符串中的某些 Unicode 字符?

给定一个Ruby1.8.7中的字符串(没有使用\p{}支持Unicode属性的很棒的Oniguruma正则表达式引擎),我希望能够确定该字符串是否包含一个或多个中文、日文或韩文字符;即classStringdefcontains_cjk?...endend>>'日本語'.contains_cjk?=>true>>'광고프로그램'.contains_cjk?=>true>>'艾弗森将退出篮坛'.contains_cjk?=>true>>'Watashihabakanagaijindesu.'.contains_cjk?=>false我怀疑这会归结为查看字符串中的任何字符是否在Unihan

ruby-on-rails - 我可以在 Ruby 1.9 上设置默认字符串编码吗?

这听起来可能微不足道,但它让我抓狂。自上周五在Ruby1.9上发布应用程序到生产环境以来,我一直遇到许多与字符编码相关的小异常。几乎所有内容都是以下方面的一些变体:Encoding::CompatibilityError:incompatiblecharacterencodings:ASCII-8BITandUTF-8我们有一个国际用户群,所以很多名字都包含元音变音等。如果我修复模板以在很多地方使用force_encoding,它会在flash消息帮助器中弹出。等等。目前看来我已经确定了所有我知道的,方法是在一个地方修补ActiveSupport的字符串连接,然后在顶部设置#encod