character-encoding

ruby - 正则表达式 : Any characters except sequence

[^abc]Anysinglecharacterexcept:a,b,orc但是我如何为除序列abc之外的任何字符制作正则表达式所以，类似的东西"Helloabcawesomeworld".scan/[^(abc)]+/将返回“Hello”和“awesomeworld”。PS:而且不是分割字符串最佳答案这叫做lookaround，在您的情况下，您需要使用负前瞻。我不确定Ruby中的确切语法，但(?!abc)中的某些内容可能会起作用。请注意，lookaround不会消耗任何输入，因此您需要在其后跟任何您想要匹配的模式。也许(?:(

ruby-on-rails - 将字符串 "2½"(两个半)转换为 2.5

现在我正在构建一个从电子表格导入数据的小应用程序，由于原始条目的性质，有一个正在读取的字符串具有8½、2½等值。例如，我使用简单函数的目标是将2½转换为float2.5。我已经尝试过.to_f方法，但它给我留下了一个奇怪的值2.02½。如有任何见解或建议，我们将不胜感激! 最佳答案 Unicode只支持smallnumberofvulgarfractions所以一个简单的查找表就可以解决问题:#Youmightwanttodoublecheckthismappingvulgar_to_float={"\u00BC"=>1.0/4.0

ruby-on-rails amp 34 code section ruby string character-encoding floating-point

ruby - 为什么 Ruby/[[ :punct:]]/miss some punctuation characters?

ruby/[[:punct:]]/应该匹配所有“标点字符”。根据Wikipedia,这意味着/[\]\[!"#$%&'()*+,./:;?@\^_`{|}~-]/根据POSIX标准。匹配:-[]\;',./!@#%&*()_{}::"?.但是，它不匹配:=`~$^+|(至少在ruby1.9.3p194中是这样)。什么给了？最佳答案标点字符类由语言环境定义。公开组LC_TYPEdefinitionforpunct说:Definecharacterstobeclassifiedaspunctuationcharacters.In

punctuation characters section code ruby regex posix

ruby-on-rails - Ruby 1.8.7(或 Rails 2.x)中的 String.force_encoding()

是否有在Ruby1.8.7(或Rails2.x)中使用String.force_encoding()的解决方案，以便它像在Ruby1.9中一样工作？我读了一些关于requireactive_support的内容，但这不起作用$>gem列表--本地|grep'rails\|activesupport'activesupport(3.0.3,2.3.8,2.3.5)rails(2.3.8,2.3.5)$>ruby-vruby1.8.7(2010-08-16patchlevel302)[i686-darwin10.4.0]$>rails-vRails2.3.8IRB:>require"rub

force_encoding ruby-on-rails code section strong ruby encoding gem

ruby 1.9 : Regular Expressions with unknown input encoding

在输入编码未知的Ruby1.9中，是否有一种公认的方法来处理正则表达式？假设我的输入恰好是UTF-16编码的:x="foobarbaz"y=x.encode('UTF-16LE')re=/(.*)/x.match(re)=>#bar"1:"bar">y.match(re)Encoding::CompatibilityError:incompatibleencodingregexpmatch(US-ASCIIregexpwithUTF-16LEstring)我目前的方法是在内部使用UTF-8并在必要时重新编码(副本)输入:ify.methods.include?(:encode)#Rub

Expressions encoding section gt ruby regex character-encoding

ruby - Ruby 中的 URI.escape 和 URI.encode 有什么区别？

我试图找出URI.escape和URI.encode之间的区别ruby。两者都没有按照我的意愿进行，即对URL进行完全编码。例如，我希望http://my.web.com为http%3A%2F%2Fmy%2Eweb%2Ecom 最佳答案没有区别。在Ruby1.9.3中encodeissimplyanaliasforescape.[编辑]请注意，这些方法允许对字符的“不安全”描述符进行编码:URI.encode('http://my.web.com',/\W/)#=>"http%3A%2F%2Fmy%2Eweb%2Ecom"谢谢@m

URI escape code section strong ruby

使用 Base64.encode 时的 Ruby 字符编码

查看Ruby的Base64.encode的源代码，我无法确定字符串转换为哪种字符编码，如果有的话，在Base64中对该数据进行编码之前。以Base64编码的Utf-8字符串与以Base64编码的Utf-16字符串有很大不同。Ruby是否对此操作做出任何promise？最佳答案在base64中编码和解码utf-8字符串的示例:text="intérnalionálização"=>"intérnalionálização"text.encoding=>#encoded=Base64.encode64(text)=>"aW50w6l

encode Base section encoding decoded ruby character-encoding base64

ruby - 如何在 Ruby 中删除 4 字节的 utf-8 字符？

由于MySQL的utf8不支持4字节字符，我正在寻找一种方法来检测和消除Ruby字符串中的任何4字节utf8字符。我知道我可以更新我的表以使用utf8m4，但由于一些不可能或所需的解决方案的原因。简单地将字符串编码为ASCII会删除这些字符，但也会删除所有其他非ASCII字符，这并不好。最佳答案以下似乎适用于Ruby1.9.3:input.each_char.select{|c|c.bytes.count例如:input="hello\xF0\xA9\xB6\x98world"#includesU+29D98input.each

utf-8 何在 section code stackoverflow ruby character-encoding utf8mb4

ruby - 如何在 Ruby 中检测字符串中的某些 Unicode 字符？

给定一个Ruby1.8.7中的字符串(没有使用\p{}支持Unicode属性的很棒的Oniguruma正则表达式引擎)，我希望能够确定该字符串是否包含一个或多个中文、日文或韩文字符；即classStringdefcontains_cjk?...endend>>'日本語'.contains_cjk?=>true>>'광고프로그램'.contains_cjk?=>true>>'艾弗森将退出篮坛'.contains_cjk?=>true>>'Watashihabakanagaijindesu.'.contains_cjk?=>false我怀疑这会归结为查看字符串中的任何字符是否在Unihan

何在 Unicode contains_cjk section contains ruby encoding character-encoding cjk

ruby-on-rails - 我可以在 Ruby 1.9 上设置默认字符串编码吗？

这听起来可能微不足道，但它让我抓狂。自上周五在Ruby1.9上发布应用程序到生产环境以来，我一直遇到许多与字符编码相关的小异常。几乎所有内容都是以下方面的一些变体:Encoding::CompatibilityError:incompatiblecharacterencodings:ASCII-8BITandUTF-8我们有一个国际用户群，所以很多名字都包含元音变音等。如果我修复模板以在很多地方使用force_encoding，它会在flash消息帮助器中弹出。等等。目前看来我已经确定了所有我知道的，方法是在一个地方修补ActiveSupport的字符串连接，然后在顶部设置#encod

ruby-on-rails rails strong code encodings ruby utf-8 character-encoding ruby-1.9

1 234 5 6