Unicode_草庐IT

ruby-on-rails - unicode 字符串的长度

在我的Rails(2.3，Ruby1.8.7)应用程序中，我需要将字符串截断到一定长度。该字符串是unicode，在控制台中运行测试时，例如'א'.length，我意识到返回了双倍长度。我想要一个与编码无关的长度，以便对unicode字符串或latin1编码字符串进行相同的截断。我已经了解了Ruby的大部分unicode资料，但仍然有些一头雾水。应该如何解决这个问题？最佳答案 Rails有一个返回多字节字符的mb_chars方法。试试unicode_string.mb_chars.slice(0,50)

ruby - 在 Ruby 中将转义的 unicode (\u008E) 转换为重音字符 (Ž)？

我遇到了一个非常困难的时期:#containedwithin:"MA\u008EEIKIAI"#shouldbe"MAŽEIKIAI"#natureofstring$pstring3"MA\u008EEIKIAI"$putsstring3MAEIKIAI$string3.inspect"\"MA\\u008EEIKIAI\""$string3.bytes#关于从哪里开始的任何想法？注意:这不是我的previousquestion的副本. 最佳答案 \u008E表示代码点为8e(十六进制)的unicode字符出现在字符串中的那个位置。

为重 unicode code string section ruby encoding

ruby - 从 Ruby 中的国家代码获取表情符号标志

我想将“US”之类的国家代码转换为表情符号标志，即将“US”字符串转换为Ruby中适当的Unicode。Here'sanequivalentexampleforJava 最佳答案使用tr将字母字符转换为其区域指示符号:'US'.tr('A-Z',"\u{1F1E6}-\u{1F1FF}")#=>"??"当然你也可以直接使用Unicode字符:'US'.tr('A-Z','?-?')#=>"??" 关于ruby-从Ruby中的国家代码获取表情符号标志，我们在StackOverflow上找

ruby section code stackoverflow unicode emoji

ruby - 如何替换 Ruby 1.9 上的 Unicode gem？

不幸的是，Unicode0.1(sudogeminstallunicode)不能在Ruby1.9上运行。我有以下片段:require"rubygems"require"unicode"str="áéíóúç"Unicode.normalize_KD(str).gsub(/[^\x00-\x7F]/n,"")#=>aeiouc我用它来将标题转换为永久链接，而不删除重音字符。有没有办法使用pack或unpack方法转换此类文本？最佳答案更新:更好的选择可能是使用gemunicode_utils这是专门为这些缺失的功能创建的:requ

Unicode ruby code section 34 gem ruby-1.9

ruby-on-rails - Ruby 将 IDN 域从 Punycode 转换为 Unicode

我正在编写一个Rails应用程序，它需要将IDN域名从Punycode转换为它的Unicode等效项。我尝试安装idngem绑定(bind)到GNULibIDN，但它不会编译native代码。显然others与Ruby1.9.x有同样的问题。我也试过纯RubySimpleIDNgem,但我更喜欢本地的东西。最佳答案试试simpleidngem.它适用于Ruby1.8.7和1.9.2。编辑你的Gemfile:gem'simpleidn'然后可以输入如下命令:SimpleIDN.to_unicode("xn--mllerriis-l

ruby-on-rails Punycode section noreferrer noopener ruby ruby-on-rails-3 unicode idn

ruby - 如何在 Ruby 正则表达式中匹配韩文字符？

我使用正则表达式对用户名进行了一些基本验证，例如[\w-_]+，我想添加对韩文字母表的支持，同时仍保持验证不变。我不想让特殊字符，比如{}[]!@#$%^&*()等，我只想把\w除了[a-zA-Z0-9]之外，还有与给定字母表匹配的内容。这意味着像안녕这样的用户名应该是有效的，但不是안녕[]。我需要在Ruby1.9中执行此操作。最佳答案试试这个:[가-힣]+这匹配U+AC00toU+D7A3中的每个字符，这可能足以满足您的兴趣。(我不认为你需要旧的韩文字符和东西) 关于ruby-如何

韩文何在 code section ruby regex unicode ruby-1.9 cjk

Ruby:模糊测试所有 unicode 字符(UTF8/编码/字符串操作)

我无法遍历整个unicode字符范围。我到处找...我正在构建一个模糊器，并希望将所有unicode字符(一次一个)嵌入到一个url中。例如:http://www.example.com?a=\uff1c我知道有一些内置工具，但我需要更多的灵active。如果我能像下面那样做:"\u"+"ff1c"那就太好了。这是我得到的最接近的:char="\u0000"...#withiniterationchar.succ!...但在字符"\u0039"之后，即数字9，我将得到"10"而不是":" 最佳答案您可以使用pack将数字转换为UT

unicode Ruby section code string utf-8 fuzzing

ruby - 如何制作 Ruby 1.8 小写非拉丁字符？

我正在使用Ruby1.8。似乎downcase不会改变非拉丁字符。例如:"Δ".downcase返回“Δ”我知道在Ruby1.9.1及更高版本中，我可以使用UnicodeUtils(fromhere)。我试过了，它工作正常。返回上一个示例的"δ"。是否有适用于1.8Ruby的等效(或任何)解决方案？最佳答案 nash@nash:~$ruby-vruby1.8.7(2011-02-18patchlevel334)[i686-linux]gem安装unicode(https://rubygems.org/gems/unicode)re

ruby code section unicode string function utf-8

Ruby:检查东亚宽度 (Unicode)

使用Ruby，我必须将字符串以柱状格式输出到终端。像这样:|row1|astringhere|etc|row2|anotherstring|etc我可以使用String#ljust和%s处理拉丁UTF8字符。但是当字符是韩文、中文等时就会出现问题。当英文行与包含韩文等的行交错时，列根本不会对齐。如何在此处实现列对齐？有没有办法以等同于固定宽度字体的方式输出亚洲字符？对于要在Vim中显示和编辑的文档怎么样？最佳答案您的问题发生在CJK(中文/日文/韩文)full-widthandwidecharacters(也向下滚动图表)；这些

Unicode Ruby section 韩文 noreferrer vim fonts utf8-decode asianfonts

ruby - 为什么我会看到这两个几乎相同的 Ruby 正则表达式模式的不同结果，为什么一个匹配我认为不应该匹配的内容？

使用Ruby1.9.2，我在IRB中有以下Ruby代码:>r1=/^(?=.*[\d])(?=.*[\W]).{8,20}$/i>r2=/^(?=.*\d)(?=.*\W).{8,20}$/i>a=["password","1password","password1","pass1word","password1"]>a.each{|p|puts"r1:#{r1.match(p)?"+":"-"}\"#{p}\"".ljust(25)+"r2:#{r2.match(p)?"+":"-"}\"#{p}\""}这会产生以下输出:r1:-"password"r2:-"password"r1:

ruby code 34 password regex unicode character-class