草庐IT

utf8mb_unicode_ci

全部标签

ruby - 从 Ruby 中的字符串中删除非 UTF 字符?

如何从ruby​​字符串中删除非UTF8字符?我有一个字符串,其中包含例如“xC2”。我想从字符串中删除该字符,使其成为有效的UTF8。这个:text.gsub!(/\xC2/,'')返回错误:incompatibleencodingregexpmatch(ASCII-8BITregexpwithUTF-8string)我也在查看text.unpack('U*')和string.pack,但没有得到任何结果。 最佳答案 您可以为此使用编码。text.encode('UTF-8',:invalid=>:replace,:undef=>

ruby - Ruby 支持 unicode 吗?它是如何工作的?

我刚刚开始学习Ruby(最终转向RoR),但我刚刚被告知Ruby不支持unicode。是真的吗?Ruby程序员如何着手支持unicode? 最佳答案 您听到的内容已经过时并且(仅部分)适用于Ruby1.8或更早版本。最新的Ruby稳定版(1.9),支持不少于95种不同的字符编码(刚才在我的系统上统计)。这包括几乎所有已知的Unicode转换格式,包括UTF-8。Ruby的先前稳定版本(1.8)对UTF-8具有部分支持。如果您使用Rails,它会为您处理默认的UTF-8编码。如果您只需要了解UTF-8编码,那么Rails将无论您运行的

Ruby 输出 Unicode 字符

我不是Ruby开发人员,但我使用Capistrano进行PHP部署。我正在尝试清理脚本的输出并尝试添加unicodecheckmark如thisblog中所述.问题是如果我这样做:checkmark="\u2713"putscheckmark它输出“\u2713”而不是✓我用谷歌搜索了一下,但找不到讨论这个问题的任何地方。TLDR:如何放置或打印unicodecheckmarkU-2713?编辑我在我的Mac(OSXLion)上运行Ruby1.8.7,所以不能使用encode方法。我的shell是iTerm2中的Bash。更新[4/8/2019]添加了引用图片以防网站出现故障。

ruby - 如何在 Ruby 中将字符串转换为 UTF8

我正在编写一个使用Hpricot的爬虫。它从某个网页下载字符串列表,然后我尝试将其写入文件。编码有问题:"\xC3"fromASCII-8BITtoUTF-8我有在网页上呈现并以这种方式打印的项目:Développementstr.encoding返回UTF-8,因此force_encoding('UTF-8')没有帮助。我如何将其转换为可读的UTF-8? 最佳答案 您的字符串似乎被错误地编码了:"Développement".encode("iso-8859-1").force_encoding("utf-8")#=>"Dév

ruby-on-rails - Ruby on Rails "invalid byte sequence in UTF-8"由于机器人

我有一些由中文机器人触发的错误:http://www.easou.com/search/spider.html当它滚动我的网站时。我的应用程序版本都是Ruby1.9.3和Rails3.2.X这里是堆栈跟踪:AnArgumentErroroccurredinlistings#show:invalidbytesequenceinUTF-8rack(1.4.5)lib/rack/utils.rb:104:in`normalize_params'-------------------------------Request:-------------------------------*URL:

ruby - 导入csv数据时,如何去掉 "invalid byte sequence in UTF-8"

我们允许用户通过csv导入数据(使用ruby​​1.9.2,因此它是更快的csv)。作为用户数据,当然,它可能没有得到适当的清理。当我们尝试在/index方法中显示数据时,我们有时会收到错误“UTF-8中的无效字节序列”,指向我们显示字段widget.name之一的erb当我们进行导入时,我们希望强制传入的数据有效...是否有一个ruby​​运算符可以将字符串映射到有效的utf8字符串,例如,类似goodstring=badstring.no_more_invalid_bytes“坏”数据的一个示例是char,它看起来像连字符,但不是常规的ascii连字符。我们更愿意将非utf-8字符

ruby-on-rails - PG::错误:错误:新编码(UTF8)不兼容

我已经从源代码安装了postgresql-9.2.4,现在当我执行时在railsapp中:rakedb:create命令我得到:$bin/rakedb:createRAILS_ENV="test"PG::Error:ERROR:newencoding(UTF8)isincompatiblewiththeencodingofthetemplatedatabase(SQL_ASCII)HINT:Usethesameencodingasinthetemplatedatabase,orusetemplate0astemplate.:CREATEDATABASE"verticals_test"E

javascript - 在 unicode 问题上用正则表达式替换/替换所有

有没有办法将replace方法应用于一般的Unicode文本(这里关注阿拉伯语)?在下面的例子中,虽然替换整个单词在英文文本上效果很好,但它无法检测到,因此替换了阿拉伯语单词。我添加了u作为启用unicode解析的标志,但这没有帮助。在下面的阿拉伯语示例中,应替换单词النجوم,而不是والцوم,但这并没有发生。Clicktoreplace...replacefunctionmyFunction(){varstr="الشمسوالقمروالنجوم،ثمالنجوموالنهار";varrep='النجوم';varrepWith='الليل';//varstr="the

javascript - 没有\p{L} 用于 JavaScript 正则表达式?在 JS 正则表达式中使用 Unicode

这个问题在这里已经有了答案:Preg_matchtoregexequivalentexpressiontomatchanyUnicodeletters(2个答案)Matchonlyunicodeletters(3个答案)关闭4年前。我需要添加a-zA-ZáàâäãåçéèêëíìîïñóòôöõúùûüýÿæœÁÀÂÄãÅÇÉÈÊÈÍÌÈÏÑÓÒÔÖÕÚÙÛÜÝŸÆŒ次,但我觉得这非常难看。所以我尝试了\p{L}但它在JavaScript中不起作用。有什么想法吗?myactualregex:[a-zA-ZáàâäãåçéèêëíìîïñóòôöõúùûüýÿæœÁÀÂÄÃÅÇÉÈÊËÍ

javascript - 在 for 循环中生成一个 unicode 字符列表

我试图列出在for循环中使用计数器作为unicode字符的编号。这样做的目的,...可以说我这样做是为了好玩。当然,经验丰富的JavaScript用户能够告诉我这里出了什么问题。要在javascript中使用unicode字符,可以按原样输入,也可以使用转义序列,例如:\u8211。当我尝试将数字部分与转义的u结合起来时,我的问题就出现了。我得到的错误类似于“错误的转义字符”,这意味着i变量中的数字未与\u组合正如我所希望的那样。for(vari=65;i我尝试过的:character="\u{"+i+"}"cha=['\\u'];cha.push(i);cha.join('');..