当我尝试音译西里尔文utf-8字符串时Iconv.iconv('ascii//ignore//translit','utf-8',string).to_s(参见questions/1726404/transliteration-in-ruby)除了那些必须音译的符号,我得到了所有东西。例如:'r-строка'→'r-'和'Gévry'→'Gvry'。怎么了?Ruby1.8.7/Rails2.3.5/WSeven 最佳答案 require'iconv'pIconv.iconv('ascii//translit//ignore','u
ruby中非英文字符的音译最简单的方法是什么。即转换如:翻译“Gévry”#=>"Gevry" 最佳答案 Ruby有一个Iconv其stdlib中的库以与通常的iconv命令非常相似的方式转换编码 关于ruby-ruby音译,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/1726404/
在将GoogleTransliterate与Angular项目集成方面需要一些帮助,下面是使DOM中的所有所需元素都可音译的代码段。functionza(){google.load("elements","1",{packages:"transliteration"});google.setOnLoadCallback(procTA);}//callsthehelperfunctionforeachofinputaswellastextareaelememntsinthepagefunctionprocTA(){procTAHelp('textarea');procTAHelp('in
我想将重音字母和各种编码转换为Javascript中的纯英语ASCII,想知道有哪些可能的选择。我需要的是:éclair~becomes~eclairbär~becomes~barпривет~becomes~privetこんにちは~becomes~konnichiva如您所见,这个想法是将任何语言转换为等效的纯英语ASCII。áčçéñtèd字母被转换成它们的普通等价物,西里尔字母或日文编码的字母被转换成它们的音译等价物。有人知道在Javascript中执行此操作的方法吗? 最佳答案 有许多Node模块做类似的事情,但比node-
我正在做一个基于泰米尔语的Web应用程序。在我的应用程序中,我使用动态字段来添加用户详细信息。那么,动态字段有多个ID如何做到这一点或如何使用基于类的Google音译?//LoadtheGoogleTransliterationAPIgoogle.load("elements","1",{packages:"transliteration"});functiononLoad(){varoptions={sourceLanguage:'en',destinationLanguage:'ta',shortcutKey:'ctrl+m',transliterationEnabled:true
我有一个字符串对象“有多个字符甚至特殊字符”我正在尝试使用UTF8Encodingutf8=newUTF8Encoding();ASCIIEncodingascii=newASCIIEncoding();对象,以便将该字符串转换为ascii。我可以请某人为这个简单的任务带来一些启发,那就是我的下午。编辑1:我们正在努力完成的是摆脱特殊字符,如一些特殊的Windows撇号。我在下面作为答案发布的代码不会解决这个问题。基本上O'BrianwillbecomeO?Brian.where'isoneofthespecialapostrophes 最佳答案
我正在尝试将以下slugify方法从PHP转换为C#:http://snipplr.com/view/22741/slugify-a-string-in-php/编辑:为了方便起见,将上面的代码放在这里:/***ModifiesastringtoremovealnonASCIIcharactersandspaces.*/staticpublicfunctionslugify($text){//replacenonletterordigitsby-$text=preg_replace('~[^\\pL\d]+~u','-',$text);//trim$text=trim($text,'-
我做了这个功能:functiontransliterate(word){varanswer="";A=newArray();A["Ё"]="YO";A["Й"]="I";A["Ц"]="TS";A["У"]="U";A["К"]="K";A["Е"]="E";A["Н"]="N";A["Г"]="G";A["Ш"]="SH";A["Щ"]="SCH";A["З"]="Z";A["Х"]="H";A["Ъ"]="'";A["ё"]="yo";A["й"]="i";A["ц"]="ts";A["у"]="u";A["к"]="k";A["е"]="e";A["н"]="n";A["г"]=
我正在使用PHPTransliterator(来自php5-intl,使用ICU)将CJK音译为拉丁语(罗马化),问题是,我需要一些方法来指定输入语言环境,以便日文汉字不会被罗马化为中文拼音(因为它们通常共享相同的utf8character).例如:transliterator_transliterate('Any-Latin;Latin-ASCII;Lower();',$input);中国おタク界=>zhongguootakujie虽然我想得到:中国おタク界=>中国宅男会有什么想法吗?关于ICUsite的进一步研究建议问题可能是Han-Latin只遵循拼音音译,所以我正在寻找一种方法
为了索引和搜索,我需要“展平”一些Unicode字符串。例如,我需要将GötheФ€转换为ASCII。最后两个字符在ASCII中没有紧密的表示,因此可以完全丢弃它们。所以我期望从echoiconv("UTF-8","ASCII//TRANSLIT//IGNORE","GötheФ€");是Gothe但它输出Gothe?EUR。除了字母之外,我还希望所有各种Unicode数字和标点符号,例如句点、逗号、破折号、斜杠等,都被最接近的ASCII对应物所取代,这就是ASCIIiconv函数中的//TRANSLIT//IGNORE已经执行但并非没有为无法找到任何ASCII替换的Unicode字符