草庐IT

diacritics

全部标签

ruby-on-rails - 从字符串中删除重音符号/变音符号,同时保留其他特殊字符(尝试过 mb_chars.normalize 和 iconv)

有一个很similarquestion已经。其中一种解决方案使用如下代码:string.mb_chars.normalize(:kd).gsub(/[^x00-\x7F]/n,'').to_s这会产生奇迹,直到您注意到它还删除了空格、点、破折号,谁知道还有什么。我不太确定第一个代码是如何工作的,但是它可以去除仅重音吗?或者至少得到一份要保留的字符列表?我对正则表达式的了解很少,但我尝试了(无济于事):/[^\-x00-\x7F]/n#Soitwouldleavethedashalone我将要做这样的事情:string.mb_chars.normalize(:kd).gsub('-','

ruby - Notepad++ 只是调用 "ANSI"的编码,有谁知道在 Ruby 中如何调用它?

我有一堆.txt,Notepad++说(在其下拉“编码”菜单中)是“ANSI”。它们中有德语字符[äöüß],在Notepad++中显示良好。但是当我File.read'thisisaGermantextexample.txt'它们时,它们并没有正确显示在irb中。那么有人知道我应该给Encoding.default_external=什么参数吗?(我假设这就是解决方案,对吧?)当'utf-8'或'cp850'时,它读取带有“äöüß”的“ANSI”文件为“\xE4\xF6\xFC\xDF”...(请不要犹豫,在你的回答中提及明显“显而易见”的事情;我和你一样新手,但仍然知道足以问这个

asp.net - 在 .Net http 处理程序中编码 u 元音变音时出现问题

我有一个JavaScript请求转到ASP.Net(2.0)HTTP处理程序,该处理程序将请求传递给JavaWeb服务。在此系统中,特殊字符(例如带有重音符号的字符)无法正确传递。例如人工输入:杜塞尔多夫成为对http://site/serviceproxy.ashx?q=D%FCsseldorf的JavaScript异步请求,目前在ISO-8859-1和UTF-8中有效据我所知。(除非它是UTF-8中的%c3%bc)HttpContext.Current.Request.QueryString.Get("q")返回D�sseldorf,这是麻烦开始的地方。但是HttpUtility.

Javascript 正则表达式 + Unicode 变音符号组合字符`

我想匹配非洲约鲁巴语“ẹ́”中的这个字符。通常这是通过在点变音符号下组合'é'和'\u0323'来实现的。我发现:'é\u0323'.match(/[é]\u0323/)worksbut'ẹ́'.match(/[é]\u0323/)doesnotwork.我不只是想匹配e。我想匹配所有组合。现在,我的解决方案涉及枚举所有组合。像这样:/[ÁÀĀÉÈĒẸE̩Ẹ́É̩Ẹ̀È̩Ẹ̄Ē̩ÍÌĪÓÒŌỌO̩Ọ́Ó̩Ọ̀Ò̩Ọ̄Ō̩ÚÙŪṢS̩áàāéèēẹe̩ẹ́é̩ẹ̀è̩ẹ̄ē̩íìīóòōọo̩ọ́ó̩ọ̀ò̩ọ̄ō̩úùūṣs̩]/难道没有更短更好的方法来做到这一点,或者在unicode

javascript - 如何制作考虑重音字符的正则表达式?

我有一个JavaScript正则表达式,基本上可以找到两个字母的单词。问题似乎是它将重音字符解释为单词边界。确实,似乎Awordboundary("\b")isaspotbetweentwocharactersthathasa"\w"ononesideofitanda"\W"ontheothersideofit(ineitherorder),countingtheimaginarycharactersoffthebeginningandendofthestringasmatchinga"\W".AS3RegExptomatchwordswithboundrytypecharacters

javascript - 带有 promise 的 jQuery ajax 请求在 IE9 中不起作用

这是我制作的一个类,它使用YQL进行谷歌翻译。varTranslator={source:'ro',//defaulttarget:'en',//defaulturl:'http://query.yahooapis.com/v1/public/yql?q=select*fromgoogle.translatewhereq="',urlRemaining:'";&format=json&diagnostics=true&env=store://datatables.org/alltableswithkeys&callback=',diacritics:Array(),newCharact

javascript - Javascript 中区分大小写的重音折叠

以这个例子:accentsTidy=function(s){varr=s.toLowerCase();r=r.replace(newRegExp("\\s",'g'),"");r=r.replace(newRegExp("[àáâãäå]",'g'),"a");r=r.replace(newRegExp("æ",'g'),"ae");r=r.replace(newRegExp("ç",'g'),"c");r=r.replace(newRegExp("[èéêë]",'g'),"e");r=r.replace(newRegExp("[ìíîï]",'g'),"i");r=r.replac

javascript+动态删除阿拉伯语文本变音符号

如何动态去除阿拉伯变音符号我正在设计一本电子书“chm”并且有多个包含阿拉伯文本的html页面但有时搜索引擎想要突出显示一些阿拉伯语单词,因为它有变音符号,所以在页面加载时是否可以使用JavaScript函数来去除阿拉伯语变音符号文本?但必须有再次启用的选项,所以我不想从HTML中物理删除它,但只是暂时的,问题是我不知道从哪里开始以及使用什么是正确的功能谢谢你:)例如Text:الْحَمْدُلِلَّهِرَبِّالْعَالَمِينَconvertedto:الحمدللهربالعالمين 最佳答案 我编写了这个函数来

删除变音符号的javascript函数

我正在搜索javascript函数来替换法语变音符号并遇到了这段代码:String.prototype.removeDiacritics=function(){vardiacritics=[[/[\300-\306]/g,'A'],[/[\340-\346]/g,'a'],[/[\310-\313]/g,'E'],[/[\350-\353]/g,'e'],[/[\314-\317]/g,'I'],[/[\354-\357]/g,'i'],[/[\322-\330]/g,'O'],[/[\362-\370]/g,'o'],[/[\331-\334]/g,'U'],[/[\371-\374

javascript - 为什么我不能在单词边界旁边使用重音字符?

我正在尝试制作一个与人名匹配的动态正则表达式。它适用于大多数名称,直到我在名称末尾遇到重音字符。示例:一些花哨的名字到目前为止我使用的正则表达式是:/\b(FancyNamé|Namé)\b/i这样使用:"Goal:SomeFancyNamé.Awesome.".replace(/\b(FancyNamé|Namé)\b/i,'$1');这根本不匹配。如果我用e替换é,它匹配得很好。如果我尝试匹配诸如“SomeFancyNaméa”之类的名称,它就可以正常工作。如果我删除单词lastword边界anchor,它就可以正常工作。为什么边界标志这个词在这里不起作用?关于如何解决这个问题有什