草庐IT

diacritics

全部标签

c++ - 使用 ICU 去除变音符号的代码

有人可以提供一些示例代码来去除变音标记(即,将具有重音符号、元音变音符号等的字符替换为未重音符号、未变音符号等字符等价物,例如每个带重音符号的é会使用C++中的ICU库从UnicodeString变成纯ASCIIe)吗?例如:UnicodeStringstrip_diacritics(UnicodeStringconst&s){UnicodeStringresult;//...returnresult;}假设s已经被标准化。谢谢。 最佳答案 ICU允许您使用特定规则音译字符串。我的规则是NFD;[:M:]移除;NFC:分解、去除变音

iOS - 如何使用 SQLite.swift 进行变音符号不敏感搜索?

我正在使用SQLite.swift。有什么办法可以在SQLite中进行不区分变音符号的LIKE查询吗?例如,这个查询:SELECT*FROMusersWHEREnameLIKE"thu%"会返回:thửthuthưetc. 最佳答案 来自thedocumentation:WecancreatecustomcollatingsequencesbycallingcreateCollationonadatabaseconnection.trydb.createCollation("NODIACRITIC"){lhs,rhsinreturn

objective-c - 有没有办法使用 NSString stringByFoldingWithOptions 将单个法语字符 'œ' 展开为 'oe' ?

对于与变音符号无关的全文搜索功能,我使用以下代码将重音字符(如é或Ö)转换为小写非重音形式e和o[[inputStringstringByFoldingWithOptions:NSCaseInsensitiveSearch+NSDiacriticInsensitiveSearch+NSWidthInsensitiveSearchlocale:[NSLocalecurrentLocale]]lowercaseString];这行得通。但是,我发现无法转换基本形式由多个字符组成的特殊字符,例如法语œ(如“sœur”)或德语ß(如'流感”)。我想将它们分别转换为oe和ss。我没有找到stri

hadoop - Apache Hive 中的字符集、口音、特殊字符

问题我的Hive表在某些行值中包含特殊字符(法语)时遇到了很多问题。基本上,在查询数据(通过HiveCLI或其他方法)时,所有特殊字符(如字母或其他变音符号上的重音)都会变成纯粹的乱码(各种奇怪的符号)。问题不在于列名,而在于实际的行值和内容。例如,我没有打印“Variat°”或任何其他特殊字符或重音符号,而是得到了这个结果(使用select语句时):Variat�cancel信息与sessionHive表是外部的,来自HDFS中以字符集iso-8859-1编码的CSV文件。更改原始文件编码字符集不会产生更好的结果。我在RedHatEnterprise6上使用Hortonworks

php - ucwords 和法语重音字母编码

这个问题在这里已经有了答案:Makeallwordslowercaseandthefirstletterofeachworduppercase(3个答案)关闭去年。我们有一个加拿大地址的数据库,都是大写的,客户要求我们转换为小写,希望第一个字母和'-'之后的字母所以我实现了这个功能,但是我在处理带有法语重音符号的字母时遇到了问题。当文件和字符集为ISO-88591时,它工作正常,但当我尝试将其设为UTF-8时,它不再工作了。输入示例:'damien-claudeélanger'输出:Damien-Claudeélangerutf-8中的é会变成�functioncap_letter($

php - 如果字符串是变音符号,fgetcsv 会吃掉字符串的第一个字母

我正在将Excel生成的CSV文件中的内容导入到XML文档中,例如:$csv=fopen($csvfile,r);$words=array();while(($pair=fgetcsv($csv))!==FALSE){array_push($words,array('en'=>$pair[0],'de'=>$pair[1]));}插入的数据是英语/德语表达。我将这些值插入到XML结构中并输出XML,如下所示:$dictionary=newSimpleXMLElement('');//dothings$dom=dom_import_simplexml($dictionary)->owne

php - 如何在邮件主题中设置变音符 ü

我需要生成包含变音字符的德语电子邮件。这在电子邮件本身中非常有效,但在电子邮件的主题中却行不通。我尝试了许多不同的变音字母,除了ü之外,它们似乎都有效。我还尝试了不同的邮件库(HTMLMimeMail和PHPMailer),但它们都失败了:$mail=newhtmlMimeMail();$mail->setTextEncoding("base64");$mail->setHTMLEncoding("base64");$mail->setTextCharset("UTF-8");$mail->setHTMLCharset("UTF-8");$mail->setHeadCharset("U

android - 如何将我的 Android 应用程序的强调色从蓝色更改为其他颜色

我只想更改我的Android应用程序的强调色,但我很难弄清楚如何做到这一点。android现在默认是蓝色的,但我想把它变成橙色。强调色是指导航选项卡的强调色、点击列表时突出显示的颜色、弹出对话框中的强调色等。如果重要的话,我正在使用actionbarsherlock。这是一张图片。我想更改整个应用程序中蓝色调的颜色: 最佳答案 你问这个问题已经有一段时间了,但现在谷歌已经发布了一个新的AppCompat版本,你可以很简单地做你想实现的事情。我给你的答案的灵感来自androiddeveloperblogsupportlibrary2.

android - 如何从 InputStream 中删除重音字符

我正在尝试使用Pull解析器在Android上解析Rss2.0提要。XmlPullParserparser=Xml.newPullParser();parser.setInput(url.open(),null);提要XML的序言说编码是“utf-8”。当我打开远程流并将其传递给我的PullParser时,我得到无效的token,记录格式不正确的异常。当我保存XML文件并在浏览器(FireFox)中打开它时,浏览器报告文件中存在Unicode0x12字符(重音符号?)并且无法呈现XML。如果我对返回的XML没有任何控制权,那么处理此类情况的最佳方法是什么?谢谢。

windows - 键盘 Hook 中的 ToAscii/ToUnicode 会破坏死键

似乎如果您在全局WH_KEYBOARD_LLHook中调用ToAscii()或ToUnicode(),并且按下死键,它将被“销毁”'.例如,假设您在Windows中将输入语言配置为西类牙语,并且您想要在程序中键入带重音符号的字母á。通常,您会按单引号键(死键),然后按字母“a”,然后屏幕上会按预期显示带重音符号的á。但是,如果您在低级键盘Hook函数中调用ToAscii()或ToUnicode(),这将不起作用。似乎死键被破坏了,所以屏幕上没有显示重音字母á。删除对上述函数的调用可以解决问题...但不幸的是,我需要能够调用这些函数。Google了一会儿,似乎很多人都有这个问题,但没有提