草庐IT

android - 在 Android 上看起来像中文的日文字符

PREAMBLE:从API17(Android4.2)开始,有一个方法TextView.setTextLocale()可以显式解决TextView和派生类的这个问题。指定日语区域设置(Locale.JAPAN),Unihan字符将看起来像日语。我在Android上有一个应用程序,可以在WebViews和TextViews中显示日语文本。按照惯例,有些汉字(汉字)在中国和日本看起来不同,但共享相同的Unicode代码点。通常,浏览器会依赖lang标签来选择正确的字形。在Android上,它们都默认为中文形状,我想要日文形状。这个问题在thisarticle中有很好的解释。.这篇文章也完美

ios - iOS5、iOS6 Unicode 上的全文搜索(俄语、日语、中文、韩语)

我需要在包含标题的2.000.000个数据库行中进行搜索,例如歌曲。我需要一个能够快速提供结果、适用于iOS平台并支持unicode字符集的解决方案。我正在考虑使用sqlite的FTS来解决我的问题。我愿意接受任何其他解决方案。这是我目前所知道的:假设1:FTS在iOS>=5中默认启用-这很好,我的最低要求是5假设2:我假设,如果我不自己编译sqlite,unicode折叠(Ä=>a)将无法工作假设3:我知道FTS不支持像MATCH"*searchterm*"这样的子字符串搜索假设4:我读到默认的porter词干分析器对unicode字符集(俄语、日语、中文……)非常糟糕我目前的方法是

c++ - Windows 10 1709 中日语输入法的奇怪行为

我在Windows10Creators更新中遇到了一个问题,当我尝试使用IME向我的应用程序输入内容时,第一个字符被忽略;即,如果我使用IME通过输入K&A来输入日语平假名字符“か”,我最终只会得到“あ”,而K丢失了。这只发生在第一个字符上。但是完全相同的应用程序可以在Windows7~8中正常运行。详情如下:该应用程序是容器/​​服务器类型的MFCMDI应用程序。它的工作非常简单直接。如果文档是打开的,那么当WM_KEYDOWN被触发时,动态创建一个CEdit框并将按下的键输入到编辑框中。如果编辑框已经存在,则无需重新创建。只需将输入附加到编辑框的内容中即可。我创建了2个示例MFCM

涉及日语的PHP正则表达式

我的目标是过滤MicrosoftWord文档(.docx),获取所有日文汉字和假名。我正在使用的当前代码如下:preg_match_all('~[\x{4e00}-\x{9faf}]([\x{3040}-\x{309f}])\=([a-z])\=+~u',$data,$matches);根据一些研究,我发现日语文本的unicode值如下:http://www.rikai.com/library/kanjitables/kanji_codes.unicode.shtml我正在处理的数据示例如下所示:時(とき)=toki=time;hour;occasion;momentを=wo=part

php - 要使我的 I18N 应用程序在日语中有效,我应该知道什么?

我正在开发一个I18N应用程序,它将位于日语中,我不知道日语中的任何单词,我首先想知道utf8是否足够用于该语言。通常,对于欧洲语言,utf8就足够了,我必须设置我的数据库字符集/排序规则以使用utf8_general_ci(在MySQL中)和utf8中的htmlView,这就足够了。但是日语呢,还有别的事可做吗?顺便说一下,我的应用程序可以处理英语、法语、日语,但稍后可能需要添加一些语言,比方说俄语。我如何设置我的I18N应用程序以广泛使用而无需在部署时更改大量配置?有什么最佳实践吗?顺便说一下,我打算使用gettext,我很确定它支持这些语言没有任何问题,因为它是几乎所有GNU软件

php - 在PHP中计算带有半角假名的日语多字节字符串的长度

所以我有一个UTF-8编码的字符串,它可以包含全角汉字、全角假名、半角假名、罗马字、数字或卡哇伊日文符号,如★或♥。如果我想要我使用mb_strlen()的长度,它会将每个长度计为1。这对大多数用途来说都很好。但是,(一位日本客户)要求我只将半角假名计算为0.5(为了文本字段的最大长度),因为显然日本网站就是这样做的。我使用mb_strwidth()执行此操作,它将全角计为2,将半角计为1,然后除以2。然而,此方法也将罗马字字符计为1,因此像Chocアイス这样的字符将计为7..然后我将除以2以计算汉字,得到3.5。但我实际上想要5.5(罗马字4+3个半角假名1.5)。//编辑:更多信息

php - 日语的 sort()

如果我将我当前的语言环境设置为日语,我怎样才能使日语字符总是比非日语字符具有更高的优先级。例如,现在英文字符总是出现在片假名字符之前。我怎样才能扭转这种影响?抱歉,不是很清楚。如你所见here.最后的成绩有Java、NVIDIA和Windows的ファイアウォール。排在日本文字前三位。可以把那些放在最后吗? 最佳答案 使用usort()而不是sort()因此您可以按照自己的方式定义比较标准。试试这个简单的方法。我已经用here的例子试过了,并且有效。functionmccompare($a,$b){$fca=ord(substr($a

android - 如何在 Xamarin 上使用 SkiaSharp 绘制日语文本

现在我在XamarinAndroid上使用SkiaSharp。我想用SKCanvas.DrawText画日文,但是日文字符是乱码。我看到了similarquestion,所以我尝试将文本转换为UTF-8,但结果是一样的。我试过如下。vars="abcあいう123壱弐参";varbuf=System.Text.Encoding.UTF8.GetBytes(s);varutf8s=Encoding.UTF8.GetString(buf);skcanvas.DrawText(utf8s,50,50,paint);另一个。vars="abcあいう123壱弐参";vardest=Encoding

Android:如何使用日语 Unihan 字形?

我正在开发一款教授日语的应用程序。问题是,系统使用的默认字体是使用字符的中文变体,而不是日文变体。例如,汉在中文字体中看起来与在日文字体中略有不同,即使它们是相同的Unicode代码点。如何指定我的应用程序应使用日文字体而不是中文字体? 最佳答案 如果找不到更好的解决方案,您可以使用自己的.ttf或.otf文件,将它们放在/assets/fonts中并使用createFromAsset()加载它们 关于Android:如何使用日语Unihan字形?,我们在StackOverflow上找到

android - 在 Android 中遇到日语字符 "〜"的问题

我不懂日文-我不知道这个字符是什么意思。我们在我们的XML文件中使用UTF-8编码,并且可以在我们的应用程序中看到除“〜”之外的所有其他日文字符,它显示为一个框。“〜”出现在Eclipse中,尝试将其替换为波浪号(~),但波浪号更小并且在我们的应用中看起来略有不同(〜与~)。在Google翻译中,它将字符解释为代字号http://translate.google.com/#ja/en/%E3%80%9C在Android中,我们使用了〜和\u301C但它们都显示为框。“気分ガ悪いよ〜!”字的用法示例我的问题:这是我们唯一缺少的字符(我们有一部美国Android手机并将语言更改为日语)。我