草庐IT

utf8_unicode_cs

全部标签

windows - 将 Unicode 字符打印到 shell

我想在cmd中输出一个Unicode字符,但明显的方法失败了:C:\Windows\System32>perl6-e"'Я'.say"?有趣的是,这有效:C:\Windows\System32>perl6-e"Buf.new(0xD0,0xAF).decode('UTF-8').say"Я这里似乎有什么问题?编辑:我使用的是来自here的最新RakudoStar版本.C:\Windows\System32>perl6-vThisisRakudoversion2016.01.1builtonMoarVMversion2016.01implementingPerl6.c.

python - Windows 上的 Django 1.7 dumpdata 打乱 unicode 字符

我使用manage.pydumpdata--formatxml--some-more-parameters将数据库的完整转储导出到xml。数据库是MSsqlserver,我使用pyodbc作为驱动程序。dumpdata命令是使用PowerShell运行的,由于Django1.7不支持dumpdata命令的--output参数,我使用PowerShell将输出重定向到一个文件中。不幸的是,数据库包含unicode字符(例如country\xd6sterreich)并且这些字符在导出文件中被打乱。这是无效的:./manage.pydumpdata--formatxml>export.xml

python - 如何在 python 中读取 unicode 文件名?

我看到很多关于unicode、utf-8的论坛,但无法做到这一点。我正在使用Windows。让我们有两个文件夹:E:\old----திருக்குறள்.txt----manymoreunicodenamedfilesE:\new----语言:泰米尔语假设我想将文件移动到E:\new。我无法正确访问unicode文件名。我尝试了什么importsysimportosfromshutilimportcopyfilepath='E:/old/'forroot,_,filesinos.walk(ur''.join(path)):files=[fforfinfiles]copyfile(fi

windows - 如何在 MFC 中获取 CString 宽度(对于 Unicode)?

我有一个支持多语言的MFC应用程序。为了支持多语言,我开发了一个可以计算String(CString)绘图宽度的API。它仅适用于英语。对于其他unicode语言,如俄语、印地语、阿拉伯语(RTL)等,它无法计算字符串的确切宽度。以下是API代码:CRectMyUtil::GetTextRect(LPCTSTRstr,CRect*rect,UINTformat,MyFontClass*textFont/*,BOOLgetActualRect*/){if(str==NULL||_tcslen(str)==0||rect==NULL||rect->Width()Height()GetCFo

java - 为什么在 Linux 下键入 unicode 时不显示 KeyTyped 事件?

我有一个在Linux下运行的Swing应用程序,它在显示重音字符时有问题。查看应用程序,我将问题追踪到键盘。我添加了一个新的EventQueueManager来拦截接收到的所有事件。我在两个系统上都输入了“[deadacute][a]”序列。在Windows中我得到:D090116100330.015000AWT-EventQueue-1[HotKeyManager.java:133-handleAWTEvent]java.awt.event.KeyEvent[KEY_PRESSED,keyCode=129,keyText=DeadAcute,keyChar='´',keyLocati

c++ - Unicode 麻烦了! Ms-Access 97 迁移到 Ms-Access 2007

问题分为两步:问题步骤1。访问包含以UTF-8编码的XML字符串的97数据库。问题归结为:Access97数据库包含以UTF-8编码的XML字符串。所以我创建了一个补丁工具,用于将XML字符串从UTF-8单独转换为Unicode。为了将UTF8字符串转换为Unicode,我使用了函数MultiByteToWideChar(CP_UTF8,0,PChar(OriginalName),-1,@newName,Size);.(其中newName是声明为“newName:Array[0..2048]ofWideChar;").此功能在大多数情况下都适用,我已经用Spainsh、Arabic和字

PHP 和 Unicode : Weirdness between Windows and Linux

查看IBM的UnicodefortheworkingPHPprogrammer,尤其是list3和4。在UbuntuLucid上,我从代码中获得了与IBM相同的输出,即:ЗдравсствуйтеArray([1]=>65279[2]=>1047[3]=>1076[4]=>1088[5]=>1072[6]=>1074[7]=>1089[8]=>1089[9]=>1090[10]=>1074[11]=>1091[12]=>1081[13]=>1090[14]=>1077)Здравсствуйте但是,在Windows上,我得到了完全不同的响应。ðùð┤ÐÇð░ð▓ÐüÐüÐéð▓Ðâð

c# - 如何将unicode字符串转换为char?

我有一个文本文件,其中的Unicode集写成"'\u0641'","'\u064A','\u0649','\u0642','\u0625','\u0644','\u0627','\u0647','\u0631','\u062A','\u0643','\u0645','\u0639','\u0648','\u0623','\u0646','\u0636','\u0635','\u0633','\u0641','\u062D','\u0628','\u0650','\u064E','\u062C','\u0626""'\u0622'","'\u062E','\u0644','\u064A'

无法使用 fopen 读取 UTF8 编码的文件(文件, "r,ccs=UTF-8")

在使用fopen打开文件时,我使用ccs=encoding(如MSDN中所述)将编码设置为UTF-8。当写入文件时它工作正常wchar_t*unicode_text=L"こんにちは";FILE*f=fopen("C:\\test.txt","w,ccs=UTF-8");fwprintf(f,L"%s\n",unicode_text);fclose(f);当我在文本编辑器中打开文件时,unicode会正常显示。但是当尝试从创建的文件中读取时,未检测到UTF-8编码:wchar_tbuffer[1000];FILE*f=fopen("C:\\test.txt","r,ccs=UTF-8")

java - 如何根据使用的字体将代码点映射到 unicode 字符?

客户端打印标签并一直使用一组符号(?)字体来完成此操作。该应用程序使用单字节数据库(带有Latin-1的Oracle)。我要替换的旧应用程序不支持Unicode。它不知何故没问题。我正在编写的替换应用程序应该处理旧数据。从charmap应用程序中选取的符号通常会映射到特定的Unicode字符,但有时它们不会。例如,使用LAB3字体看起来像Moon的实际上是U+2014(EMDASH)。当用户将此字符粘贴到Swing文本字段中时,该字符的代码点为8212。数据库,Oracle认为它不能被安全地编码,并用可怕的¿替换它。因此,我开始将字符移动8000:保存时-=8000,显示字段时+=80