草庐IT

java - 如何根据使用的字体将代码点映射到 unicode 字符?

客户端打印标签并一直使用一组符号(?)字体来完成此操作。该应用程序使用单字节数据库(带有Latin-1的Oracle)。我要替换的旧应用程序不支持Unicode。它不知何故没问题。我正在编写的替换应用程序应该处理旧数据。从charmap应用程序中选取的符号通常会映射到特定的Unicode字符,但有时它们不会。例如,使用LAB3字体看起来像Moon的实际上是U+2014(EMDASH)。当用户将此字符粘贴到Swing文本字段中时,该字符的代码点为8212。数据库,Oracle认为它不能被安全地编码,并用可怕的¿替换它。因此,我开始将字符移动8000:保存时-=8000,显示字段时+=80

linux - 将 unix/linux 文件名字符集转换为 windows

我使用mkdir()通过PHP在波斯语和阿拉伯语中创建了一些目录。我想将文件夹移动到窗口中,但文件夹名称有问题。示例:我写了:“سلام”但在Windows中显示未知字符:“ط³غŒط³طھظ…ط¹ط§ظ…ظ„ط¬ظ„ط¯ط¯ظˆظ…"似乎应该转换成除UTF-8以外的其他编码抱歉,如果我的英语不是很好。谢谢。编辑:我使用了这个Powershell代码并为我工作:Get-ChildItem|ForEach-Object{$filename=Split-Path-Leaf$_$new=[Text.Encoding]::Utf8.GetString([Text.Encoding]::Defa

windows - UrlUnescape() 和 unicode 字符

我正在尝试在C++上编写程序,该程序将解码包含一些URL编码的unicode字符的URL编码字符串。#include#include#include#pragmacomment(lib,"Shlwapi.lib")int_tmain(intargc,_TCHAR*argv[]){std::wstringtest=L"bla+%D0%B1%D0%BB%D0%BE%D1%84+%E6%97%A5%E6%9C%AC%E8%AA%9E";PWSTRurlencodedStr=const_cast(test.c_str());WCHARdecodedStr[1025];DWORDsize=102

python - 如何让 tkinter 显示这些 un​​icode 字符?

我正在努力让它正确显示unicode:?????????????.???嗯,这个字符范围。这是'MathematicalAlphanumericSymbolsUnicodeblock'.关于这些角色,他们对一个字母使用两个转义符,所以有点奇怪?????????????.???=\uD835\uDC12\uD835\uDC13\uD835\uDC00\uD835\uDC02\uD835\uDC0A\uD835\uDC0E\uD835\uDC15\uD835\uDC04\uD835\uDC11\uD835\uDC05\uD835\uDC0B\uD835\uDC0E\uD835\uDC16.

c - UTF-8 文本到剪贴板 C

我一直在寻找如何带一个字符串,constchar*output="ヽ(⌐■_■)ノ♪♬";到剪贴板。SetClipboardData(CF_UNICODETEXT,hMem);我已经尝试过MultiByteToWideChar,但我得到的只是噪音,还有相互矛盾的说法,即您无法将UTF-16LE保存到剪贴板(wchar_t)。老实说,我只是很困惑。最好有说明或代码示例。 最佳答案 Windows使用UTF-16LE。该字符串应使用L前缀创建。要使用UTF8,您可以使用u8前缀声明字符串。例如:constchar*text=u8"ヽ(⌐

c++ - WIN32_FIND_DATA 在目录中列出文件时返回 "."和 ".."

我正在编写一个应该可以在Windows和Linux上运行的虚拟文件系统。这是为了一项任务,所以不允许像Boost这样的外部事物。对于Windows版本,我正在尝试编写一个将所有文件挂载到给定目录中的函数。这是所说的功能:voidFileSystem::MountDirectory(conststd::stringdirectory){WIN32_FIND_DATAsearch_data;memset(&search_data,0,sizeof(WIN32_FIND_DATA));std::wstringwDir=StringToWstring(directory);LPCWSTRdir

javac 不在命令行输出 unicode

上下文:Windows10、cmd.exe、javac9.0.1。我有unicode编码的源代码。如果我运行javac-encodingUTF-8...并且出现错误,我就是无法正确显示源代码。正如您在图片中看到的,cli可以很好地打印unicode字符。 最佳答案 javac似乎没有使用您终端的字符编码。您可以使用标志指定JVM的字符编码:java-Dfile.encoding=UTF-8...(或任何编码)Javac只是Java程序的薄包装器。您可以使用-J标志将参数直接传递给它的JVM。所以:javac-J-Dfile.enco

windows - Strawberry Perl——默认情况下在哪里进行编码转换?

基本上,我编写了一个Perl脚本,为Powershell创建一个编码命令并尝试运行它。在对其进行base64编码之前,我必须将命令字符串显式转换为utf-16。我想知道为什么这就是我必须做的全部才能使脚本正常工作的原因。Windows*上的Perl在运行与控制台和文件系统交互的“普通”程序时默认执行哪些转换?例如,是否转换了argv?stdin/stdout是否转换?文件IO是否经过转换?✱特别是StrawberryPerl发行版,以防ActivePerl做一些不同的事情我正在尝试编写调用许多PowerShell片段并依赖StrawberryPerl分发的Perl脚本。PowerShe

windows - Unicode/非 Unicode/UTF-8 问题

我正在处理的应用程序将数据存储在INI文件中。该应用程序创建INI文件,该文件将由我们创建的另一个应用程序读取。INI文件也可以手动编辑。INI文件可能迟早会包含不同的语言,因此我们小心翼翼地确保该文件中使用的所有数据均为unicode格式。最初创建INI文件后,我们在记事本中检查了该文件,发现字母间距被搞砸了。经过一些研究,我们发现了Unicode字节顺序标记(BOM)FFFE并在文件的开头开始编写它,一切似乎都很好-文件已正确创建并且可以手动编辑在记事本中。现在是问题-我们一直在寻找INI文件解析器,而不是创建我们自己的解析器。BoostpropertyTree看起来很理想,但BO

c++ - 如何防止非 Unicode 应用程序在将资源加载到不同本地化的机器上时转换资源的字符集?

我们有一个非Unicode、C++应用程序,它是用VisualStudio编写的,最初是为使用代码页1252字符集的机器编写的。我们的应用程序在读取资源内容后对其执行许多后处理步骤,包括在某些文件中查找资源字符串。现在中国人开始使用该应用程序,他们的机器使用PRC语言环境(它将非unicode应用程序的默认代码页设置为936,这是一个多字节字符集)。看起来CString::LoadString将执行一些转换。这会中断进一步的处理,因为我们在其他文件中查找的内容不同。CMenu::GetMenuString或CWnd::GetWindowText也是如此。糟糕的是,我们不能简单地在我们的