UTF8Encoding

c++ - 将 std::string 编码/解码为 UTF-16

我必须处理一种文件格式(读取和写入)，其中字符串以UTF-16编码(每个字符2个字节)。由于ASCII表中的字符很少在应用程序域中使用，因此我的C++模型类中的所有字符串都存储在std::string(UTF-8编码)的实例中。我正在寻找一个库(在STL和Boost中搜索但没有运气)或一组C/C++函数来处理从文件格式加载或保存到文件格式时的这种std::stringUTF-16转换(实际上建模为字节流)包括代理对的生成/识别和所有Unicode内容(我承认我不是专家)...有什么建议吗？谢谢!编辑:忘了说它应该是跨平台的(Win/Mac)并且不能使用C++11。

c# - C++ dll 将 utf8 作为 const char* 发送，c# 需要做什么……什么？

dll是用c++编写的，通过constchar*回调将文本作为utf8发送。首先，这是声明回调的正确方法吗？[UnmanagedFunctionPointer(CallingConvention.StdCall)]publicdelegatevoidTextCallback(stringsText);[DllImport("cppLib.dll",CharSet=CharSet.Ansi,CallingConvention=CallingConvention.Cdecl)]publicstaticexternvoidGetText([MarshalAs(UnmanagedType.Fu

c#hellip TextCallback section code c++dll utf-8 callback

c++ - UTF8 字符是否有分隔符字节？

如果我有一个包含UTF8内容的字节数组，我将如何解析它？是否有分隔符字节，我可以将其拆分以获得每个字符？最佳答案看看这里...http://en.wikipedia.org/wiki/UTF-8如果您想要识别字符之间的边界，您需要的是“描述”中的表格。获得高位零的唯一方法是使用单个字节编码的ASCII子集0..127。所有非ASCII代码点都从第二个字节开始，最高两位为“10”。代码点的前导字节从来没有-它的高位表示字节数，但有一些冗余-你同样可以观察下一个没有“10”的字节来指示下一个代码点。0xxxxxxx:ASCII10x

amp 43 section code 高位 c++unicode utf-8

C++ 和 UTF8 - 为什么不直接替换 ASCII？

在我的应用程序中，由于不同的API(boost、win32、ffmpeg等)，我必须不断地在std::string和std::wstring之间转换字符串。特别是对于ffmpeg，字符串以utf8->utf16->utf8->utf16结束，只是为了打开一个文件。由于UTF8向后兼容ASCII，我认为我始终将所有字符串存储为UTF-8std::string并且仅在我转换为std::wstring时转换为std::wstring必须调用某些不寻常的函数。这工作得很好，我为utf8实现了to_lower、to_upper、iequals。但是后来我遇到了几个死胡同std::regex和常规

接替 amp code section std c++string visual-studio-2010 unicode

c++ - utf8 <-> utf16 : codecvt poor performance

我正在研究我的一些旧的(并且专门面向win32的)东西并考虑使它更现代/可移植-即在C++11中重新实现一些可广泛重用的部分。这些部分之一是utf8和utf16之间的转换。在Win32API中，我正在使用MultiByteToWideChar/WideCharToMultiByte，尝试使用此处的示例代码将这些内容移植到C++11:https://stackoverflow.com/a/14809553.结果是发布版本(由MSVS2013编译，在Corei73610QM上运行)stdlib=1587.2msWin32=127.2ms调试构建stdlib=5733.8msWin32=12

amp performance utf utf8 code c++c++11 utf-8

c++ - 以二进制方式将utf16写入文件

我正在尝试以二进制模式使用ofstream将wstring写入文件，但我认为我做错了什么。这是我试过的:ofstreamoutFile("test.txt",std::ios::out|std::ios::binary);wstringhello=L"hello";outFile.write((char*)hello.c_str(),hello.length()*sizeof(wchar_t));outFile.close();在编码设置为UTF16的Firefox中打开test.txt将显示为:h�e�l�l�o�谁能告诉我为什么会这样？编辑:在十六进制编辑器中打开文件我得到:FFF

amp 43 from the to c++unicode utf-16

php - setlocale(LC_ALL, 'en_GB.UTF8') 不适用于 Windows

为什么setlocale(LC_ALL,'en_GB.UTF8');在WindowsServer2003R2-ZendCEPHP5.3.5上返回false？有问题的功能:setlocale. 最佳答案来自PHP手册:Thereturnvalueofsetlocale()dependsonthesystemthatPHPisrunning.Itreturnsexactlywhatthesystemsetlocalefunctionreturns.因此在您的情况下它返回false，因为系统返回false。您正在使用的语言环境可能在您的

amp setlocale code section php windows utf-8

python - 致命的 Python 错误 : Py_Initialize: can't initialize sys standard streams LookupError: unknown encoding: 65001

当尝试使用pip安装一些包时，我遇到了错误。即使切换Python的环境，也出现了同样的错误。所以从我的角度来看，这不是我要安装的包的问题，可能是Python的环境有问题。谁能帮帮我？环境:Windows10Anaconda4.5.2Python3.6点子10.0.1这是来自命令的消息:C:\WINDOWS\system32>activatepy36_tfg(py36_tfg)C:\WINDOWS\system32>deactivateFatalPythonerror:Py_Initialize:can'tinitializesysstandardstreamsLookupError

Py_Initialize LookupError section https Python windows

windows - Windows 上的 Perl : Problems with Encoding

我的Perl脚本有问题。在类UNIX系统中，它会将所有Unicode字符(如ä)正确地打印到控制台。在Windows命令行中，字符被分解为无意义的字形。有没有一种简单的方法可以避免这种情况？我正在使用useutf8;。提前致谢。最佳答案 useutf8;简单地告诉Perl你的源代码是使用UTF-8编码的。它也不适用于unix。有一些字符串无法正确打印(printchr(0xE9);)，大多数会打印“宽字符”警告(printchr(0x2660);)。您需要对输入进行解码并对输出进行编码。在unix系统中，通常是这样useopen'

Encoding Problems code section UTF-8 windows perl activeperl

python - 在 Python 中处理 UTF 文件名

我已经阅读了很多关于该主题的内容，包括此处似乎是该主题的权威指南:http://docs.python.org/howto/unicode.html也许对于更有经验的开发人员来说，该指南可能就足够了。但是，就我而言，我比开始时更加困惑，但仍未解决我的问题。我正在尝试使用os.walk()读取文件名，并在将该信息写入文本文件之前获取有关文件的某些信息(例如文件大小)。只要我没有遇到任何文件名以utf编码的文件，它就可以工作。当它遇到一个带有utf编码名称的文件时，我会收到类似这样的错误:WindowsError:[Error123]Thefilename,directoryname,or

python section code unicode windows filenames utf

92 93 949596 97 98