utf8_unicode_cs

c++ - 为什么 printf 不格式化 unicode 参数？

当使用printf将双字节字符串格式化为单字节字符串时:printf("%ls\n",L"s:\\яшертыHello");//%lsforawidestring(%svariesmeaningdependingontheproject'sunicodesettings).很明显，有些字符不能表示为ascii字符，所以有时我会看到双字节字符变成“?”的行为。标记字符。但是，这似乎取决于特定的字符。对于上面的printf，输出是:s:\我希望我能得到这样的东西:s:\??????Hello恐怕我已经失去了这个例子，但我认为当一个字符串遇到unicode字符时，将第一个字符串替换为“？”

c++ - 将 std::string 编码/解码为 UTF-16

我必须处理一种文件格式(读取和写入)，其中字符串以UTF-16编码(每个字符2个字节)。由于ASCII表中的字符很少在应用程序域中使用，因此我的C++模型类中的所有字符串都存储在std::string(UTF-8编码)的实例中。我正在寻找一个库(在STL和Boost中搜索但没有运气)或一组C/C++函数来处理从文件格式加载或保存到文件格式时的这种std::stringUTF-16转换(实际上建模为字节流)包括代理对的生成/识别和所有Unicode内容(我承认我不是专家)...有什么建议吗？谢谢!编辑:忘了说它应该是跨平台的(Win/Mac)并且不能使用C++11。

amp string codecvt code std c++utf-16 stdstring

c# - C++ dll 将 utf8 作为 const char* 发送，c# 需要做什么……什么？

dll是用c++编写的，通过constchar*回调将文本作为utf8发送。首先，这是声明回调的正确方法吗？[UnmanagedFunctionPointer(CallingConvention.StdCall)]publicdelegatevoidTextCallback(stringsText);[DllImport("cppLib.dll",CharSet=CharSet.Ansi,CallingConvention=CallingConvention.Cdecl)]publicstaticexternvoidGetText([MarshalAs(UnmanagedType.Fu

c#hellip TextCallback section code c++dll utf-8 callback

c++ - 资源文件是编译为 UNICODE 还是 ANSI 代码页？

首先-如果此问题已被回答一百次以上，我深表歉意!哦!但我的搜索功能显然很糟糕，因为我没有运气回答这个基本问题:HowareresourcesstoredintheEXE/DLL?AsUNICODE(UCS-2,Windowsnativeinternalcharacterformat),orasmultibytecharactersusingthecode-pageoftheresourcesblock?如何将UNICODE字符串嵌入到资源(.rc)中？能否从VS2012中将UNICODE(UCS-2)文本插入到语言字符串中？Windows仍在使用UCS-2，还是在内部使用UTF16？我

译为 amp section UNICODE noreferrer c++winapi dll resources rc

c++ - 如何将 unicode 字符与 boost::spirit 匹配？

如何使用boost::spirit匹配utf8unicode字符？比如我要识别这个字符串中的所有字符:$echo"Наберегупустынныхволн"|./a.outНаберегупустынныхволн当我尝试这个简单的boost::spirit程序时，它无法正确匹配unicode字符:#include#include#includenamespaceqi=boost::spirit::qi;intmain(){std::cin.unsetf(std::ios::skipws);boost::spirit::istream_iteratorbegin(std::cin);

amp unicode lt gt boost c++parsing boost-spirit

c++ - 在 unicode C++ 应用程序中解析命令行参数

如果应用程序是unicode，我如何解析作为命令行参数传递给应用程序的整数？Unicode应用有一个像这样的main:int_tmain(intargc,_TCHAR*argv[])argv[?]是一个wchar_t*。这意味着我不能使用atoi。如何将其转换为整数？stringstream是最佳选择吗？最佳答案如果你有一个TCHAR数组或一个指向它开头的指针，你可以使用std::basic_istringstream来处理它:std::basic_istringstreamss(argv[x]);intnumber;ss>>n

amp 43 section code TCHAR c++command-line unicode

c++ - UTF8 字符是否有分隔符字节？

如果我有一个包含UTF8内容的字节数组，我将如何解析它？是否有分隔符字节，我可以将其拆分以获得每个字符？最佳答案看看这里...http://en.wikipedia.org/wiki/UTF-8如果您想要识别字符之间的边界，您需要的是“描述”中的表格。获得高位零的唯一方法是使用单个字节编码的ASCII子集0..127。所有非ASCII代码点都从第二个字节开始，最高两位为“10”。代码点的前导字节从来没有-它的高位表示字节数，但有一些冗余-你同样可以观察下一个没有“10”的字节来指示下一个代码点。0xxxxxxx:ASCII10x

amp 43 section code 高位 c++unicode utf-8

c++ - 是否有免费的解析器生成器可以生成 C++ 代码并正确处理 Unicode？

询问后thisquestion，我现在尝试使用解析器生成器，而在此之前我要手动编写东西。但是，我似乎找不到任何生成C++代码的解析器，也找不到正确处理Unicode的解析器。(请注意，我的输入是在UCS-2中——如果这会使构建解析器更加困难，我不关心支持基本多语言平面之外的位)有些解析器可以生成C，但这些解析器似乎都将异常安全抛到了窗外，这会阻止我在任何语义操作中使用C++。是否存在满足这两个原则的解析器生成器，还是我必须手动完成所有操作？编辑:哦，我的项目是BSL许可的，所以对解析器生成器本身的输出的使用没有太多限制。最佳答案

amp 生成器 section C++noreferrer c++unicode parser-generator

C++ 和 UTF8 - 为什么不直接替换 ASCII？

在我的应用程序中，由于不同的API(boost、win32、ffmpeg等)，我必须不断地在std::string和std::wstring之间转换字符串。特别是对于ffmpeg，字符串以utf8->utf16->utf8->utf16结束，只是为了打开一个文件。由于UTF8向后兼容ASCII，我认为我始终将所有字符串存储为UTF-8std::string并且仅在我转换为std::wstring时转换为std::wstring必须调用某些不寻常的函数。这工作得很好，我为utf8实现了to_lower、to_upper、iequals。但是后来我遇到了几个死胡同std::regex和常规

接替 amp code section std c++string visual-studio-2010 unicode

C++(标准)异常和 Unicode

我在处理unicode字符串时遇到了一个问题，我想使用标准异常进行一些错误报告。标准异常中包含的错误消息不是unicode。通常这对我来说不是问题，因为我可以用非unicode定义错误消息并且有足够的信息，但在这种情况下我想包括来自原始字符串的数据，这些可以是unicode。您如何处理异常中的unicode消息？您是创建自己的自定义异常类，还是从标准异常派生并将它们扩展为unicode，或者您是否有针对此问题的其他解决方案(例如“不要在异常中使用unicode”的规则)？最佳答案我认为PeterDimov在Boosterrorh

amp Unicode section message c++exception

217 218 219220221 222 223