Unicode

ReportLab- Unicode字符以框中的框出现在Unicode支持的字体中

试图通过Python3使用ReportLab来编写一个包括MACRON（āēīōTo）在内的文档，但Macrons显示为框（■）。该文档是用Arial字体编写的-但是，如果我在文字处理器中打开文件以检查字体，则框在“SegoeUI符号”字体中。在Arial中导入作为支持广泛的Unicode字符（似乎有效的字体）的字体：importreportlab.rl_configreportlab.rl_config.warnOnMissingFontGlyphs=0fromreportlab.pdfbaseimportpdfmetricsfromreportlab.pdfbase.ttfontsimpo

c++ - 将 wchar_t* 转换为 UTF-16 字符串

我需要一个C++代码来将wchar_t*中给出的字符串转换为UTF-16字符串。它必须在Windows和Linux上都能工作。我在搜索过程中浏览了很多网页，但我仍然不清楚主题。据我所知，我需要:使用LC_TYPE和UTF-16编码调用setlocale。使用wcstombs将wchar_t转换为UTF-16字符串。调用setlocale恢复之前的语言环境。您知道我可以将wchar_t*以可移植的方式(Windows和Linux)转换为UTF-16的方法吗？最佳答案在C++03中没有单一的跨平台方法(不是没有库)。这部分是因为wc

amp wchar_t code section c++c unicode utf-16 wchar-t

c++ - C++ 标准是否要求对 wchar_t 进行编码？

以下是我的2014草案标准N4140的一些摘录22.5Standardcodeconversionfacets[locale.stdcvt]3Foreachofthethreecodeconversionfacetscodecvt_utf8,codecvt_utf16,andcodecvt_utf8_utf16:(3.1)—Elemisthewide-charactertype,suchaswchar_t,char16_t,orchar32_t.4Forthefacetcodecvt_utf8:(4.1)—ThefacetshallconvertbetweenUTF-8multibyt

amp 43 code wchar_t wchar c++c++11 unicode wchar-t

c++ - C++中的Unicode字符串索引

我来自python，您可以在其中使用“string[10]”按顺序访问字符。如果字符串是用Unicode编码的，它会给我预期的结果。但是，当我在C++中对字符串使用索引时，只要字符是ASCII，它就可以工作，但是当我在字符串中使用Unicode字符并使用索引时，在输出中我将得到一个八进制表示形式，如/201。例如:stringramp="ÐðŁłŠšÝýÞþŽž";cout输出:ÐðŁłŠšÝýÞþŽž/201为什么会发生这种情况？如何访问字符串表示形式中的该字符，或者如何将八进制表示形式转换为实际字符？最佳答案标准C++不具备

amp 43 code Unicode C++c++string

c++ - Microsoft 使用什么作为 Unicode 字符串的数据类型？

我在学习C++的过程中偶然发现了一篇关于MSDN的文章:http://msdn.microsoft.com/en-us/magazine/dd861344.aspx在第一个代码示例中，与我的问题相关的一行代码如下:VERIFY(SetWindowText(L"Direct2DSample"));更具体地说是L前缀。我读了一点书，如果我错了请纠正我:-)，但这是为了允许使用unicode字符串，即为长字符集做准备。现在，在我阅读这篇文章的过程中，我在这里看到了另一篇关于C中高级字符串技术的文章http://www.flipcode.com/archives/Advanced_String

amp Microsoft code section pre c++unicode atl wtl

c++ - UTF16(例如 wide-winapi 函数所使用的)字符是否总是 2 个字节长？

请为我解释一下，UTF16是如何工作的？考虑到以下几点，我有点困惑:C++中有一个静态类型WCHAR，是2个字节长。(显然总是2个字节长)(更新:如答案所示，这个假设是错误的)。大多数msdn和其他一些文档似乎都假设字符总是2个字节长。这可能只是我的想象，我无法举出任何具体的例子，但似乎就是这样。在C++或Windows中没有广泛使用的“超宽”函数或字符类型，因此我假设UTF16是所有需要的。据我所知，unicode的字符数比65535多很多，因此它们显然没有足够的2个字节空间。UTF16似乎是UTF8的更大版本，UTF8字符可以有不同的长度。那么，如果一个UTF16字符不总是2个字节

wide-winapi amp code Windows section c++winapi unicode utf-8 utf-16

c++ - 如何在源代码中查找所有非 Unicode 函数调用

在我的源代码中，我一直非常小心地自始至终使用Unicode，始终调用广泛版本的WinAPI函数，在我的转换中非常小心，等等，以支持我的程序的许多用户使用非英语拷贝Windows。但是错误会悄悄出现，我相信你们都能理解。我最近遇到了一次程序崩溃，在我的代码中只有一个地方，我调用函数“isspace”而不是“iswspace”。是否有某种工具可以让我扫描我的源代码以查找所有ANSI函数调用，以期找到可能存在的更多错误？谢谢。最佳答案我在一段时间前开发的软件中遇到了问题。我发现问题是由strcpy()、strcat()等各种没有保护的

何在 amp section C++的 c++winapi unicode

c++ - 将 Python 3 Unicode 转换为 std::string 的简洁方法

我使用Python2API封装了很多C++(由于各种技术原因，我不能使用swig或boost.python之类的东西)。当我必须将一个字符串(通常是一个路径，总是ASCII)传递给C/C++时，我使用这样的东西:std::stringfile_name=PyString_AsString(py_file_name);if(PyErr_Occurred())returnNULL;现在我正在考虑更新到Python3，其中PyString_*方法不存在。我找到了onesolution那说我应该做这样的事情:PyObject*bytes=PyUnicode_AsUTF8String(py_fi

简洁 amp code section python c++python-3.x

c++ - 从 C++ 中的 unicode 字符串检测语言环境

我有一个字符串，我想检查内容是英语还是印地语(我的本地语言)。我发现印地文字符的unicode范围是从U0900-U097F。查找字符串是否包含此范围内的任何字符的最简单方法是什么？我可以根据方便使用std::string或Glib::ustring。最佳答案这里是你如何用Glib::ustring做到这一点:usingGlib::ustring;ustringx("सहस");//hindistringboolis_hindi=false;for(ustring::iteratori=x.begin();i!=x.end();

amp 43 section ustring 印地 c++unicode

c++ - 如何比较宽字符 "H2Oリテイリング"和 "Ｈ2Ｏリテイリング"

我正在尝试比较一些相似的字符串，例如:比较字符串"H2Oリテイリング"和"Ｈ2Ｏリテイリング"应该返回true比较字符串"Ｏリテイリング"和"Ｈ2Ｏリテイリング"应该返回true我将通过TCHAR数组获取这些字符串。有什么方法可以比较这些类型的字符串吗？我试过逐个字符进行比较，但没有用。#defineMAX_STRING256boolIsStringsEqual(TCHAR*str1,TCHAR*str2){if(_tcscmp(str1,str2)==0)returntrue;elsereturnfalse;}int_tmain(intargc,_TCHAR*argv[]){TCHA

amp 34 MAX_STRING STRING code c++winapi unicode

67 68 697071 72 73