草庐IT

utf8_encoded_str

全部标签

c++ - 如何从 std 字符串 (c_str()) 设置 char * 值不起作用

我不知道,但这对我不起作用,当我尝试从返回标准字符串的函数中设置char*值时,我得到了垃圾值:stringfoo(){stringtmp="dummyvalue";returntmp;}char*cc=(char*)foo().c_str();//ifiremovethecastingimgettingerror//wheniprinttheccigetgarbageprintf("%s",cc); 最佳答案 cc指向的数据的生命周期与它来自的字符串的生命周期相同(充其量-如果您修改字符串,它甚至更短)。在你的例子中,foo()的

c++ - UTF16(例如 wide-winapi 函数所使用的)字符是否总是 2 个字节长?

请为我解释一下,UTF16是如何工作的?考虑到以下几点,我有点困惑:C++中有一个静态类型WCHAR,是2个字节长。(显然总是2个字节长)(更新:如答案所示,这个假设是错误的)。大多数msdn和其他一些文档似乎都假设字符总是2个字节长。这可能只是我的想象,我无法举出任何具体的例子,但似乎就是这样。在C++或Windows中没有广泛使用的“超宽”函数或字符类型,因此我假设UTF16是所有需要的。据我所知,unicode的字符数比65535多很多,因此它们显然没有足够的2个字节空间。UTF16似乎是UTF8的更大版本,UTF8字符可以有不同的长度。那么,如果一个UTF16字符不总是2个字节

c++ - 使用 C++ 中的 UTF-16 编码文本截断读取

我的目标是将外部输入源转换为通用的UTF-8内部编码,因为它与我使用的许多库(如RE2)兼容并且紧凑。由于我不需要使用纯ASCII进行字符串切片,因此UTF-8是我的理想格式。现在,我应该能够解码的外部输入格式包括UTF-16。为了测试C++中的UTF-16(大端或小端)读取,我将一个测试UTF-8文件转换为UTF-16LE和UTF-16BE。该文件是CSV格式的简单乱码,包含许多不同的源语言(英语、法语、日语、韩语、阿拉伯语、表情符号、泰语),以创建一个相当复杂的文件:"This","佐藤幹夫","Mêmes","친구""ภควา","كيبوردللكتابةبالعربي","ウ

c++ - 如何将 utf16 ushort 数组转换为 utf8 std::string?

目前我正在编写一个插件,它只是一个现有库的包装器。插件的主机传递给我一个utf-16格式的字符串,定义如下typedefunsignedshortPA_Unichar;并且包装库只接受一个constchar*或一个std::stringutf-8格式的字符串我试着写一个像这样的转换函数std::stringtoUtf8(constPA_Unichar*data){std::wstring_convert,char16_t>convert;returnstd::string(convert.to_bytes(static_cast(data));}但显然这不起作用,给我一个编译错误“st

已解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode bytes in position 1022-1023: unexpected end of dat

已解决使用pycharmrun运行代码正常,而debug却抛出异常UnicodeDecodeError:‘utf-8’codeccan’tdecodebytesinposition1022-1023:unexpectedendofdata,附上三种的正确解决方法,亲测有效!!!文章目录报错问题报错翻译报错原因解决方法1解决方法2解决方法3(亲测有效)千人全栈VIP答疑群联系博主帮忙解决报错报错问题粉丝群里面的一个小伙伴遇到问题跑来私信我,想用pycharmdebug,但是发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解

c++ - 使用带有 `make check` 的 Boost 单元测试框架 (UTF)

我的C++应用程序有各种基于shell的独立程序集成测试以及应用程序API的源代码单元测试。测试通过makecheck目标运行,该目标通过Autotools(autoconf、automake)生成,comewithatest-driverandalogparser.我已经开始采用Boost单元测试框架来更好地管理单元测试套件。有没有办法在makecheck目标下同时运行验收测试和单元测试(使用BoostUTF和标准TAP测试)?我的Makefile.am看起来像这样:check_PROGRAMS=test1test2SOURCES=test1.cpptest2.cppCC=g++TE

c++ - Valgrind: "Invalid read"与 c_str 和 strtod

我正在使用strtod()来转换一些输入字符串。在用valgrind检查我的代码时,我遇到了“大小为8的无效读取”。如果b以“i”或“n”开头,则会显示该消息,这就是我到目前为止所发现的。另外,如果我直接创建一个constchar*(不调用c_str()),strtod似乎也可以。这是代码:#include#includeintmain(intargc,char**argv){char*a=0;std::stringb="i";constchar*c=b.c_str();doubled=strtod(c,&a);}和(详细的)valgrind输出:==12638==Memcheck,a

c++ - Boost Spirit (X3) 符号表生成 UTF8 字符串

我正在尝试将LaTeX转义码(例如\alpha)解析为Unicode(数学)字符(即U+1D6FC)。现在这意味着我正在使用这个symbols解析器(规则):structgreek_lower_case_letters_:x3::symbols{greek_lower_case_letters_::greek_lower_case_letters_(){add("alpha",U'\u03B1');}}greek_lower_case_letter;这工作正常但意味着我得到一个std::u32string作为结果。我想要一种优雅的方式来将Unicode代码点保留在代码中(可能用于将来的

C++ memcpy 从 c_str 到 char*

我已经做了一些基本的阅读,从我收集到的内容来看,.c_str()总是有一个空终止符。我有一个相当简单的C++程序:intmain(intargc,char**argv){std::stringfrom="hello";charto[20];memcpy(to,from.c_str(),strlen(from.c_str())+1);std::coutmemcpy是否会确保我将一个以null结尾的字符串复制到我的变量中(前提是我的字符串长度较短)? 最佳答案 您应该使用std::string来复制字符串。但是,如果你想那样做,你应该使

c++ - 'std::basic_string<char,std::char_traits<char>,std::allocator<char>>::c_str':非标准语法;使用 '&' 创建指向成员的指针

我正在尝试创建一个可以读取和编译opengl顶点和片段着色器文件的函数,但是我收到了这个错误:'std::basic_string,std::allocator>::c_str':non-standardsyntax;use'&'tocreateapointertomember我不太确定如何修复它。这是我的代码:GLuintshader_load(constGLchar*vertex,constGLchar*fragment){std::stringver=file_read_all(vertex);std::stringfrag=file_read_all(fragment);con