草庐IT

unicode_literals

全部标签

c++ - 如何用 Unicode 处理 PCRE?

我正在使用VisualStudio2010通过PCRE进行一些正则表达式匹配。假设我在std::wstring中给出了一个模式和一个主题,如下所示:std::wstringsubject=L"サービス内容";std::wstringpattern=L"ス内";如您所见,我尝试定位日语字符串,因此我需要采用PCRE的unicode变体,例如具有函数pcre16_exec或pcre32_exec的pcre16或pcre32等不幸的是,它不起作用。我的问题似乎是从wstring到unsignedshort或unsignedint的转换(取决于pcre16或pcre32)。我尝试了很多函数(w

c++ - 如何在 C++ 中读取 Cyrillic Unicode 文件?

我正在尝试从已保存为Unicode的.txt文件中读取行。我就是这样做的:wifstreaminput;stringpath="test.txt";input.imbue(locale(input.getloc(),newcodecvt_utf16));input.open(path);if(input.is_open()){wstringline;input.seekg(1,ios_base::beg);getline(input,line);}它适用于带有拉丁字符的文件。但是对于西里尔文文件,我得到的是奇怪的符号,而不是空格和相邻字符。例如:输入文件中的内容:ГосдепСШАос

c++ - Microsoft Integer Literal Extensions——记录在哪里?

我在Windows安装的标准stdint.h头文件中遇到了一些整数文字。文字具有以下形式的后缀:i8、ui8、i16、ui16、i32、ui32、i64、ui64。我以前遇到过i64形式的后缀,但从未遇到过任何其他形式的后缀。我很好奇这些扩展的记录位置。我花了一些时间查看Microsoft文档和其他文档,但找不到它们。这完全是出于好奇。我很清楚后缀是什么意思。如果有人有指向该文档的链接,如果您分享引用资料,我将不胜感激。提前致谢! 最佳答案 如果这些源自Microsoft的内在文字后缀由于弃用或其他原因而被删除,那么您可以通过C++

c++ - 在 Crypto++ 中获取 Unicode 字符串的 SHA1

我自学C++,遇到一个问题,一个多星期都解决不了。我希望你能帮助我。我需要获取Unicode字符串的SHA1摘要(如Привет),但我不知道该怎么做。我试着这样做,但它返回了错误的摘要!对于wstring('Ы')它返回-A469A61DF29A7568A6CC63318EA8741FA1CF2A7我需要-8dbe718ab1e0c4d75f7ab50fc9a53ec4f0528373问候和抱歉我的英语:).加密PP5.6.2MVC++2013#include#include"cryptopp562\cryptlib.h"#include"cryptopp562\sha.h"#inc

c++ - 从 C++ 调用 NSLog : "Format string is not a string literal (potentially insecure)"

当我从C++调用NSLog时,Xcode提示传递给NSLog的格式字符串不是文字字符串。这是触发警告的一行代码:NSLog(CFSTR("Leaking?"));我不知道有什么方法可以在C++中编写NSString文字,而且我没有看到可以在项目设置中关闭的相关警告。有没有办法在不触发此消息的情况下从C++调用NSLog?我正在使用Xcode4.2.1。编辑:这确实是C++代码。我通常避免使用Objective-C++,坚持使用Objective-C或普通的旧C++,因为没有官方文档说明什么在Objective-C++中有效,什么无效。我只发现模糊的警告(例如)STL的某些部分可能存在问

如何使Tomcat 8识别Unicode字符,例如:“文本开始”:

如何使Tomcat8识别响应中的Unicode字符?例如。“文本开始”:它应该转换为:(默认情况下,stackoverflow和WeblogicDO)。为什么tomcat不能做同样的事情?还是应该在我们用来进行呼叫的生成的Web服务客户端中配置这一点?轴1.4的萨克斯解析器发现时崩溃在响应中,Axis2至少仅返回null。我们没有多种工具可用于生成我们的Web服务客户端,因为我们使用的是SOAP消息和RPC/编码的WSDL。我将尝试这个想法,即实现HTTP客户端以将数据发送和接收到字符串:轴1.4无法应对响应.我还可以尝试使此工作工作吗?看答案Tomcat并没有特

c++ - 使用C/C++转义unicode字符

我需要将输入字符串中的Unicode字符转义为UTF-16或UTF-32转义序列。例如,输入字符串文字"Eat,drink,愛"应该转为"Eat,drink,\u611b"。以下是排序表中的规则:Escape|Unicodecodepoint'\u'HEXHEXHEXHEX|AUnicodecodepointintherangeU+0toU+FFFFinclusivecorrespondingtotheencodedhexadecimalvalue.'\U'HEXHEXHEXHEXHEXHEXHEXHEX|AUnicodecodepointintherangeU+0toU+10FFFF

c++ - 将 Unicode 转换为多字节

我有一个小问题,我想将unicode转换为多字节,有什么办法吗 最佳答案 std::stringNarrowString(conststd::wstring&str,constchar*localeName="C"){std::stringresult;result.resize(str.size());std::localeloc(localeName);std::use_facet>(loc).narrow(str.c_str(),str.c_str()+str.size(),'?',&*result.begin());retu

ReportLab- Unicode字符以框中的框出现在Unicode支持的字体中

试图通过Python3使用ReportLab来编写一个包括MACRON(āēīōTo)在内的文档,但Macrons显示为框(■)。该文档是用Arial字体编写的-但是,如果我在文字处理器中打开文件以检查字体,则框在“SegoeUI符号”字体中。在Arial中导入作为支持广泛的Unicode字符(似乎有效的字体)的字体:importreportlab.rl_configreportlab.rl_config.warnOnMissingFontGlyphs=0fromreportlab.pdfbaseimportpdfmetricsfromreportlab.pdfbase.ttfontsimpo

c++ - C++中的Unicode字符串索引

我来自python,您可以在其中使用“string[10]”按顺序访问字符。如果字符串是用Unicode编码的,它会给我预期的结果。但是,当我在C++中对字符串使用索引时,只要字符是ASCII,它就可以工作,但是当我在字符串中使用Unicode字符并使用索引时,在输出中我将得到一个八进制表示形式,如/201。例如:stringramp="ÐðŁłŠšÝýÞþŽž";cout输出:ÐðŁłŠšÝýÞþŽž/201为什么会发生这种情况?如何访问字符串表示形式中的该字符,或者如何将八进制表示形式转换为实际字符? 最佳答案 标准C++不具备