草庐IT

utf8_unicode_cs

全部标签

php - 错误 : "Input is not proper UTF-8, indicate encoding !" using PHP's simplexml_load_string

我收到了错误:parsererror:InputisnotproperUTF-8,indicateencoding!Bytes:0xED0x6E0x2C0x20尝试使用simplexml_load_string处理XML响应时来自第3方来源。原始XML响应确实声明了内容类型:然而,XML似乎并不是真正的UTF-8。XML内容的语言是西类牙语,并且包含像Dublín这样的词。在XML中。我无法让第3方整理他们的XML。如何预处理XML并修复编码不兼容问题?有没有办法检测XML文件的正确编码? 最佳答案 您的0xED0x6E0x2C0x

php - utf8_(en|de)code 从 php7 中删除?

我最近在我的开发服务器上切换到PHP7,它运行良好-直到现在。自从我更新到PHP7.0.3-10+deb.sury.org~trusty+1(今天早些时候),utf8_decode和utf8_encode函数不再可访问。但是,它们在PHP7的早期版本中。调用时,会引发fatalerror。我读到这些函数是由mbstring扩展提供的,我检查了var_dump(extension_loaded('mbstring'));是否已加载。我怎样才能让上述功能再次工作? 最佳答案 我遇到了同样的问题。只需安装php7.0-xml包。Ubunt

java - 从其编号创建 Unicode 字符

我想在Java中显示一个Unicode字符。如果我这样做,它工作得很好:字符串符号="\u2202";符号等于“∂”。这就是我想要的。问题是我知道Unicode编号并且需要从中创建Unicode符号。我尝试了(对我而言)显而易见的事情:intc=2202;Stringsymbol="\\u"+c;但是,在这种情况下,符号等于“\u2202”。这不是我想要的。如果我知道符号的Unicode编号(但仅在运行时---我不能像第一个示例那样对其进行硬编码),我如何构造符号? 最佳答案 如果您想将UTF-16编码的代码单元作为char,您可以

java - UTF-8 和 UTF-16 的区别?

UTF-8和UTF-16的区别?为什么我们需要这些?MessageDigestmd=MessageDigest.getInstance("SHA-256");Stringtext="Thisissometext";md.update(text.getBytes("UTF-8"));//Changethisto"UTF-16"ifneededbyte[]digest=md.digest(); 最佳答案 我相信网上有很多关于这方面的好文章,但这里有一个简短的总结。UTF-8和UTF-16都是可变长度编码。但是,在UTF-8中,一个字符可

c++ - 在 Windows 控制台应用程序中输出 unicode 字符串

您好,我尝试使用iostreams将unicode字符串输出到控制台但失败了。我发现了这个:Usingunicodefontinc++consoleapp这个片段有效。SetConsoleOutputCP(CP_UTF8);wchar_ts[]=L"èéøÞǽлљΣæča";intbufferSize=WideCharToMultiByte(CP_UTF8,0,s,-1,NULL,0,NULL,NULL);char*m=newchar[bufferSize];WideCharToMultiByte(CP_UTF8,0,s,-1,m,bufferSize,NULL,NULL);wprin

c++ - C++11 中字符串文字的 Unicode 编码

关注relatedquestion,想请教一下C++11中新增的字符和字符串字面量类型。看起来我们现在有四种字符和五种字符串文字。字符类型:chara='\x30';//character,nosemanticswchar_tb=L'\xFFEF';//widecharacter,nosemanticschar16_tc=u'\u00F6';//16-bit,assumedUTF16?char32_td=U'\U0010FFFF';//32-bit,assumedUCS-4还有字符串字面量:charA[]="Hello\x0A";//bytestring,"narrowencoding

c++ - C++ 中的 Unicode 处理

C++中Unicode处理的最佳实践是什么? 最佳答案 使用ICU用于处理您的数据(或类似的库)在您自己的数据存储中,确保所有内容都以相同的编码存储确保您始终将unicode库用于字符串长度、大小写状态等普通任务。切勿使用像is_alpha这样的标准库内置函数,除非这是您想要的定义。我说的还不够:如果您关心正确性,永远不要遍历string的索引,始终使用您的unicode库。 关于c++-C++中的Unicode处理,我们在StackOverflow上找到一个类似的问题:

c++ - 如何在 C++ (Unicode) 中将 std::string 转换为 LPCWSTR

我正在寻找将std::string转换为LPCWSTR的方法或代码片段 最佳答案 该解决方案实际上比其他任何建议都容易得多:std::wstringstemp=std::wstring(s.begin(),s.end());LPCWSTRsw=stemp.c_str();最重要的是,它独立于平台。 关于c++-如何在C++(Unicode)中将std::string转换为LPCWSTR,我们在StackOverflow上找到一个类似的问题: https://s

iphone - 如何在我的 Objective-C 源代码中转义 Unicode 字符?

问这个问题我觉得非常愚蠢,但文档和谷歌根本没有给我任何爱。我有一个Unicode字符,我想在我的iPhone应用程序的源代码中插入字符串文字。我知道它的十六进制值。使用什么正确的转义序列?就此而言,我忽略了哪些明显的信息来源会告诉我这一点? 最佳答案 例子:NSString*stuff=@"TheGreekletterBetalookslikethis:\u03b2,andtheemojiforbookslookslikethis:\U0001F4DA"; 关于iphone-如何在我的O

python - 如何检查字符串是 unicode 还是 ascii?

我必须在Python中做什么才能确定字符串具有哪种编码? 最佳答案 在Python3中,所有字符串都是Unicode字符序列。有一个bytes类型保存原始字节。在Python2中,字符串可以是str类型或unicode类型。您可以使用类似这样的代码来判断哪个:defwhatisthis(s):ifisinstance(s,str):print"ordinarystring"elifisinstance(s,unicode):print"unicodestring"else:print"notastring"这不区分“Unicode或