草庐IT

utf8_unicode_cs

全部标签

xml - 将 UTF8 数据导出到 Excel 的最佳方法是什么?

所以我们有这个支持UTF8数据的网络应用程序。万岁UTF8。我们可以毫无问题地将用户提供的数据导出到CSV中——此时它仍然是UTF8格式。问题是,当您在Excel中打开典型的UTF8CSV文件时,它会将其读取为ANSII编码文本,并相应地尝试将ø和ü等双字节字符读取为两个单独的字符,但您最终会失败。所以我做了一些挖掘(Intervals的人有一个有趣的帖子aboutithere),并且有一些有限但非常烦人的选项。其中:提供Excel可以正确解释但不支持多行数据的UTF-16LittleEndianTSV文件使用Excelmime类型或文件扩展名提供HTML表格中的数据(不确定此选项是否

c++ - 你如何从 unicode 值中推断出字符集?

现在我可以获取unicode值,我必须在调用unicode值之前获取它的字符集HFONTCreateFont(intnHeight,//heightoffontintnWidth,//averagecharacterwidthintnEscapement,//angleofescapementintnOrientation,//base-lineorientationangleintfnWeight,//fontweightDWORDfdwItalic,//italicattributeoptionDWORDfdwUnderline,//underlineattributeoption

windows - 为什么 git rebase 说 "fatal: cannot convert etf8 to utf8"?

我在一台Windows机器上使用git,我正在尝试将它与cygwin终端和GitBash一起使用。当我尝试将主题分支rebase为master时,出现以下神秘错误:☻~/code/project$gitrebasemasterFirst,rewindingheadtoreplayyourworkontopofit...fatal:cannotconvertfrometf8toutf8这是什么意思,我该如何解决?Google对此给出了零结果。我的语言环境是en_US.UTF-8,但我没有任何LC环境变量。~$env|grepLC~$env|grepLANGLANG=en_US.UTF-8

c - 使用 win32 和 C 从 WDK 驱动程序中的 UNICODE_STRING 中提取路径名组件

我正在尝试分隔UNICODE_STRING路径名的组成部分,以便创建从设备根到文件叶的目录树。这需要在WDK驱动程序中完成。我需要使用ZwCreateFile()一次构建一个目录结构,因为它只能在一次调用中创建最终目录或叶,而不是整个路径。很抱歉向你们C工程师提出这样一个简单的问题,但我无法理解它并在驱动程序中使用它。我目前的方法是将UNICODE_STRING转换为char并使用strtok_s()函数将路径名分解为其组件目录和文件。我想用charstring1[]="\\Device\\HarddiskVolume";charseps[]="\\";char*token1=NULL

c++ - 通过c++在windows和linux上读取UTF8文件

我有一些使用UTF-8编码的文本文件。有没有办法使用C++流类(例如wifstream)读取它们?我看过一些外部引用,比如boost和一些codeproject代码片段。但是,我不想仅将其用于此目的。在Linux上,它通过调用imbue(std::locale("en_US"))以某种方式工作,但在Windows上不行。我认为问题在于窗口假定wifstream是UTF-16编码流。我不能以某种方式使用wifstream类指定unicode编码,以便它使用UTF-8而不是UTF-16吗? 最佳答案 除了正常地从文件中读取字节并将它们视

c# - 如何在 C# 中转义 unicode 字符串

我有一个来自文本文件的Unicode字符串。我想展示真实的性格。例如:\u8ba1\u7b97\u673a\u2022\u7f51\u7edc\u2022\u6280\u672f\u7c7b当从文本文件中读取这个字符串时,使用StreamReader.ReadToLine(),它会将\转义为'\\',例如"\\u8ba1",这是不需要的。它将显示与文本相同的Unicode字符串。我想要的是显示真实的角色。如何将结果字符串中的"\\u8ba1"更改为"\u8ba1"。还是应该使用另一个Reader来读取字符串? 最佳答案 如果你有这样

c# - Content-Disposition header 中的 Unicode

我正在使用在HttpHandlerchild中实现的HttpContext对象来下载文件,当我在文件名中包含非ascii字符时,它在IE中看起来很奇怪,而在Firefox中看起来很好。下面是代码:-context.Response.ContentType=".cs";context.Response.AppendHeader("Content-Length",data.Length.ToString());context.Response.AppendHeader("Content-Disposition",String.Format("attachment;filename={0}"

c# - ASP.NET - 无法将索引 YYY 处的 Unicode 字符 XXX 转换为指定的代码页

在ASP.NET4网站上,我在尝试将数据从数据库加载到GridView时遇到以下错误。无法将索引49处的Unicode字符\uD83D转换为指定的代码页。我发现当数据行包含以下内容时会发生这种情况:文字文字文字??据我所知,此文本无法翻译成有效的utf-8响应。真的是这个原因吗?有没有办法在将文本加载到gridview之前清理文本以防止此类错误?更新:我有一些进步我发现只有在对字符串使用Substring方法时才会出现此错误。(我正在使用子字符串向用户显示部分文本作为预览)。例如在ASP.NETWeb表单中我这样做:Stringtxt=test??;//txtstringcanalso

php - 标记为 UTF-16 的文档但在 Entity PHP 错误中包含 UTF-8 内容

我最近将我的网站从PHP5.2转移到了PHP5.3。我已经安装了一个身份验证模块,该模块之前运行良好但现在出现错误DocumentlabelledUTF-16buthasUTF-8contentinEntity我曾尝试用UTF-16替换所有出现的UTF-8,但这没有帮助。此错误的可能解决方案/原因是什么? 最佳答案 看这个:http://forums.devshed.com/php-development-5/document-labelled-utf-16-but-has-utf-8-content-694388.html此链接中

php - 生成 PHP SimpleXML RSS 提要时出现 UTF8 错误

我正在为站点创建RSS提要。我正在使用SimpleXML创建XML结构。当我调用$xml->asXML();时,它会抛出许多警告:ErrorException[Warning]:SimpleXMLElement::asXML()[simplexmlelement.asxml]:stringisnotinUTF-8我不确定这个错误是什么。它正在读取的数据库表是utf8_general_ci。我尝试在字符串上运行utf_encode,这弄乱了字符串而不是修复它。//FirstcreatetheXMLroot$xml=newSimpleXMLElement('');//CreatetheCh