Utf-8

使用 chcp 65001 打印的 Windows UTF-8 - 字符神秘地重复

这是我无法理解的一件事:我正在使用Windows7和StrawberryPerl5.20，我想使用chcp65001将UTF-8写入控制台(cmd.exe)。UTF-8字符本身运行良好，甚至>255，但某些字符存在神秘的重复(只有当我不重定向到文件中时才会发生这种情况)编辑:我现在在last-octet-repeated-when-my-perl-program-outputs-a-utf-8看到了另一篇有基本相同问题的帖子。--解决方案是将binmode(STDOUT,'unix:encoding(utf8):crlf')注入(inject)到perl程序中--我已经测试过，现在可以

R、Windows 和外语字符

这一直是R的一个长期问题:它可以在Unix上读取非拉丁字符，但我无法在Windows上读取它们。这些年来，我已经在几台英文版Windows机器上重现了这个程序。我试过更改Windows和许多其他本地化设置，但没有任何效果。有没有人真正能够在Windows上读取外国文本文件？我认为能够读/写/显示unicode是程序的一个非常漂亮的功能。环境:>Sys.getlocale()[1]"LC_COLLATE=English_UnitedStates.1252;LC_CTYPE=English_UnitedStates.1252;LC_MONETARY=English_UnitedStates

Windows 和 code 34 section r utf-8 character-encoding

windows - Wso2-devstudio 导出汽车文件使用UTF8编码出错

在尝试通过wso2-devstudion从复合应用程序项目导出.car文件之前，我遇到了以下问题。这是错误日志中的错误:"!MESSAGEAnerroroccuredwhilecreatingthecarbonarchivefile!STACK0org.apache.axiom.om.OMException:com.ctc.wstx.exc.WstxIOException:InvalidUTF-8middlebyte0xce(atchar#822,byte#37)"所以问题出在其中一项代理服务“信封请求”中使用了非拉丁字符。在Windows7(x64)下。

Wso2-devstudio devstudio section code stackoverflow windows utf-8 wso2 wso2-esb

c - UTF-8 文本到剪贴板 C

我一直在寻找如何带一个字符串，constchar*output="ヽ(⌐■_■)ノ♪♬";到剪贴板。SetClipboardData(CF_UNICODETEXT,hMem);我已经尝试过MultiByteToWideChar，但我得到的只是噪音，还有相互矛盾的说法，即您无法将UTF-16LE保存到剪贴板(wchar_t)。老实说，我只是很困惑。最好有说明或代码示例。最佳答案 Windows使用UTF-16LE。该字符串应使用L前缀创建。要使用UTF8，您可以使用u8前缀声明字符串。例如:constchar*text=u8"ヽ(⌐

UTF-8 剪贴 code section wchar_t c windows unicode clipboard

json - R 不显示来自 json 源的特殊字符

稍微介绍一下背景。我从提供公共(public)交通数据的API中提取数据。它以json格式返回结果，我使用库“jsonlite”对其进行处理。resp问题是，结果中没有特殊字符。我在WindowsServer2012机器上工作，我在R中的语言设置如下所示:>Sys.getlocale()[1]"LC_COLLATE=German_Germany.1252;LC_CTYPE=German_Germany.1252;LC_MONETARY=German_Germany.1252;LC_NUMERIC=C;LC_TIME=German_Germany.1252"例子:>df$directio

json 不显示 34 section code r windows utf-8 jsonlite

windows - Unicode/非 Unicode/UTF-8 问题

我正在处理的应用程序将数据存储在INI文件中。该应用程序创建INI文件，该文件将由我们创建的另一个应用程序读取。INI文件也可以手动编辑。INI文件可能迟早会包含不同的语言，因此我们小心翼翼地确保该文件中使用的所有数据均为unicode格式。最初创建INI文件后，我们在记事本中检查了该文件，发现字母间距被搞砸了。经过一些研究，我们发现了Unicode字节顺序标记(BOM)FFFE并在文件的开头开始编写它，一切似乎都很好-文件已正确创建并且可以手动编辑在记事本中。现在是问题-我们一直在寻找INI文件解析器，而不是创建我们自己的解析器。BoostpropertyTree看起来很理想，但BO

Unicode windows section INI UTF-8 mfc

windows - 为什么在 eclipse 上调试时 gtk+ 说 "invalid utf-8"？

我一直在eclipse中创建一个gtk+应用程序。在代码中的某个位置，使用类似于gtk+helloworld的代码显示警告对话框。当我运行这个程序时，对话最终会按预期显示“单词”的内容，但是当我关闭对话时程序崩溃了。我是c的新手，所以我用调试运行了程序，希望能找到一些简单的错误。但是，当我使用调试运行时，对话显示“单词”前面有许多空字符并记录了消息。Pango-WARNING**:InvalidUTF-8stringpassedtopango_layout_set_text()这个新问题令人困惑，更令人困惑的是，程序在对话关闭时也没有崩溃。综上所述，当我运行代码时，文本没问题，程序崩溃

amp 上调 answerBuffer code section windows eclipse debugging utf-8 gtk

java - 将字符串从 EBCDIC 转换为 Unicode/UTF8

我可以从Java发送消息至WebsphereMQ在AS400.如果我从WinXP发送消息,如果我使用任何可访问的Locale都没有区别，包括完整的语言本地化；英文也没有问题Locale.正确编码的重要之处仅在于此代码行:msgId.characterSet=1208;不幸的是，它是无效的。我想从MQQueue中获取消息的情况有所不同.如果我收到来自MQQueue的消息从Windows操作系统(没有任何语言包的英语)，我能够从MQQueue获取消息在String表格。如果Windows操作系统完全本地化并包含某些语言包，我将收到异常Exceptionoccuredwhiletomessa

Unicode EBCDIC code section MQEnvironment java windows encode ibm-mq

MySQL UTF8 Windows 导出 - Linux 导入

我有MySQL数据库版本5.1.36，它随WAMP安装一起提供。我将它用于WindowsXPSP3上的开发目的，其中包含一些数据，这些数据是cyrillic，并且所有这些表/列的排序规则都设置为utf8_general_ci.现在是时候将该数据库移动到DebianLenny上的伪生产环境中了。这里的MySQL版本是5.0.51a。我尝试了以下方法:我从Windows上的phpmyadmin导出了包含数据的数据库并保存了.sql文件格式为UTF8。然后，我通过WinSCP(默认和二进制传输设置)将其传输到Linux机器。我通过命令行创建了数据库:mysqladmin-uroot-pcre

Windows MySQL code section utf8_general_ci linux utf-8

c++ - 为 boost::locale::conv 中的函数获取用户的代码页名称

手头的任务我在Windows上从UTF-8编码的XML解析文件名。我需要将该文件名传递给一个我无法更改的函数。在内部它使用_fsopen()不支持Unicode字符串。当前方法我目前的方法是将文件名转换为用户的字符集，希望文件名可以用该编码表示。然后我使用boost::locale::conv::from_utf()从UTF-8转换，我使用boost::locale::util::get_system_locale()获取当前语言环境的名称。生活美好吗？我在德语系统上使用代码页Windows-1252因此get_system_locale()正确地产生了de_DE.windows-12

amp locale code std string c++windows utf-8 codepages boost-locale

34 35 363738 39 40