8859

xml - XML 中的 UTF-8 或 ISO-8859-1

我们有一个应用程序，它将用户输入的文本字符串输入到Web表单中，并将其打包为XML。只是为了稍微混淆一下，XML作为Outlook电子邮件消息的正文发送。因为用户几乎可以将任何内容粘贴到Web表单中(通常来自Word)，文本字符串可以包含非ASCII(7位)字符，例如用于左双引号和右双引号的字符。该字符串通过电子邮件原封不动地传输，但是当我们使用MicrosoftXML解析器时，它会(非常正确地)提示XML包含无效字符。快速修复是将encoding="iso-8859-1"放在header中。但是，我想知道一开始就以真正的UTF-8格式对XML文件进行编码是否会更好，因为我读过的文章指

c# - 为什么我不能将 XDocument XDeclaration 编码类型设置为 iso-8859-1？

为什么下面的代码没有设置XML声明编码类型？它总是将编码设置为utf-16。我是否漏掉了一些非常明显的东西？varxdoc=newXDocument(newXDeclaration("1.0","iso-8859-1",null),newXElement("root",""));输出: 最佳答案请参阅有关指定TextWriter编码的答案。顺便说一句:ISO-8859-1是字符集，而不是编码。Unicode也是一个字符集，但是UTF-16是将Unicode字符集编码成一个字节序列。您不能将文档的编码指定为ISO-8859-1，就像

c#XDeclaration code section 34 xml encoding linq-to-xml

windows - 有没有工具可以在 Windows 上将 UTF-8 文件名批量转换回 ISO-8859-1？

我从远程FTP服务器的多个子目录中下载了很多文件，问题是这些文件具有非拉丁文件名，并且它们下载时带有奇怪的字符，例如:Ã«,Ã,Ã¬,Ã¹,Ã和ط§ظ„ظ…ط±有没有办法将这些文件名恢复到原来的名称？也许使用基于Windows的批处理工具？谢谢!附言我这样做只是为了将具有正确名称的文件上传到新服务器。最佳答案在PowerShell中:Get-ChildItem|ForEach-Object{$filename=Split-Path-Leaf$_$new=[Text.Encoding]::Utf8.GetString([Text.

UTF-8 windows section code stackoverflow unicode character-encoding filenames

java - Windows 上的 UTF-8/ISO-8859-1 编码问题 --> Unix

我编写了一个程序来处理瑞典语字母åä和ö。我是在Windows计算机上编写的，一切都运行良好。但是当我尝试在Unix中运行该程序时，瑞典字母不显示，并且该程序在处理瑞典字母时不起作用。顺便说一下，它是在Java中。有什么想法可以在Unix上运行吗？最佳答案你应该使用编码之类的东西FileInputStream(file.getAbsolutePath()),fileEncoding)其中fileEncodig=="UTF-8"或其他编码，对于添加-Dfile.encoding=UTF-8系统属性或以编程方式也很有用System.

Windows java code section 瑞典 unix utf-8 iso-8859-1

python - aspell dict make on windows : iso-8859-1. cset 无法打开阅读

我已经在Windows上使用mingw64和msys编译了aspell以与enchant和pyenchant一起使用，但我仍然没有任何指令:“aspelldumpdicts”不返回任何内容。我现在正在尝试的是使用从http://gnu.c3sl.ufpr.br/ftp/aspell/dict/en/获得的endict执行./configure、make和makeinstall..configure执行成功，但make返回:/mingw/bin/prezip-bin.exe-d我已经检查了这个文件(iso-8859-1.cset)的权限，停用了防病毒软件，以管理权限执行了msys，但没有

windows python aspell code noreferrer dictionary mingw

C# HtmlEncode - ISO-8859-1 实体名称与数字

根据以下table对于ISO-8859-1标准，似乎有一个实体名称和一个实体编号与每个保留的HTML字符相关联。例如，对于字符é:实体名称:é实体编号:é类似地，对于字符>:实体名称:>实体编号:>对于给定的字符串，HttpUtility.HtmlEncode返回一个HTML编码的字符串，但我不知道它是如何工作的。这就是我的意思:Console.WriteLine(HtmlEncode("é>"));//Outputsé>它似乎对é字符使用实体编号，但对>字符使用实体名称。那么HtmlEncode方法真的适用于ISO-8859-1标准吗？如果是这样，为什么它有时使用实体

C#HtmlEncode code output section .net string encoding iso

c# - 如何将字符串转换为 "iso-8859-1"？

如何将UTF-8字符串转换为ISO-8859-1字符串？最佳答案尝试:System.Text.Encodingiso_8859_1=System.Text.Encoding.GetEncoding("iso-8859-1");System.Text.Encodingutf_8=System.Text.Encoding.UTF8;//Unicodestring.strings_unicode="abcéabc";//ConverttoISO-8859-1bytes.byte[]isoBytes=iso_8859_1.GetByte

c#amp section Encoding 8859 asp.net

c# - System.Text.Encoding.GetEncoding ("iso-8859-1") 抛出 PlatformNotSupportedException？

看题目，注意这个问题只适用于.NETcompact框架。这发生在WindowsMobile6ProfessionalSDK附带的模拟器以及我的英语HTCTouchPro(所有.NETCF3.5)上。iso-8859-1代表西欧(ISO)，这可能是除us-ascii之外最重要的编码(至少在usenet帖子数量上是这样)。我很难理解为什么不支持这种编码，而支持以下编码(同样在模拟器和我的HTC上):iso-8859-2(中欧(ISO))iso-8859-3(拉丁语3(ISO))iso-8859-4(波罗的海(ISO))iso-8859-5(西里尔字母(ISO))iso-8859-7(希腊语

c#PlatformNotSupportedException section 8859 希腊语 .net compact-framework

c# - 使用 .NET 如何将包含 Latin-1 重音字符的 ISO 8859-1 编码文本文件转换为 UTF-8

我正在发送保存在ISO88591-1中的文本文件包含来自Latin-1范围的重音字符(以及正常的ASCIIa-z等)的格式。如何将这些文件转换为UTF-8使用C#以便ISO8859-1中的单字节重音字符成为有效的UTF-8字符？我尝试使用带有ASCIIEncoding的StreamReader，然后通过实例化编码ascii和编码utf8然后使用将ASCII字符串转换为UTF-8Encoding.Convert(ascii,utf8,ascii.GetBytes(asciiString))—但重音字符呈现为问号。我错过了什么步骤？最佳答案

c#UTF-8 code Encoding System iso-8859-1 latin1

javascript - Jquery 忽略编码 ISO-8859-1

我有一个网站显然从字符串中删除了正确的编码(ISO-8859-1)并将其发送错误。我在我的HTML中指定了这种编码我通过加载我的javascript我像这样通过JQueryAjax请求发送信息(带有德语特殊字符“ö”和“ä”):$.ajax({url:'..',type:'POST',contentType:'application/xml;charset=ISO-8859-1',data:xmlRequest.html(),...这被翻译成一个请求，在chrome开发者工具中，我在请求header中看到了这个:..Content-Type:application/xml;charse

javascript Jquery section code charset character-encoding content-type iso-8859-1

123 4 5