草庐IT

utf8_unicode_cs

全部标签

xml - VBA 使用 UTF-16 输出到文件

我有一个非常复杂的问题,很难正确解释。互联网上对此有很多讨论,但没有定论。非常感谢任何帮助或比我更好的解释。本质上,我只是尝试使用UTF-16和VBA编写XML文件。如果我这样做:sXML=""sXML=sXML&rest_of_xml_documentPrint#iFile,sXML然后我得到一个有效的XML文件。但是,如果我将“encoding=”更改为“utf-16”,我会从我的XML验证器中收到此错误:不支持从当前编码切换到指定编码。谷歌搜索告诉我这意味着xml编码属性与文件使用的实际编码不同,因此我必须通过打开和打印命令创建一个utf-8文档。如果我这样做:WithCreat

python - lxml 更改 Unicode 字符

我正在使用lxml读取xml文件并更改一些细节。但是运行起来发现即使只是用lxml读取文件然后再写出来,如下:fil='iTunesMusicLibrary.XML'tre=etree.parse(fil)tre.write('temp.xml')我发现Queensrÿche已转换为Queensrÿche。有人知道如何解决这个问题吗? 最佳答案 将最后一行更改为:tre.write('temp.xml',encoding='utf-8')否则lxml以ASCII编码写入XML,因此它必须转义所有非ASCII字符。

java - Track.getSimilar : An invalid XML character (Unicode: 0x3) was found in the element…

我使用last.fmAPI:ApiLast.fm我有他们的艺术家的歌曲(轨道)列表,我想恢复每首歌曲,如他的歌曲。Track.getSimilar(Artist,track,key)方法完美运行。但是当艺术家或轨道是阿拉伯语时,我得到以下异常:[FatalError]:2583:13:AninvalidXMLcharacter(Unicode:0x3)wasfoundintheelementcontentofthedocument.Exceptioninthread"main"de.umass.lastfm.CallException:org.xml.sax.SAXParseExcep

Python:如何读取和解析 unicode utf-8 文本文件?

我正在从Excel导出UTF-8文本,我想使用Python读取和解析传入的数据。我已经阅读了所有的在线信息,所以我已经尝试过了,例如:txtFile=codecs.open('halout.txt','r','utf-8')forlineintxtFile:printrepr(line)我得到的错误是:UnicodeDecodeError:'utf8'编解码器无法解码位置0中的字节0xff:意外代码字节在十六进制编辑器中查看文本文件,第一个值是FFFE我也试过:txtFile.seek(2)就在“打开”之后,但这只会导致不同的错误。 最佳答案

java - 使用 Stax 解析 XML 文件时出现 Unicode(0xb) 错误

在解析XML文件时,Stax产生错误:Unicode(0xb)error-AninvalidXMLcharacter(Unicode:0xb)wasfoundintheelementcontentofthedocument.只需单击下面带有特殊字符“VI”的xml行的链接。它不是字母字符:当您尝试将它复制并粘贴到记事本中时,您会得到它作为某种符号。我试过使用Stax解析它。它显示了上述错误。有人可以给我一个解决方案吗?提前致谢。 最佳答案 0xB(垂直制​​表符)不是XML中的有效字符。ASCII32(0x20,空格)之前的唯一有效

c# - 以 UTF8 而不是 UTF16 格式输出 DataTable XML

我有一个数据表,我正在使用.WriteXML(..)创建一个XML文件,尽管我在以UTF-16编码导出它时遇到问题,而且似乎没有明显的方法可以改变它。我了解.NET在字符串内部使用UTF-16,这是否正确?然后我运行DataTable.WriteXML()通过XSLT生成的XML,该XSLT在输出声明中包含以下内容:但是,转换的输出仍然是UTF16,而我尝试将此XML文件输入到的系统不支持UTF16。有没有办法强制输出为UTF-8? 最佳答案 结果文档的编码由encoding决定的属性指令--不是通过包含XSLT转换的XML文档的X

sql-server - 在 SQL Server 中将 UTF8 转换为 uTF16

我有一个应用程序,它从一些用PHP编写的Web服务接收XML,并将其插入到SQLServer数据库中。当我尝试插入接收到的包含波兰语变音符的XML时,我收到如下错误:XMLparsing:line2,character703,illegalxmlcharacter我试着做这样的事情:DECLARE@xmlXML;SET@xml='(hereIpastesomesampleXMLthatcontainsdiacriticalcharacters)';SELECT@xml=CAST(@xmlstrASXML);INSERTINTOvos_DirectXML_ut(ValidXML,sync

c# - 尽管以 UTF-8 编写 XML,但在 XmlElement 中转义 Unicode 字符串

对于给定的XmlElement,我需要能够将内部文本设置为Unicode字符串的转义版本,尽管文档最终以UTF-8编码。有什么办法可以实现吗?这是代码的简单版本:conststringtext="ñ";vardocument=newXmlDocument{PreserveWhitespace=true};varroot=document.CreateElement("root");root.InnerXml=text;document.AppendChild(root);varsettings=newXmlWriterSettings{Encoding=Encoding.UT

c# - 如何将 XML 注释合并回 .cs 文件?

从C#类文件中提取注释相对容易(参见ExtractingdoccommentsfromC#sourcefile),但我最近遇到了相反的问题。我的项目有一堆从XML模式(通过Microsoft的xsd.exe)生成的类。我想写出关于这些类的XML文档,但我们不得不经常重新创建它们。我希望能够写出注释,将它们提取到它们自己的.xml文件中,运行xsd.exe以从架构中重新创建类,然后将注释合并回去。有什么办法可以做到这一点吗? 最佳答案 我查看了v8.1A版SDK的xsd.exe(它是用.NET编写的,因此您可以使用JustDecomp

xml - 为什么 Qt 在加载 XML 文件时会丢失我的薄空格 unicode 字符?

我有一个XML文档,其中的一部分包含以下内容: 如果将其加载到Qt(特别是我发现此问题的QtMathML小部件)中,QDomDocument对象将丢失unicode瘦空格字符(U+2009)。此Python示例代码演示了该问题:fromPyQt4.QtXmlimport*d=QDomDocument()d.setContent(" ")printrepr(unicode(d.toString()))这段代码的输出是:u'\n\n\n'在精简空格后插入一个额外的非空格字符会阻止精简空格丢失。这是我的错误,一个XML功能,还是Qt有错误?