UTF8ToString_草庐IT

python - lxml.tostring 错误地将文本替换为 HTML 实体

我目前正在从YAML文件中获取字符串并将其转换为XML。我正在使用lxml.etree这样做并且实际上是在构建一个XML标记对于我的YAML文件中的每个值，然后使用lxml.etree.tostring()将其写出.然而，给我的文件偶尔会有HTML标签，例如。,HTML实体，例如，以及喜欢的角色&.LXML解析器当前正在将所有这些转换为HTML实体，以便变成<a>和变成 和&简单地变成&.在前两种情况下，我似乎会丢失该数据，但我似乎无法弄清楚如何告诉LXML解析器不要为我进行任何HTML实体转换。有办法做到这一点吗？

tostring python code gt section html xml lxml

sql-server - 在 SQL Server 中将 UTF8 转换为 uTF16

我有一个应用程序，它从一些用PHP编写的Web服务接收XML，并将其插入到SQLServer数据库中。当我尝试插入接收到的包含波兰语变音符的XML时，我收到如下错误:XMLparsing:line2,character703,illegalxmlcharacter我试着做这样的事情:DECLARE@xmlXML;SET@xml='(hereIpastesomesampleXMLthatcontainsdiacriticalcharacters)';SELECT@xml=CAST(@xmlstrASXML);INSERTINTOvos_DirectXML_ut(ValidXML,sync

sql-server server code section XML utf-8

.net - 使用 XmlSerializer 读取 UTF-16 编码的 XML 文件

我正在调用WebService并获取从WebMethod返回的字符串。该字符串是一个序列化为XML的对象，应使用System.Xml.XmlSerializer对其进行反序列化。我的问题是第一行表明文档是UTF-16编码的:所以当反序列化时，我得到错误:ThereisanerrorinXMLdocument(0,0).执行string.Replace("utf-16","utf-8")确实有效，但必须有一个干净的方法让XmlSerializer知道吗？最佳答案这不应该影响任何东西-以下工作正常:usingSystem;using

XmlSerializer net section 34 .net xml

java - UTF-16 编码

JaniALOKAshuTosh我的XML解析器仅支持UTF-8编码，否则它会给出SAX解析器异常。如何将UTF-16转换为UTF-8？最佳答案在那种情况下，它不是您正在使用的XML解析器，请参阅section2.2ofthexmlspecification:AllXMLprocessorsMUSTaccepttheUTF-8andUTF-16encodingsofUnicodeJavaxml解析器通常接收包装在InputSource中的输入目的。这可以用一个Reader参数来构造，该参数对给定的字符集进行字符解码。InputS

java UTF section UTF-8 InputSource xml utf-16

java - Xml如何设置UTF-16编码格式？

我需要将xml创建为要传递给服务器的字符串。我已经设法将数据转换为xml，但编码格式默认设置为utf-8。我需要的是我想将它设置为utf-16格式。但我还没有设置它的任何想法。privatevoidXmlCreation(intsize,Listitem)throwsParserConfigurationException,TransformerException{DocumentBuilderFactorydocumentBuilderFactory=DocumentBuilderFactory.newInstance();DocumentBuilderdocumentBuilder

java Xml section document appendChild xml-serialization xsd

c# - XDocument XDeclaration 未出现在 ToString 结果中

我正在尝试形成一个XML文档，我将使用它通过HTTPS将其发送到API，但是我注意到，即使我已将XDeclaration元素添加到我的XML，XDeclaration也没有出现在字符串中我返回使用xmlDoc.ToString()方法。有谁知道我是否缺少特定设置或的任何原因？元素没有出现？xmlDoc=newXDocument(newXDeclaration("1.0","UTF-8","yes"),newXElement("NABTransactMessage",newXElement("MessageInfo",newXElement("MessageID","5167813675

c#XDeclaration 34 XElement code .net xml linq-to-xml

Python: lxml.etree.tostring(with_comments=False)

我调用以下命令并得到以下错误:>>>lxml.etree.tostring([tree].getroot(),with_comments=False)ValueError:CanonlydiscardcommentsinC14Nserialisation我不知道C14N是什么，但我希望能解释一下如何实现它并使用with_comments=False运行上述命令。(是的，我知道我可以使用正则表达式去除评论。请不要提供正则表达式作为解决方案。)背景:我想通过http连接传输我的xml文档。我正在使用lxmlPython库。我在Python2.7.1上运行最佳答

with_comments comments section code python xml xml-serialization

java - Xerces UTF8Reader 中导致 MalformedByteSequenceException 的编码问题

我遇到了com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException使用XML文件。我使用调试器逐步执行Xerces代码，并缩小了发生这种情况的范围。我能够确定通过删除文档中的“智能引号”字符，文档变得可解析。文档没有DTD。Notepad++将其标记为“作为UTF-8的ANSI”。Firefox将其称为“西方”。我记得在大学里听过一次不太惊心动魄的讲座，UTF-8被设计为与单字节编码系统向后兼容。我也看到onthischart,字节序列e2809d事实上，代表“右双引号”，但即使我看不到编码问题，我

中导 MalformedByteSequenceException internal apache xerces java xml character-encoding xml-parsing

java - 如何在 javax.xml.transform.Transformer.transform 的输出中保留输入声明的编码？ (例如避免将 UTF-16 更改为 UTF-8)

假设这个输入XML编写这些代码行:StreamSourcesource=newStreamSource(newStringReader(/*theaboveXML*/));StringWriterstringWriter=newStringWriter();StreamResultstreamResult=newStreamResult(stringWriter);TransformerFactory.newInstance().newTransformer().transform(source,streamResult);returnstringWriter.getBuffer().

transform UTF-8 code section strong java xml character-encoding xslt

c# - 在 C# (.Net 3.5) 中，是否可以使用标准文字常量来代替 "utf-8"？

我想找到一个更好的方法来做到这一点:XmlNodenodeXML=xmlDoc.AppendChild(xmlDoc.CreateXmlDeclaration("1.0","utf-8",String.Empty));我不想在键入代码时考虑“utf-8”与“UTF-8”与“UTF8”与“utf8”。我想让我的代码更不容易出现拼写错误。我确信某些标准库已将"utf-8"声明为const/readonly字符串。我怎样才能找到它？另外，“1.0”呢？我假设主要的XML版本也已在某处枚举。谢谢! 最佳答案试试Encoding.UTF8.

c#section code utf-8 xml coding-style declaration