草庐IT

text-to-html

全部标签

python - 下载没有 Python unicode 错误的 html

我正在尝试将page_source下载到文件中。但是,每次我得到:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc2(orsomethingelse)inposition8304:ordinalnotinrange(128)我试过使用value.encode('utf-8'),但似乎每次它都会抛出相同的异常(除了手动尝试替换每个非ascii字符之外).有没有办法“预处理”html以将其转换为“可写”格式? 最佳答案 有第三方库如BeautifulSoup和lxml可以自动处理编码问题

c# - 使用 LINQ to XML 的函数构造中的条件

我正在尝试构建一个XML文件,该文件读取要放入列表中的内容:ListtrashFoods当我创建XML文件时,它将是这样的:XDocumentdoc=newXDocument(newXDeclaration("1.0","utf-8","yes"),newXComment(""),newXElement("Snacks",trashFoods.Select(snack=>newXElement("Type",snack.Type),newXElement("Name",snack.Name)),)我想做但我做不到的是将条件语句放入XML文件的结构中。类似这样:XDocumentdoc=

java - Java 中的撒克逊语 : XSLT for CSV to XML

主要从这个问题继续:XSLT:CSV(orFlatFile,orPlainText)toXML所以,我从这里得到了一个XSLT:http://andrewjwelch.com/code/xslt/csv/csv-to-xml_v2.html并将CSV文件转换为XML文档。它在命令行上与以下命令一起使用时执行此操作:java-jarsaxon9he.jar-xsl:csv-to-xml.csv-it:main-o:output.xml所以现在问题变成了:我如何在我的Java代码中执行此操作?现在我的代码看起来像这样:TransformerFactorytransformerFactory

html - 这是什么数据格式?

我正在检查一个股票交易网站的AJAX响应,下面是它在XHR部分的Firebug响应选项卡中显示的内容。谁能解释一下这是什么格式以及它是如何解析的? 最佳答案 我认为我们在这里处理的是某种专有格式,可能是某种EldrichtSGML恐怖格式。银行业普遍存在各种Eldricht恐怖事件。相关说明,这非常不是XML。编辑:快速分析*表明这是一种格式,由一系列由括起来的语句组成;用=分隔的语句部分或v=.=似乎表示控制语句的参数,由两个字母的代码表示。(),而v=似乎表示某种分配或耦合(“值”的缩写?),或者可能只是一个字段分隔符。似乎是“

html - 如何将所有 "LF"字符转换为 "<br/>"标签并显示在 HTML 页面上

如何转换所有LF字符到标记并将其显示在HTML页面上?我有以下示例XML文件:Line1Line2Line3Line4Line5Line6我想在HTML页面上显示所有行。为此,我使用以下XSLT转换:当我在Firefox中打开该XML文件时(我使用浏览器显示XSLT转换)我将看到该结果:Line1Line2Line3Line4Line5Line6如您所见,LF字符未被替换标签。但是当我使用其他字符串时,例如EOL:EOL我会看到预期的结果:EOLLine1EOLLine2EOLLine3EOLLine4EOLLine5EOLLine6EOL问题在于转换/显示标签。

java - 使用绑定(bind)创建对象 <xsd :any> to xml is giving null?

我正在尝试使用从xml文件到从模式文件xsd生成的类的绑定(bind)数据来创建对象,但它给出的是null。这是我的xsd,我从中生成了我的java类:我的XML文件:JohnIndiasteve这里是我的代码,它试图将xml数据绑定(bind)到java对象,但给出null:Filefile=newFile("D:\\file.xml");JAXBContextjaxbContext=JAXBContext.newInstance("com.jaxb.xmlbinding");UnmarshallerjaxbUnmarshaller=jaxbContext.createUnmarsh

c# - 要在 HTML 控件中显示的 XML 元素中的空格

我正在使用C#3.5。我有一个传递给XslCompiledTransform对象的XML字符串。然后我在WebBrowser中显示输出。除了XML元素包含我需要在WinFormsHTML浏览器中显示的额外空间外,一切都很好。我不能在html中使用任何javascript。这是一个示例XML元素:Hereiswhereextraspacesneedtoberetained我尝试用" "替换字符串"",但这使得XslCompiledTransform对象用来转换的xml无效(XML无效)。然后我尝试用" "替换“”,但随后文本 出现在我的html中而不是空格。我怎样才能让

c# - XElement 的 Linq to xml 部分

我正在使用LinqtoXML将列表保存到XML字符串中。我要获取的xml字符串:xxx23yyy25C#代码:ListpeopleList=newList();peopleList.Add(newPeoples(){Name="xxx",Age=23});peopleList.Add(newPeoples(){Name="yyy",Age=25});varpeople(fromiteminpeopleListselectnewXElement("people",newXAttribute("name",item.Name),newXAttribute("age",item.Age)))

html - 为我的 RSS 提要提供图像缩略图

我想要显示我的RSS提要中的图像,这样如果提要被引入Facebook,我的页面就会显示图像。这是我的RSS提要:Titlewww.website.comwww.website.com/1/Description我是否添加然后将URL粘贴进去?或者我应该使用?我不希望图像成为主要内容,而是将其显示为缩略图预览,就像在Facebook上共享网页时一样。 最佳答案 要在RSS中包含图像,您有两种标记项目的选项。转换img转义HTML实体的标签:<imgsrc="http://example.com/path/to/image">

c# - RichTextBox 中的 HTML 格式

我一直在处理从XML文件中获取的HTML字符串。我试图找出一种方法来在带有格式的richtextbox中显示这些字符串。所以例如ThisisaHTMLstringfromtheXMLfile或Thisisourresponse应该像这样显示在富文本框中:这是XML文件中的HTML字符串这是我们的回应我不太确定该怎么做。而且我不太确定WebBrowser类在这里如何工作,因为HTML字符串是独立的,不会形成完整的HTML文件。此外,我需要一种方法来反转格式(HTML编码),一旦在richtextbox中进行了任何更改,因为它们将被写回XML文件。我有办法实现这个目标吗?我真的需要帮助。我