xhtml-1.0-strict

c# - 解析 XML/XHTML 文档但忽略 C# 中的错误

我正在编写一些小应用程序来解析一些网页的源代码、提取一些数据并将其保存为另一种格式。具体来说，我的一些银行不提供交易/报表的下载，但他们在其网站上提供对这些报表的访问。我做的很好，但另一个(HSBCUK)被证明是一个麻烦，因为它的源不是有效的XHTML。例如之前有空格标签，还有一些地方==使用而不是=在属性名称和它的值之间(例如)。当然，当我将此数据传递到我的XmlDocument时，它会抛出一个不稳定的(更准确地说是一个异常)。我的问题是:是否可以放宽C#中对XML解析的要求？我知道从源头上解决这些问题要好得多-这绝对也是我的态度-但汇丰银行改变他们的网站的可能性几乎为零，该网站已经

c#section code xml

c# - 将日志文件转换为 XML 和(XHTML，建议

我的任务是从我继承的测试报告工具中转换一些文本日志文件。该工具是经过编译的C#(.NET3.5)应用程序。我想将一组逻辑上连接的日志文件解析并转换为单个XML报告文件，这不是问题。System.Xml类非常易于使用。但是，我还想为每个报告创建一个更“可读”的文件。我选择了HTML，因为我喜欢标准化，所以我更愿意用适当的XHTML来做。我的问题是我应该如何创建HTML文件和XML报告？我最初的想法是构建XML文件，然后使用LINQ和一个简单的StreamWriter在我的C#代码中构建一个HTML文件。我还可以使用XSLT而不是LINQ来简化C#代码。但是因为无论如何我都必须编译它，所以

c#XHTML section 的 html xml linq

xml - 在 XPath 1.0 中选择多个节点下属性的最小/最大值

考虑以下XML结构:我想要一个XPath1.0语句来给我@x的最小值和最大值？到目前为止，我至少有以下内容://a/b/c/d[not(preceding-sibling::d/@x这很接近，但没有雪茄:-(非常感谢任何帮助!谢谢，J 最佳答案要获取最大值，请查找所有不存在较小值的属性值。如果有多个结果，取第一个-它们必须相等。(//@x[not(.对于最小值，只需替换即可通过>.出于完整性原因:如果您的XPath引擎支持XPath2.0(或更好)，只需使用max(//@x)尊重min(//@x)这可能会更快、更易读。

中选下属 34 lt gt xml xpath

html - 将 'embedded' XML 文档转换为 XSLT (1.0) 中的 CDATA 输出

给定一个像这样的输入XML文档:Thiscontainsan'embedded'HTMLdocumentHTMLDOCHelloWorld我如何提取“内部”HTML文档；将其呈现为CDATA并包含在我的输出文档中？因此输出文档将是一个HTML文档；其中包含一个将元素显示为文本的文本框(因此它将显示内部文档的“源View”)。我试过这个:但这只会渲染文本节点。我试过这个:]]>但这逃避了实际的XSLT，我得到:<xsl:value-ofselect="*"/>我试过这个:[...]这确实插入了一个CDATA部分，但输出仍然只包含文本(剥离的元素):MydocTitle:Thi

amp embedded lt gt code html xml xslt cdata

xml - 在 XSLT 1.0 中设置 24 小时制格式的最佳方式是什么？

我很难找到采用时间格式并轻松确定它是否有效然后使用XSLT1.0生成具有某种格式的结果元素的好方法。给定以下xml:2300生成生成的xml会很棒:23:00但是，如果源xml包含无效的24小时时间格式，则生成的dstTime元素应该为空。例如，当无效的源xml如下时:NOON生成的xml应该是:问题是，可以编写什么最佳XSLT1.0片段来产生所需的结果？希望是保持它非常简单，而不必每次都解析(即，如果可能的话，模式匹配会很好)。最佳答案 XSLT1.0中没有任何正则表达式，所以恐怕无法进行模式匹配。我不清楚23:00应该合法还是

中设 XSLT gt lt srcTime xml xslt-1.0

html - 我可以使用什么标记将信息存储在 XHTML 文档 HEAD 中，而浏览器会忽略它？

我需要在XHTMLHEAD元素中存储一些任意的XML数据，这些数据将被浏览器忽略。有点像元素版本的“data-*”机制，用于组成您自己的属性。是否有符合标准的方法来执行此操作？编辑:有些人问我为什么要这样做。基本上我正在构建一个处理网页的服务，我希望网页的创建者能够将可选的“提示”传递给该服务以告诉它如何解析页面。我还没有决定具体的提示是什么，所以我想保持相当的灵active。我的代码已经使用JavaJSoup库来解析XHTML，所以我认为如果同一个库可以解析“提示”信息而不是单独解析它会很好。最佳答案您是否尝试过将信息放在元元

XHTML html section stackoverflow xml

xml - XSLT 1.0 使用基于父属性的键进行分组

我需要使用XSLT1.0对此进行转换:Colorsredorangeyellowgreenblueindigoviolet进入这个:Colorsredorangeyellowgreenblueindigogreen问题节点中的NumOfColumns告诉输出答案div时使用多少列。对于每个节点，我可以使用以下方法获取其行:天花板(位置()divparent::*/@NumOfColumns)这工作正常；我可以输出正确的整数。但是我无法让键/分组正常工作，我不确定问题出在哪里。我认为关键是:然后我可以通过以下方式检索节点:运气不好。有人有解决办法吗？还是这在XSLT1.0中不可行？

XSLT xml 34 lt gt xslt-grouping

java - XML 1.0/RSS 2.0 文档的标题？

这是XML/RSSFeed文件:.........如果我想通过套接字获取文件，例如:Socketsocket=newSocket(/*THESITE*/,80);OutputStreamos=socket.getOutputStream();OutputStreamWritterosw=newOutputStreamWritter(os);BufferedWriterbw=newBufferWriter(osw);bw.write("HEADEROFTHESITE");我应该使用什么header？最佳答案您应该了解HTTP或使用

java XML section 34 code sockets

php - 使用 Regex 解析 XML/XHTML 数据

我读过著名的帖子。我已经看到了有限的成功和失败的尝试。哦，这里和其他地方的火焰war。但这是可以做到的。虽然我知道实际的论点(阅读事实)是正则表达式不适合解析结构化数据树，因为它们无法监控和更改状态，但我觉得有些人盲目地放弃了这种可能性。应用程序逻辑是保持状态所必需的，但正如这个有效示例所示，它是可以做到的。相关片段如下:constPARSE_MODE_NEXT=0;constPARSE_MODE_ELEMENT=1;constPARSE_MODE_ENTITY=3;constPARSE_MODE_COMMENT=4;constPARSE_MODE_CDATA=5;constPARSE

Regex XHTML PARSE match 39 php xml dom

xml - XSLT 1.0 - 分组 xml 元素

需要将系统A对fint的请求转化为系统B的请求。假设我有一个来自系统A的XML文档，如下所示:100Kathisiera200Bates300GavinKing1111HeadFirstJava1005555HeadFirstServlets2001111HibernateInAction300我必须将此请求放入系统B的请求结构中:100Kathisiera300GavinKing1111HeadFirstJava1001111HibernateInAction300200Bates5555HeadFirstServlets200首先，我必须根据bookOrderID将book分组到B

xml XSLT lt gt bookOrderID xpath

5 6 789 10 11