草庐IT

xhtml-1.0-strict

全部标签

c# - 解析 XML/XHTML 文档但忽略 C# 中的错误

我正在编写一些小应用程序来解析一些网页的源代码、提取一些数据并将其保存为另一种格式。具体来说,我的一些银行不提供交易/报表的下载,但他们在其网站上提供对这些报表的访问。我做的很好,但另一个(HSBCUK)被证明是一个麻烦,因为它的源不是有效的XHTML。例如之前有空格标签,还有一些地方==使用而不是=在属性名称和它的值之间(例如)。当然,当我将此数据传递到我的XmlDocument时,它会抛出一个不稳定的(更准确地说是一个异常)。我的问题是:是否可以放宽C#中对XML解析的要求?我知道从源头上解决这些问题要好得多-这绝对也是我的态度-但汇丰银行改变他们的网站的可能性几乎为零,该网站已经

c# - 将日志文件转换为 XML 和(XHTML,建议

我的任务是从我继承的测试报告工具中转换一些文本日志文件。该工具是经过编译的C#(.NET3.5)应用程序。我想将一组逻辑上连接的日志文件解析并转换为单个XML报告文件,这不是问题。System.Xml类非常易于使用。但是,我还想为每个报告创建一个更“可读”的文件。我选择了HTML,因为我喜欢标准化,所以我更愿意用适当的XHTML来做。我的问题是我应该如何创建HTML文件和XML报告?我最初的想法是构建XML文件,然后使用LINQ和一个简单的StreamWriter在我的C#代码中构建一个HTML文件。我还可以使用XSLT而不是LINQ来简化C#代码。但是因为无论如何我都必须编译它,所以

xml - 在 XPath 1.0 中选择多个节点下属性的最小/最大值

考虑以下XML结构:我想要一个XPath1.0语句来给我@x的最小值和最大值?到目前为止,我至少有以下内容://a/b/c/d[not(preceding-sibling::d/@x这很接近,但没有雪茄:-(非常感谢任何帮助!谢谢,J 最佳答案 要获取最大值,请查找所有不存在较小值的属性值。如果有多个结果,取第一个-它们必须相等。(//@x[not(.对于最小值,只需替换即可通过>.出于完整性原因:如果您的XPath引擎支持XPath2.0(或更好),只需使用max(//@x)尊重min(//@x)这可能会更快、更易读。

html - 将 'embedded' XML 文档转换为 XSLT (1.0) 中的 CDATA 输出

给定一个像这样的输入XML文档:Thiscontainsan'embedded'HTMLdocumentHTMLDOCHelloWorld我如何提取“内部”HTML文档;将其呈现为CDATA并包含在我的输出文档中?因此输出文档将是一个HTML文档;其中包含一个将元素显示为文本的文本框(因此它将显示内部文档的“源View”)。我试过这个:但这只会渲染文本节点。我试过这个:]]>但这逃避了实际的XSLT,我得到:<xsl:value-ofselect="*"/>我试过这个:[...]这确实插入了一个CDATA部分,但输出仍然只包含文本(剥离的元素):MydocTitle:Thi

xml - 在 XSLT 1.0 中设置 24 小时制格式的最佳方式是什么?

我很难找到采用时间格式并轻松确定它是否有效然后使用XSLT1.0生成具有某种格式的结果元素的好方法。给定以下xml:2300生成生成的xml会很棒:23:00但是,如果源xml包含无效的24小时时间格式,则生成的dstTime元素应该为空。例如,当无效的源xml如下时:NOON生成的xml应该是:问题是,可以编写什么最佳XSLT1.0片段来产生所需的结果?希望是保持它非常简单,而不必每次都解析(即,如果可能的话,模式匹配会很好)。 最佳答案 XSLT1.0中没有任何正则表达式,所以恐怕无法进行模式匹配。我不清楚23:00应该合法还是

html - 我可以使用什么标记将信息存储在 XHTML 文档 HEAD 中,而浏览器会忽略它?

我需要在XHTMLHEAD元素中存储一些任意的XML数据,这些数据将被浏览器忽略。有点像元素版本的“data-*”机制,用于组成您自己的属性。是否有符合标准的方法来执行此操作?编辑:有些人问我为什么要这样做。基本上我正在构建一个处理网页的服务,我希望网页的创建者能够将可选的“提示”传递给该服务以告诉它如何解析页面。我还没有决定具体的提示是什么,所以我想保持相当的灵active。我的代码已经使用JavaJSoup库来解析XHTML,所以我认为如果同一个库可以解析“提示”信息而不是单独解析它会很好。 最佳答案 您是否尝试过将信息放在元元

xml - XSLT 1.0 使用基于父属性的键进行分组

我需要使用XSLT1.0对此进行转换:Colorsredorangeyellowgreenblueindigoviolet进入这个:Colorsredorangeyellowgreenblueindigogreen问题节点中的NumOfColumns告诉输出答案div时使用多少列。对于每个节点,我可以使用以下方法获取其行:天花板(位置()divparent::*/@NumOfColumns)这工作正常;我可以输出正确的整数。但是我无法让键/分组正常工作,我不确定问题出在哪里。我认为关键是:然后我可以通过以下方式检索节点:运气不好。有人有解决办法吗?还是这在XSLT1.0中不可行?

java - XML 1.0/RSS 2.0 文档的标题?

这是XML/RSSFeed文件:.........如果我想通过套接字获取文件,例如:Socketsocket=newSocket(/*THESITE*/,80);OutputStreamos=socket.getOutputStream();OutputStreamWritterosw=newOutputStreamWritter(os);BufferedWriterbw=newBufferWriter(osw);bw.write("HEADEROFTHESITE");我应该使用什么header? 最佳答案 您应该了解HTTP或使用

php - 使用 Regex 解析 XML/XHTML 数据

我读过著名的帖子。我已经看到了有限的成功和失败的尝试。哦,这里和其他地方的火焰war。但这是可以做到的。虽然我知道实际的论点(阅读事实)是正则表达式不适合解析结构化数据树,因为它们无法监控和更改状态,但我觉得有些人盲目地放弃了这种可能性。应用程序逻辑是保持状态所必需的,但正如这个有效示例所示,它是可以做到的。相关片段如下:constPARSE_MODE_NEXT=0;constPARSE_MODE_ELEMENT=1;constPARSE_MODE_ENTITY=3;constPARSE_MODE_COMMENT=4;constPARSE_MODE_CDATA=5;constPARSE

xml - XSLT 1.0 - 分组 xml 元素

需要将系统A对fint的请求转化为系统B的请求。假设我有一个来自系统A的XML文档,如下所示:100Kathisiera200Bates300GavinKing1111HeadFirstJava1005555HeadFirstServlets2001111HibernateInAction300我必须将此请求放入系统B的请求结构中:100Kathisiera300GavinKing1111HeadFirstJava1001111HibernateInAction300200Bates5555HeadFirstServlets200首先,我必须根据bookOrderID将book分组到B