xhtml2pdf

html - 在 html/xhtml 中解析 RDFa？

使用perl中的RDF::RDFa::Parser模块解析网站外的rdf数据。在带有!DOCTYPEHTMLPUBLIC"-//W3C//DTDHTML4.01Transitional//EN">的网站上它可以工作，但在使用xhtml!DOCTYPEhtmlPUBLIC"-//W3C//DTDXHTML1.0Transitional//EN的网站上""http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">没有输出...测试网站->http://www.filmstarts.de/kritiken/186918.htmluseR

html - 如何判断以下网页源代码是XHTML、HTML 还是XML？

我正在使用此网页来提高我的编程技能:http://www.studenti.ict.uniba.it/esse3/ListaAppelliOfferta.do如果你看一下它的源代码，你可以看到像这样的HTML特有标签问题是:我很确定这个页面不是XML，那么它是简单的HTML还是XHTML？据我所知，这两者非常相似。我怎么知道这两者是哪一个？如果我必须选择，我会说简单的HTML(5或4)，但我不是100%确定! 最佳答案寻找Doctype文件开头的声明。如果是XHTML，文档类型将如下所示:如果是HTML5，它看起来像这样:参见W3

XHTML html code section pre xml

html - 使用 XSLT 识别特定的 XHTML 单元格，并在找到它们后修改它们的属性

我遇到一个问题，我们需要对输入的XHTML文档执行转换，以便更好地在移动设备上显示页面。每个输入文档都有大量带有特定ID的HTML表格。在一个这样的表中，我需要识别一个单元格，以便不仅修改它的“colspan”属性，还修改它两侧单元格的“colspan”属性。我无法修改输入的HTML，这是从外部获取的。我只能改造它。在我尝试转换的每个单元格中，它的左侧和右侧都有一个空白单元格，均具有“colspan=2”属性。我需要使这个中间单元格具有“colspan=4”属性，左侧单元格具有“colspan=1”属性，右侧单元格被删除。我一直在使用XSLT，到目前为止，我的文档已经设法实现了许多其他

XHTML html lt gt td css xml xslt

xml - 如何使用 xsl-fo 页脚和页眉生成 pdf？

我正在尝试生成pdf，但我不知道如何将页眉和页脚添加到每个页面中。我正在使用xsl-fo命名空间，这里是xsl代码的根目录。和我的页面模板: 最佳答案我是这样做的-在“fo:layout-master-set”中，我的page-master看起来像这样:fo:region-before定义页眉区域名称，而fo:region-after页脚区域名称。要添加您必须添加到“fo:page-sequence”的内容，在“fo:flow”之前:HEADERTEXTFOOTERTEXT您显然可以将流程名称更改为您想要的任何名称。这只是我的代码

页眉 xsl-fo 34 fo lt xml xslt pdf footer

xml - 换行处理 ="preserve"不适用于通过 xsl-fo 生成 pdf 的下一行

我的xml文件我的xsl-fo我正在生成包含ENTRYNM的pdf，它应该保留下一行，如xml中所示。Likeexample:Firstline:Secondlinethirdlinefourthline 最佳答案这是因为AttributeValueNormalization.换行符正在标准化为空格。保留这些的唯一方法是在属性值中使用字符引用。例如，如果您有这个XML:和这个XSLT(为简洁起见省略了xsl-fo命名空间):你会得到这个输出(规范化):Firstline:Secondlinethirdlinefourthline如

amp preserve 34 line code xml xslt xsl-fo

XML 到 XHTML - 最佳方法？

不想主观，但我需要从XML源获取数据并将其转换为(X)HTML。据我所知，我可以使用PHP(或其他服务器端脚本)、Javascript或XSLT来完成此操作。我的感觉是使用XSLT会更合适，因为它处理的是XML源，而这正是XSLT存在的目的。我还看到它的优点是，如果用户没有启用Javascript，它仍然可以工作，并且不会被限制在运行PHP(或其他服务器端脚本)的服务器上。我的假设是否正确？RSS提要也可以相同吗？谢谢最佳答案这取决于您的转型应该有多激进。XSLT真正擅长将现有数据从源格式转换为目标格式。它在计算或查找和集成额外

XHTML XML section XSLT stackoverflow rss

java - 如何使用 Java 从 ATOM 提要中提取 XHTML？

我正在尝试从RSS提要中提取一些XHTML，以便将其放置在WebView中。有问题的RSS提要有一个名为的标签并且内容中的字符是XHTML。(我正在削减的网站是一个博客提要)尝试提取此内容的最佳方法是什么？字符混淆了我的解析器。我已经尝试过DOM和SAX，但都不能很好地处理这个问题。HereisasampleoftheXMLasrequested.在这种情况下，我基本上希望内容标记内的XHTML是一个字符串。XHTML编辑:根据ignyhere的建议，我尝试了XPath，但我仍然遇到同样的问题。Hereisapastebinsampleofmytests.

提要 XHTML XmlPullParser String xpp java android xml atom-feed

java - 将 PDF 转换为 XML-XSL - Java？

如何将PDF转换为XML并在XSL中捕获其结构/样式？最佳答案我曾经将PDF到XML的转换描述为试图将汉堡包转换成奶牛。这是逆向工程中的练习。PDF在表示文本的方式上变化很大；在最坏的情况下，您所拥有的只是一张扫描图像(在这种情况下，您实际上是在进行OCR)。如果幸运的话，您有一组文本字符串以及它们在页面上出现的位置的坐标，但没有其他结构指示。如果PDF是他们理解的格式，有些工具可以完成合理的工作(通常生成MicrosoftWord)。谷歌“PDF到Word转换”。尝试一下(我已经有一段时间没试过了)；不要试图自己写。当然，从W

XML-XSL java section PDF stackoverflow xml jakarta-ee xslt

javascript - Firefox 是否支持 XHTML 页面中的 Javascript？

我需要提供包含Javascript的XHTML页面。我的问题是Firefox(3.5.7)似乎忽略了Javascript。例如:MyTitledocument.write("Helloworld!");如果我将它保存为test.html，Firefox会正确显示它。如果我将其保存为test.xml，Firefox会显示一个空白页面。我在这里做错了什么？最佳答案来自http://www.w3.org/MarkUp/2004/xhtml-faq#docwriteDoesdocument.writeworkinXHTML?No.Bec

javascript section code Firefox xml xhtml

c# - 解析 XML/XHTML 文档但忽略 C# 中的错误

我正在编写一些小应用程序来解析一些网页的源代码、提取一些数据并将其保存为另一种格式。具体来说，我的一些银行不提供交易/报表的下载，但他们在其网站上提供对这些报表的访问。我做的很好，但另一个(HSBCUK)被证明是一个麻烦，因为它的源不是有效的XHTML。例如之前有空格标签，还有一些地方==使用而不是=在属性名称和它的值之间(例如)。当然，当我将此数据传递到我的XmlDocument时，它会抛出一个不稳定的(更准确地说是一个异常)。我的问题是:是否可以放宽C#中对XML解析的要求？我知道从源头上解决这些问题要好得多-这绝对也是我的态度-但汇丰银行改变他们的网站的可能性几乎为零，该网站已经

c#section code xml

16 17 181920 21 22