草庐IT

pdf_output

全部标签

xml - XSL : why doesn't output indent work?

这是我的XSL电子表格:输入XML:value1value2输出未根据输出XML层次结构缩进。这是实际输出(请注意output1.5和output1没有正确缩进): 最佳答案 您所看到的实际上是根本没有缩进的结果;缩进的两行是处理用于缩进源文档的空格的结果。如果您要添加到您的样式表,您将在输出中完全没有缩进。缩进实际上不是由XSLT处理器控制的,它是由将输出序列化为字符串的任何东西控制的,尽管这通常是由相同的方法调用完成的。我不能确定为什么xsl:output指令没有完成这项工作,但您可以将其添加到您的java中:transform

xml - 如何使用 xsl-fo 页脚和页眉生成 pdf?

我正在尝试生成pdf,但我不知道如何将页眉和页脚添加到每个页面中。我正在使用xsl-fo命名空间,这里是xsl代码的根目录。和我的页面模板: 最佳答案 我是这样做的-在“fo:layout-master-set”中,我的page-master看起来像这样:fo:region-before定义页眉区域名称,而fo:region-after页脚区域名称。要添加您必须添加到“fo:page-sequence”的内容,在“fo:flow”之前:HEADERTEXTFOOTERTEXT您显然可以将流程名称更改为您想要的任何名称。这只是我的代码

xml - 换行处理 ="preserve"不适用于通过 xsl-fo 生成 pdf 的下一行

我的xml文件我的xsl-fo我正在生成包含ENTRYNM的pdf,它应该保留下一行,如xml中所示。Likeexample:Firstline:Secondlinethirdlinefourthline 最佳答案 这是因为AttributeValueNormalization.换行符正在标准化为空格。保留这些的唯一方法是在属性值中使用字符引用。例如,如果您有这个XML:和这个XSLT(为简洁起见省略了xsl-fo命名空间):你会得到这个输出(规范化):Firstline:Secondlinethirdlinefourthline如

java - 将 PDF 转换为 XML-XSL - Java?

如何将PDF转换为XML并在XSL中捕获其结构/样式? 最佳答案 我曾经将PDF到XML的转换描述为试图将汉堡包转换成奶牛。这是逆向工程中的练习。PDF在表示文本的方式上变化很大;在最坏的情况下,您所拥有的只是一张扫描图像(在这种情况下,您实际上是在进行OCR)。如果幸运的话,您有一组文本字符串以及它们在页面上出现的位置的坐标,但没有其他结构指示。如果PDF是他们理解的格式,有些工具可以完成合理的工作(通常生成MicrosoftWord)。谷歌“PDF到Word转换”。尝试一下(我已经有一段时间没试过了);不要试图自己写。当然,从W

xml - JSTL x :forEach comma-separated output

我有一个包含以下内容的xml文件:name1name2name3我想用JSTL将其解析为如下列表:name1,name2,name3并且,如果超过3个:name1,name2,name3et.al我在使用时没有遇到任何问题列出名字并以特定作者结尾,但是如何获取逗号并检查列表长度? 最佳答案 将varStatus属性与end属性结合使用。varStatus指的是本地LoopTagStatus提供多种getter方法的实例,例如getIndex()和isLast().end属性指定迭代应该结束的索引。${author},et.al

xml - 检查 *output* 节点是否已经存在

我想根据以下规则(节点由@Name区分)将两个文件A.xml和map.xml与“节点”元素合并:如果map.xml中的元素具有Src属性,则应将map中的元素复制到输出如果元素存在于A和map中并且没有@Src,则应该从A中复制如果元素存在于A但不在map中,则应忽略它(并发出警告)如果元素存在于map中但不存在于A中,则生成(空)元素例子:map.xml:A.xml:结果应该是:我的XSLT脚本是:WARNING:Node""notfoundinmapfile,ignoring脚本运行良好。它处理A.xml并在map.xml中查找每个Node元素。由于@Src和非@Src节点可以混用

php - 从 PHP 文件生成并使用 XSLT 翻译的 XML 获取 PDF 输出

我用了几天时间想出了一个生成PDF的最佳实践,最终用户可以为自己自定义布局。PDF输出需要保存在服务器上或发送回PHP文件,以便PHP文件可以保存它,并且PHP文件需要知道它运行正常。我认为最好的方法是使用XML、XSLT和ApacheCocoon。但我不确定这是否可行,或者这是否是一个好主意,因为我找不到任何关于人们做类似事情的信息。这不可能是一个罕见的问题。当我读到有关Cocoon通过XSLT将XML转换为PDF的文章时,我有了这个想法:http://cocoon.apache.org/2.1/howto/howto-html-pdf-publishing.html并且能够接受变量

c# - 将 PDF 文档转换为 XML 文件,最好使用 ITextSharp

我有一个PDF文档,我需要从中读取数据。我发现,当我将所说的PDF转换为XML文档时,我可以从中读取方便的标签,因此我需要一种方法来在代码中将我的文件转换为xml,这样我就可以使用映射器文件读取数据内容到数据库。 最佳答案 使用PDFMinerPDFMiner是一个从PDF文档中提取信息的工具。它包括一个PDF转换器,可以将PDF文件转换为其他文本格式(例如XML/HTML)。与其他PDF相关工具不同,它完全专注于获取和分析文本数据。PDFMiner允许人们获取页面中文本的确切位置,以及其他信息,例如字体或线条。它有一个可扩展的PD

HTML 整洁 : how to set 'force-output' to 'yes' ?

我在Windows的命令行环境中使用HTMLTidy。我需要强制将一些html文件转换为xml,即使有错误也是如此。我执行以下步骤:创建文件“conf.txt”,其内容为:强制输出:是输入以下命令行:tidy-configconf.txt-ofilename.xmlfilename.htm但是,没有生成“filename.xml”。请注意,在http://infohound.net/tidy/tidy.pl使用tidy的在线版本时,我能够从同一个“坏”HTML文件中获取输出XML文件。.我做错了什么? 最佳答案 我想出了一个办法:t

c# - 将 XML 转换为 PDF 时 itextsharp 5.4 出现问题

我使用以下代码通过itextsharp5.4将XML转换为PDFprotectedvoidPage_Load(objectsender,EventArgse){Documentdocument=newDocument();PdfWriter.GetInstance(document,newFileStream("ExampleDoc.pdf",FileMode.Create));ITextHandlerxmlHandler=newITextHandler(document);xmlHandler.Parse("ExampleDoc.xml");}我在行ITextHandlerxmlHa