pdf_extract

xml - 如何使用 perl 将 ZUGFeRD-XML 附加到 PDF？

我需要创建一个附有XML的PDF/A3b文档，就像在ZUGFeRD中声明的那样。为此，我自己编写了一个perl脚本，它可以将XML文件创建为字符串并将其附加到PDF。我遵循了tutorialofthepdflib-cookbook，但我从来没有让我的XML100%附加到PDF。我在附加文件下看到它，我可以从那里将它保存到我的文件系统，但如果我用编辑器检查PDF，我只会看到XMP元数据，而不是我的XML。我想我需要将XML作为嵌入式文件流或类似的东西附加，但我不太确定我的代码中是否遗漏了某些东西，或者我只需要以其他方式添加它。这是我的XMP文件:BASICZUGFeRD-invoice.

ZUGFeRD-XML ZUGFeRD gt lt ram xml perl pdf pdflib

xml - 自动填写 I-9 PDF XFA 表格

早上好。我希望有人可以帮助我解决这个问题。去年，我使用iTextSharp设置了一个VB.NET程序，用户可以在其中输入信息以填写I9，该信息将填写PDF并打印。对于新的I9，我遇到了未知的困难。首先，代码不会出错。我只是得到了一个糟糕的结果，因为我得到的不是填写的表格，而是一个PDF，上面写着“您要加载的文档需要AdobeReader8或更高版本。您可能没有安装AdobeReader...”等等。所以，我确保我拥有最新的Reader版本，再次尝试并得到相同的结果。考虑到字段名称结构可能发生了变化，我尝试像第一次那样读取格式/字段。(下面的代码)。但是，现在它告诉我没有要读取的

xml PDF code section PdfReader vb.net itext xfa

java - 如何使用 iText 7(或其他)从 Java 中的 XFA PDF 文档中提取 XML？

使用Java和iText7，我试图从XFAPDF表单中提取XML数据以解析(并可能修改)数据，但我所能做的就是获取一些相同的基本通用数据对于我使用的任何XFA文件。我知道它必须是可能的，因为它是在iTextRUPS工具中完成的，但我已经绕了好几天了。publicclassParse{privatePdfDocumentpdf;privatePdfAcroFormform;privateXfaFormxfa;privateDocumentdomDocument;privateMapdata;privateintnumberOfPages;privateStringpdfText;publ

iText java 34 code XFA xml pdf

regex - XSLT 2.0 : regex extract and modify element value

我有这个XML:00可以提取pID=NUMBERHERE&download=FILENAMEHERE.png(并在它之前添加新的url)来自元素？输出应该是这样的:http://newurl.com/pID=46391&download=noid_90.png0http://newurl.com/pID=06395&download=anotherfile.png0我尝试了一些东西，但我得不到想要的结果。首先，我可以复制当前结构: 最佳答案此XSLT2.0样式表通过&拆分值，然后使用谓词仅过滤那些matches()提供的正则表达式

regex extract xsl lt gt xml xslt xpath

xml - pdf 的 XSL-fo 图像大小问题

我有大量的XML文档，这些文档是在docbook中创建的，并通过maven以html和pdf形式发布。几代人工作正常，html看起来不错。我遇到的问题是pdf版本中图像的大小。这些图片是截图的集合，有些是全屏的，有些是大约2/3的宽度和高度，还有一些是小搜索框。很明显，我需要对图像数据的属性进行大量重构。我想知道我应该将其重构为什么？我正在寻找一种方法来创建最多4种“类型”的图像，并让这些图像强制执行自己的大小。图像示例如下所示:Screenshot而且它只适用于我的一些屏幕截图尺寸。我尝试过scalefit、width和contentwidth/contentheight，它们似乎解

XSL-fo xml section gt lt xslt image-manipulation docbook

xml - 使用 FOP 在生成的 PDF 中保留空格

我正在使用XSLT和XML文件实现FOP，我希望在其中保留单词之间的空格。这是我的XML的样子:MyCreationaddressoneAAAAAAAAAAAThisistheaddressofcreation下面是PDF形式的结果:MyCreationaddressoneAAAAAAAAAAAThisisaddressofcreation但我需要它是这样的:MyCreationaddressoneAAAAAAAAAAAThisistheaddressofcreation因此保留所有空格。我使用了以下行:但无济于事。我在谷歌上搜索了解决方案，但没有成功。任何帮助将不胜感激。

留空在生 code section pre xml xslt whitespace xsl-fo apache-fop

xml - PDF 到 XML 并再次返回 PDF

我最近问了一个关于将PDF文件变成XML文件然后将其返回到PDF文件的问题，最好与原始文件完全相同，但至少几乎相同。我一直在尝试不同的方法，到目前为止我想到了这个。用LibreOffice编写的文档被保存为DocBookXML。假设它被命名为“file.xml”。此文件使用一组来自文件“docbook.xsl”启动的DocBook项目的XSL模板进行解析。这是通过运行完成的:xsltproc-ointermediate-fo-file.fo/usr/share/xml/docbook/stylesheet/nwalsh/fo/docbook.xslfile.xml结果是一个中间XSL-

PDF xml section 词汇表

Java 将 XML 文档呈现为 PDF

我有一个XML文档当前存储为内存中的字符串并且想将其呈现为PDF。换句话说，PDF内容将是一个XML文档。该方法呈现的XML是通用的——可能会发送多种类型的XML文档。我有点难以弄清楚如何使用各种基于Java的框架来完成。ApacheFOP似乎此框架需要将文档中的XML元素特定转换为FOP实体。由于问题中的方法必须接受通用XML，我认为这个框架不符合我的要求。iText我尝试使用iText/FlyingSaucer(org.xhtmlrenderer)的组合呈现文档，虽然它确实呈现PDF，但内容仅包含以空格分隔的数据值，没有xml元素或属性。使用下面的代码和测试数据:文件value1v

Java XML xsl gt lt pdf itext apache-fop

json - extract-document-data 作为 json 输出中的 xml 字符串元素出现

我正在尝试使用“匹配”文档中的一些元素来丰富我的搜索结果，使用查询选项“extract-document-data”，例如/language-version/language-version-canonical-model/title/language-version/language-version-canonical-model/language(...)当我运行搜索并请求Json输出(使用headerAccept:application/json)时，我得到的是json和"strinxml”结果:{"snippet-format":"snippet","total":564,"s

extract-document-data json 34 amp strong xml marklogic

xml - 使用 XML 属性值通过 xsl-fo 将图像添加到 pdf

我正在使用XSL-FO从XMl文档制作PDF。我需要使用XML文档中的名称导入图像。示例XML:我需要通过类似的声明来做到这一点:我需要在src属性中放入什么XPath才能导入图像？感谢您的帮助，这让我很苦恼。最佳答案基本上是.确切的XPath表达式将取决于您的XML。例如，您很可能会有不止一个相册元素，所以/newAlbums/album[1]/@cover或类似要求。关于xml-使用XML属性值通过xsl-fo将图像添加到pdf，我们在StackOverflow上找到一个类似的

xsl-fo xml section code newAlbums xpath

17 18 192021 22 23