草庐IT

pdf_extract

全部标签

xml - 如何使用 perl 将 ZUGFeRD-XML 附加到 PDF?

我需要创建一个附有XML的PDF/A3b文档,就像在ZUGFeRD中声明的那样。为此,我自己编写了一个perl脚本,它可以将XML文件创建为字符串并将其附加到PDF。我遵循了tutorialofthepdflib-cookbook,但我从来没有让我的XML100%附加到PDF。我在附加文件下看到它,我可以从那里将它保存到我的文件系统,但如果我用编辑器检查PDF,我只会看到XMP元数据,而不是我的XML。我想我需要将XML作为嵌入式文件流或类似的东西附加,但我不太确定我的代码中是否遗漏了某些东西,或者我只需要以其他方式添加它。这是我的XMP文件:BASICZUGFeRD-invoice.

xml - 自动填写 I-9 PDF XFA 表格

早上好。我希望有人可以帮助我解决这个问题。去年,我使用iTextSharp设置了一个VB.NET程序,用户可以在其中输入信息以填写I9,该信息将填写PDF并打印。对于新的I9,我遇到了未知的困难。首先,代码不会出错。我只是得到了一个糟糕的结果,因为我得到的不是填写的表格,而是一个PDF,上面写着“您要加载的文档需要Adob​​eReader8或更高版本。您可能没有安装Adob​​eReader...”等等。所以,我确保我拥有最新的Reader版本,再次尝试并得到相同的结果。考虑到字段名称结构可能发生了变化,我尝试像第一次那样读取格式/字段。(下面的代码)。但是,现在它告诉我没有要读取的

java - 如何使用 iText 7(或其他)从 Java 中的 XFA PDF 文档中提取 XML?

使用Java和iText7,我试图从XFAPDF表单中提取XML数据以解析(并可能修改)数据,但我所能做的就是获取一些相同的基本通用数据对于我使用的任何XFA文件。我知道它必须是可能的,因为它是在iTextRUPS工具中完成的,但我已经绕了好几天了。publicclassParse{privatePdfDocumentpdf;privatePdfAcroFormform;privateXfaFormxfa;privateDocumentdomDocument;privateMapdata;privateintnumberOfPages;privateStringpdfText;publ

regex - XSLT 2.0 : regex extract and modify element value

我有这个XML:00可以提取pID=NUMBERHERE&download=FILENAMEHERE.png(并在它之前添加新的url)来自元素?输出应该是这样的:http://newurl.com/pID=46391&download=noid_90.png0http://newurl.com/pID=06395&download=anotherfile.png0我尝试了一些东西,但我得不到想要的结果。首先,我可以复制当前结构: 最佳答案 此XSLT2.0样式表通过&拆分值,然后使用谓词仅过滤那些matches()提供的正则表达式

xml - pdf 的 XSL-fo 图像大小问题

我有大量的XML文档,这些文档是在docbook中创建的,并通过maven以html和pdf形式发布。几代人工作正常,html看起来不错。我遇到的问题是pdf版本中图像的大小。这些图片是截图的集合,有些是全屏的,有些是大约2/3的宽度和高度,还有一些是小搜索框。很明显,我需要对图像数据的属性进行大量重构。我想知道我应该将其重构为什么?我正在寻找一种方法来创建最多4种“类型”的图像,并让这些图像强制执行自己的大小。图像示例如下所示:Screenshot而且它只适用于我的一些屏幕截图尺寸。我尝试过scalefit、width和contentwidth/contentheight,它们似乎解

xml - 使用 FOP 在生成的 PDF 中保留空格

我正在使用XSLT和XML文件实现FOP,我希望在其中保留单词之间的空格。这是我的XML的样子:MyCreationaddressoneAAAAAAAAAAAThisistheaddressofcreation下面是PDF形式的结果:MyCreationaddressoneAAAAAAAAAAAThisisaddressofcreation但我需要它是这样的:MyCreationaddressoneAAAAAAAAAAAThisistheaddressofcreation因此保留所有空格。我使用了以下行:但无济于事。我在谷歌上搜索了解决方案,但没有成功。任何帮助将不胜感激。

xml - PDF 到 XML 并再次返回 PDF

我最近问了一个关于将PDF文件变成XML文件然后将其返回到PDF文件的问题,最好与原始文件完全相同,但至少几乎相同。我一直在尝试不同的方法,到目前为止我想到了这个。用LibreOffice编写的文档被保存为DocBookXML。假设它被命名为“file.xml”。此文件使用一组来自文件“docbook.xsl”启动的DocBook项目的XSL模板进行解析。这是通过运行完成的:xsltproc-ointermediate-fo-file.fo/usr/share/xml/docbook/stylesheet/nwalsh/fo/docbook.xslfile.xml结果是一个中间XSL-

Java 将 XML 文档呈现为 PDF

我有一个XML文档当前存储为内存中的字符串并且想将其呈现为PDF。换句话说,PDF内容将是一个XML文档。该方法呈现的XML是通用的——可能会发送多种类型的XML文档。我有点难以弄清楚如何使用各种基于Java的框架来完成。ApacheFOP似乎此框架需要将文档中的XML元素特定转换为FOP实体。由于问题中的方法必须接受通用XML,我认为这个框架不符合我的要求。iText我尝试使用iText/FlyingSaucer(org.xhtmlrenderer)的组合呈现文档,虽然它确实呈现PDF,但内容仅包含以空格分隔的数据值,没有xml元素或属性。使用下面的代码和测试数据:文件value1v

json - extract-document-data 作为 json 输出中的 xml 字符串元素出现

我正在尝试使用“匹配”文档中的一些元素来丰富我的搜索结果,使用查询选项“extract-document-data”,例如/language-version/language-version-canonical-model/title/language-version/language-version-canonical-model/language(...)当我运行搜索并请求Json输出(使用headerAccept:application/json)时,我得到的是json和"strinxml”结果:{"snippet-format":"snippet","total":564,"s

xml - 使用 XML 属性值通过 xsl-fo 将图像添加到 pdf

我正在使用XSL-FO从XMl文档制作PDF。我需要使用XML文档中的名称导入图像。示例XML:我需要通过类似的声明来做到这一点:我需要在src属性中放入什么XPath才能导入图像?感谢您的帮助,这让我很苦恼。 最佳答案 基本上是.确切的XPath表达式将取决于您的XML。例如,您很可能会有不止一个相册元素,所以/newAlbums/album[1]/@cover或类似要求。 关于xml-使用XML属性值通过xsl-fo将图像添加到pdf,我们在StackOverflow上找到一个类似的