草庐IT

combine_pdf

全部标签

java - itext 使用 Java 在 pdf 中创建 XMP

我需要在java中(使用itext)创建以下xmp元数据并将其放入我的一个pdf中。ABIAssegniSchemahttp://abi.it/std/cheque/xmlnsassegniIDDocumentoTextexternalIdentificativounivocodeldocumentodatachiusuraDateexternalDataeoradellaproduzionedelfileoggettodocumentoTextexternalOggettodeldocumentosoggettoproduttoresoggettoexternalSoggettopr

java - 使用 PDFBox 标记的 PDF

是否可以使用PDFBox创建带标签的PDF(PDF/UA)?PDFBox似乎有一个API(包org.apache.pdfbox.pdmodel.documentinterchange.taggedpdf),但我找不到任何教程或代码示例。使用下面的代码,我生成了一个包含图像的PDF文件,屏幕阅读器NVDA(在我的例子中)识别它并读取“...图形替代描述”。但是,可访问性检查器PAC2显示错误:“图像对象未标记”。PDDocumentdoc=newPDDocument();PDPagepage=newPDPage();doc.addPage(page);PDDocumentCatalogd

java - 使用 iText 替换 PDF 文件中的文本

我正在使用iText(5.5.13)库读取.PDF并替换文件中的模式。问题在于未找到该模式,因为在库读取pdf时不知何故出现了一些奇怪的字符。例如,在句子中:"Thisisatestinordertoseeifthe"当我试图阅读它时变成了这个:[(Thisisa)9(te)-3(st)9(ino)-4(rd)15(er)-2(t)9(o)-5(s)8(ee)7(ift)-3(h)3(e)]因此,如果我尝试查找并替换"test",则不会在pdf中找到"test"单词,并且不会被替换这是我使用的代码:publicvoidprocessPDF(Stringsrc,Stringdest){t

java - 如何在将 HTML 呈现为 PDF 时在 Flying-Saucer 中设置基本 url?

我正在尝试使用Flying-Saucer将HTML页面呈现为PDF。HTML在内存中创建并作为传递给渲染器renderer.setDocumentFromString(newString(htmlByteArray));问题是我有在HTML中,它不会在最终的HTML中呈现。图片位于resources包中的文件夹。我尝试使用以下设置基本url,但没有成功:ITextRendererrenderer=newITextRenderer();renderer.getSharedContext().setBaseURL("com/org/tools/designer/resources/");S

java - 如何在 java 中使用 wkhtmltopdf 将 pdf 导出到 OutputStream

我在带有ProccessBuilder和Process的Java项目中使用wkhtmltopdf:ProcessBuilderpb=newProcessBuilder("wkhtmltopdf.exe","input.html","output.pdf");进程process=pb.start();此解决方案使用html文件作为输入,并将输出保存为磁盘上的pdf文件。但是我的html不是文件,它是一个OutputStream,我想即时创建pdf文件,不想将它保存在磁盘上。有没有办法用OutputStream传递参数并作为另一个OutputStream获取结果?

java - 通过 Apache PDFBox 将 MS Office 文档添加到 PDF

我正在使用ApachePDFBox(http://pdfbox.apache.org/)从任意数量的文件(包括图像和其他PDF)中创建PDF。现在我需要将MSOffice文档(Word、Excel和OutlookMSG)添加到PDF。文件可以有几乎所有的Office版本,所以不能认定文件是新的office文件(如docx)或旧文件(如doc)。有没有办法只使用免费工具来做到这一点?我的第一个想法是使用ApachePOI(http://poi.apache.org/)读取每个文件的内容并将文件重新创建为一个新的PDF页面,但这可能会变得非常昂贵,因为这个PDF创建在服务器上被超过五十人使

java - 如何使用iText和Java选中具有相同变量名的PDF文件中的复选框

我一直在使用iText库作为Java来自动填充PDF文档。我要做的第一件事是映射每个字段。一旦我映射了每个字段,就将变量名称保存到Strings中,以便于访问。到现在为止还挺好。问题是我有6个具有相同变量名的复选框。例如,它们被命名为topmostSubform[0].Page2[0].p2_cb01[0]。通过一些测试,我可以弄清楚,如果我选中第一个复选框,则topmostSubform[0].Page2[0].p2_cb01[0]=1如果我检查第二个(自动取消选中第一个),则topmostSubform[0].Page2[0].p2_cb01[0]=2然后依次topmostSubf

Java 流 : Combining two collections into a map

我有两个集合,一个仓库ID列表和一个小部件集合。小部件以不同的数量存在于多个仓库中:ListwarehouseIds;Listwidgets;这是一个类定义的例子:publicclassWidget{publicCollectiongetStocks();}publicclassStock{publicLonggetWarehouseId();publicIntegergetQuantity();}我想使用StreamsAPI创建一个Map,其中仓库ID是键,值是特定仓库中数量最少的Widget列表。因为多个小部件可能具有相同的数量,所以我们返回一个列表。例如,仓库111有5个Widg

java - 如何使用 Java 从 pdf 中提取图像(不使用 pdfbox)

我一直在研究如何从一个大的(>300MB)PDF文件中提取图像。我正在使用pdfbox但由于某些我无法弄清楚的特殊原因,某些页面未正确提取。我使用pdfbox的PDFToImage类作为我的代码的基础。那么,你知道另一个可以帮助我做到这一点的图书馆吗?我知道可以使用iText,但我读到它不能用于商业产品。我已经安装了xpdf和xpdf-utils包,名为pdfimages的实用程序运行良好。但我需要从Java解决这个问题,它应该是可移植的。 最佳答案 我认为您在这里谈论的是两件不同的事情:从PDF中提取图像,以及将PDF页面转换为图

java - 如何提高 PDF 渲染器中图像的分辨率?

我想增加图像的分辨率。我用了PDFRenderer-0.9.0jar。从java.net下载用于将PDF页面转换为图像。我要转换46_2.pdfPDF文件到图像。转换后的46_2.png图片较小,尺寸为612x792[widthxheight],所以我想将图像尺寸增加到1200x1400[widthxheight]。我之前尝试过PdfBox将PDF页面转换为PNG图像文件。有一个问题只有页面被转换但文本丢失。所以我尝试了用于图像转换的PdfRenderer库。代码:packagecom.pdfrenderer.examples;importjava.awt.Graphics2D;imp