combine_pdf

java - itext 使用 Java 在 pdf 中创建 XMP

我需要在java中(使用itext)创建以下xmp元数据并将其放入我的一个pdf中。ABIAssegniSchemahttp://abi.it/std/cheque/xmlnsassegniIDDocumentoTextexternalIdentificativounivocodeldocumentodatachiusuraDateexternalDataeoradellaproduzionedelfileoggettodocumentoTextexternalOggettodeldocumentosoggettoproduttoresoggettoexternalSoggettopr

中创 itext pdfaProperty gt lt java metadata xmp

java - 使用 PDFBox 标记的 PDF

是否可以使用PDFBox创建带标签的PDF(PDF/UA)？PDFBox似乎有一个API(包org.apache.pdfbox.pdmodel.documentinterchange.taggedpdf)，但我找不到任何教程或代码示例。使用下面的代码，我生成了一个包含图像的PDF文件，屏幕阅读器NVDA(在我的例子中)识别它并读取“...图形替代描述”。但是，可访问性检查器PAC2显示错误:“图像对象未标记”。PDDocumentdoc=newPDDocument();PDPagepage=newPDPage();doc.addPage(page);PDDocumentCatalogd

PDFBox java structureElement pdImage contents accessibility tagged-pdf

java - 使用 iText 替换 PDF 文件中的文本

我正在使用iText(5.5.13)库读取.PDF并替换文件中的模式。问题在于未找到该模式，因为在库读取pdf时不知何故出现了一些奇怪的字符。例如，在句子中:"Thisisatestinordertoseeifthe"当我试图阅读它时变成了这个:[(Thisisa)9(te)-3(st)9(ino)-4(rd)15(er)-2(t)9(o)-5(s)8(ee)7(ift)-3(h)3(e)]因此，如果我尝试查找并替换"test"，则不会在pdf中找到"test"单词，并且不会被替换这是我使用的代码:publicvoidprocessPDF(Stringsrc,Stringdest){t

iText java code 34 processor pdf replace

java - 如何在将 HTML 呈现为 PDF 时在 Flying-Saucer 中设置基本 url？

我正在尝试使用Flying-Saucer将HTML页面呈现为PDF。HTML在内存中创建并作为传递给渲染器renderer.setDocumentFromString(newString(htmlByteArray));问题是我有在HTML中，它不会在最终的HTML中呈现。图片位于resources包中的文件夹。我尝试使用以下设置基本url，但没有成功:ITextRendererrenderer=newITextRenderer();renderer.getSharedContext().setBaseURL("com/org/tools/designer/resources/");S

中设 Flying-Saucer code renderer section java xhtml pdf-generation

java - 如何在 java 中使用 wkhtmltopdf 将 pdf 导出到 OutputStream

我在带有ProccessBuilder和Process的Java项目中使用wkhtmltopdf:ProcessBuilderpb=newProcessBuilder("wkhtmltopdf.exe","input.html","output.pdf");进程process=pb.start();此解决方案使用html文件作为输入，并将输出保存为磁盘上的pdf文件。但是我的html不是文件，它是一个OutputStream，我想即时创建pdf文件，不想将它保存在磁盘上。有没有办法用OutputStream传递参数并作为另一个OutputStream获取结果？

java 何在 section OutputStream wkhtmltopdf pdf

java - 通过 Apache PDFBox 将 MS Office 文档添加到 PDF

我正在使用ApachePDFBox(http://pdfbox.apache.org/)从任意数量的文件(包括图像和其他PDF)中创建PDF。现在我需要将MSOffice文档(Word、Excel和OutlookMSG)添加到PDF。文件可以有几乎所有的Office版本，所以不能认定文件是新的office文件(如docx)或旧文件(如doc)。有没有办法只使用免费工具来做到这一点？我的第一个想法是使用ApachePOI(http://poi.apache.org/)读取每个文件的内容并将文件重新创建为一个新的PDF页面，但这可能会变得非常昂贵，因为这个PDF创建在服务器上被超过五十人使

Apache PDFBox section artofsolving jodconverter java pdf ms-office

java - 如何使用iText和Java选中具有相同变量名的PDF文件中的复选框

我一直在使用iText库作为Java来自动填充PDF文档。我要做的第一件事是映射每个字段。一旦我映射了每个字段，就将变量名称保存到Strings中，以便于访问。到现在为止还挺好。问题是我有6个具有相同变量名的复选框。例如，它们被命名为topmostSubform[0].Page2[0].p2_cb01[0]。通过一些测试，我可以弄清楚，如果我选中第一个复选框，则topmostSubform[0].Page2[0].p2_cb01[0]=1如果我检查第二个(自动取消选中第一个)，则topmostSubform[0].Page2[0].p2_cb01[0]=2然后依次topmostSubf

iText java code topmostSubform Page2 pdf

Java 流 : Combining two collections into a map

我有两个集合，一个仓库ID列表和一个小部件集合。小部件以不同的数量存在于多个仓库中:ListwarehouseIds;Listwidgets;这是一个类定义的例子:publicclassWidget{publicCollectiongetStocks();}publicclassStock{publicLonggetWarehouseId();publicIntegergetQuantity();}我想使用StreamsAPI创建一个Map，其中仓库ID是键，值是特定仓库中数量最少的Widget列表。因为多个小部件可能具有相同的数量，所以我们返回一个列表。例如，仓库111有5个Widg

collections Combining code strong gt java java-8 java-stream

java - 如何使用 Java 从 pdf 中提取图像(不使用 pdfbox)

我一直在研究如何从一个大的(>300MB)PDF文件中提取图像。我正在使用pdfbox但由于某些我无法弄清楚的特殊原因，某些页面未正确提取。我使用pdfbox的PDFToImage类作为我的代码的基础。那么，你知道另一个可以帮助我做到这一点的图书馆吗？我知道可以使用iText，但我读到它不能用于商业产品。我已经安装了xpdf和xpdf-utils包，名为pdfimages的实用程序运行良好。但我需要从Java解决这个问题，它应该是可移植的。最佳答案我认为您在这里谈论的是两件不同的事情:从PDF中提取图像，以及将PDF页面转换为图

pdfbox java section apache image pdf rendering

java - 如何提高 PDF 渲染器中图像的分辨率？

我想增加图像的分辨率。我用了PDFRenderer-0.9.0jar。从java.net下载用于将PDF页面转换为图像。我要转换46_2.pdfPDF文件到图像。转换后的46_2.png图片较小，尺寸为612x792[widthxheight]，所以我想将图像尺寸增加到1200x1400[widthxheight]。我之前尝试过PdfBox将PDF页面转换为PNG图像文件。有一个问题只有页面被转换但文本丢失。所以我尝试了用于图像转换的PdfRenderer库。代码:packagecom.pdfrenderer.examples;importjava.awt.Graphics2D;imp

中图 java import File 34 pdf bufferedimage myeclipse pdfrenderer

62 63 646566 67 68