草庐IT

java - 使用 iText 替换 PDF 文件中的文本

我正在使用iText(5.5.13)库读取.PDF并替换文件中的模式。问题在于未找到该模式,因为在库读取pdf时不知何故出现了一些奇怪的字符。例如,在句子中:"Thisisatestinordertoseeifthe"当我试图阅读它时变成了这个:[(Thisisa)9(te)-3(st)9(ino)-4(rd)15(er)-2(t)9(o)-5(s)8(ee)7(ift)-3(h)3(e)]因此,如果我尝试查找并替换"test",则不会在pdf中找到"test"单词,并且不会被替换这是我使用的代码:publicvoidprocessPDF(Stringsrc,Stringdest){t

java - 如何在将 HTML 呈现为 PDF 时在 Flying-Saucer 中设置基本 url?

我正在尝试使用Flying-Saucer将HTML页面呈现为PDF。HTML在内存中创建并作为传递给渲染器renderer.setDocumentFromString(newString(htmlByteArray));问题是我有在HTML中,它不会在最终的HTML中呈现。图片位于resources包中的文件夹。我尝试使用以下设置基本url,但没有成功:ITextRendererrenderer=newITextRenderer();renderer.getSharedContext().setBaseURL("com/org/tools/designer/resources/");S

java - 如何在 java 中使用 wkhtmltopdf 将 pdf 导出到 OutputStream

我在带有ProccessBuilder和Process的Java项目中使用wkhtmltopdf:ProcessBuilderpb=newProcessBuilder("wkhtmltopdf.exe","input.html","output.pdf");进程process=pb.start();此解决方案使用html文件作为输入,并将输出保存为磁盘上的pdf文件。但是我的html不是文件,它是一个OutputStream,我想即时创建pdf文件,不想将它保存在磁盘上。有没有办法用OutputStream传递参数并作为另一个OutputStream获取结果?

java - 通过 Apache PDFBox 将 MS Office 文档添加到 PDF

我正在使用ApachePDFBox(http://pdfbox.apache.org/)从任意数量的文件(包括图像和其他PDF)中创建PDF。现在我需要将MSOffice文档(Word、Excel和OutlookMSG)添加到PDF。文件可以有几乎所有的Office版本,所以不能认定文件是新的office文件(如docx)或旧文件(如doc)。有没有办法只使用免费工具来做到这一点?我的第一个想法是使用ApachePOI(http://poi.apache.org/)读取每个文件的内容并将文件重新创建为一个新的PDF页面,但这可能会变得非常昂贵,因为这个PDF创建在服务器上被超过五十人使

java - FOP apache - 支持希伯来字母

最近几天我一直在调查FOPapache中对希伯来字母的支持用于生成PDF文件的项目。之前看到那个有问题,不知道解决了没有?如果有支持,有人可以向我展示/重定向到简单的示例,给我提供带有希伯来字母的XSL-FO文件,当使用FOP时,PDF会正确生成(清晰且不会被订单字母反转)。非常感谢您的回答。这件事真的很困扰我,因此我考虑转向IText... 最佳答案 您要寻找什么样的样本?对我来说很好......Hebrewכאשרהעולםרוצהלדבר,הואמדברב־Unicode如果您使用bidi-override和direction

java - 如何使用iText和Java选中具有相同变量名的PDF文件中的复选框

我一直在使用iText库作为Java来自动填充PDF文档。我要做的第一件事是映射每个字段。一旦我映射了每个字段,就将变量名称保存到Strings中,以便于访问。到现在为止还挺好。问题是我有6个具有相同变量名的复选框。例如,它们被命名为topmostSubform[0].Page2[0].p2_cb01[0]。通过一些测试,我可以弄清楚,如果我选中第一个复选框,则topmostSubform[0].Page2[0].p2_cb01[0]=1如果我检查第二个(自动取消选中第一个),则topmostSubform[0].Page2[0].p2_cb01[0]=2然后依次topmostSubf

java - 如何使用 Java 从 pdf 中提取图像(不使用 pdfbox)

我一直在研究如何从一个大的(>300MB)PDF文件中提取图像。我正在使用pdfbox但由于某些我无法弄清楚的特殊原因,某些页面未正确提取。我使用pdfbox的PDFToImage类作为我的代码的基础。那么,你知道另一个可以帮助我做到这一点的图书馆吗?我知道可以使用iText,但我读到它不能用于商业产品。我已经安装了xpdf和xpdf-utils包,名为pdfimages的实用程序运行良好。但我需要从Java解决这个问题,它应该是可移植的。 最佳答案 我认为您在这里谈论的是两件不同的事情:从PDF中提取图像,以及将PDF页面转换为图

java - 如何提高 PDF 渲染器中图像的分辨率?

我想增加图像的分辨率。我用了PDFRenderer-0.9.0jar。从java.net下载用于将PDF页面转换为图像。我要转换46_2.pdfPDF文件到图像。转换后的46_2.png图片较小,尺寸为612x792[widthxheight],所以我想将图像尺寸增加到1200x1400[widthxheight]。我之前尝试过PdfBox将PDF页面转换为PNG图像文件。有一个问题只有页面被转换但文本丢失。所以我尝试了用于图像转换的PdfRenderer库。代码:packagecom.pdfrenderer.examples;importjava.awt.Graphics2D;imp

java - 使用 iText 生成波斯语 PDF

您好我知道很多人以前可能问过这个问题。我已经阅读了几乎所有的内容`但它无法帮助我解决我的问题。我正在使用iTextjava库生成波斯语PDF。我正在使用以下代码:Documentdocument=newDocument(PageSize.A4,50,50,50,50);FileOutputStreamfos=newFileOutputStream("D:\\ITextTest.pdf");PdfWriterwriter=PdfWriter.getInstance(document,fos);document.open();BaseFontbf=BaseFont.createFont("

java - 将表格添加到同一页上的现有 PDF - ITEXT

我的java项目有两个部分。我需要填充pdf的字段我需要在页面空白区域的填充部分下方添加一个表格(并且该表格需要能够翻转到下一页)。我可以单独完成这些事情(填充pdf并创建表格)。但我无法有效地合并它们。我试过执行doc.add(table)这将导致表格位于pdf的下一页,这是我不想要的。我基本上只需要能够指定表格在页面上的开始位置(这样它就不会与现有内容重叠),然后将表格标记到现有pdf上。如果这不起作用,我的另一个选择是尝试向将由表格内容填充的原始pdf添加字段(因此它将是一个基于字段的表格)。有什么建议吗?编辑:我是iText的新手,之前没有使用过columntext,但我试图在