write_pdf

java - PDFBox:处理非常大的 PDF。

我正在处理一些非常大的PDF，其中一些超过7GB。PDF有多达20,000页和许多整页彩色图像。我想使用PDFBox来处理PDF，但由于大小的原因，当我尝试打开PDF时出现OutOfMemoryError。我正在使用pdfbox-app-1.6.0版本，在Windows7上使用Intellij，java6。首先，我尝试编写一个简单的程序，它只是在PDDocument中打开PDF并将每一页复制到另一个PDDocument:http://ideone.com/arKhB接下来我尝试使用PDFBoxCopyDoc示例。两个例子都耗尽了内存。我假设这是因为PDFBox正在尝试将整个文档读入内存

如何使用C＃使用ITEXT7添加U3D在现有的PDF中

我正在使用itext7（c＃）创建PDF。我需要将U3D图片添加到外观PDF。我可以找到示例（http://developers.itextpdf.com/examples/itext-action-second-edition/chapter-16#619-pdf3d.java）但是是爪哇。谁能帮我在.NETC＃上给我一个例子吗？看答案链接的示例是用于itext5，而不是itext7。在itext7中，这个示例看起来像这样publicstaticfinalStringDEST="./target/test/resources/book/part4/chapter16/Listing_16_1

使用有的 new PdfName dict3D

java - 使用 PDFBox 获取 PDF 文本对象

我有一个PDF，我使用PDFBox从中提取了一个页面:(...)Fileinput=newFile("C:\\temp\\sample.pdf");document=PDDocument.load(input);ListallPages=document.getDocumentCatalog().getAllPages();PDPagepage=(PDPage)allPages.get(2);PDStreamcontents=page.getContents();if(contents!=null){System.out.println(contents.getInputStreamA

PDFBox java attributes import textobj

Java WebSockets : The remote endpoint was in state [TEXT_FULL_WRITING]

我正在尝试实现一些基于websockets的应用程序，它将与JS客户端进行非常密集的通信。发送消息的代码非常原始:synchronized(session){if(session.isOpen()){session.getBasicRemote().sendText(message);}}对于罕见的发送它工作得很好，但是当少数线程试图通过同一个session(套接字)发送一些消息时，会抛出下一个异常(请注意这不是多线程问题，因为代码块是由session同步的):java.lang.IllegalStateException:Theremoteendpointwasinstate[TEX

TEXT_FULL_WRITING WebSockets WsRemoteEndpointImplBase section session java tomcat websocket jsr356

java - 使用 itext 生成 pdf 并在特定行中加粗

您好，我可以使用iText生成包含数据表的pdf。如何将特定行中的特定数据加粗？最佳答案首先，您使用所需的详细信息实例化一个字体对象。在这里您将指定它是否为粗体。FontboldFont=newFont(Font.FontFamily.TIMES_ROMAN,18,Font.BOLD);FontnormalFont=newFont(Font.FontFamily.TIMES_ROMAN,10,Font.ITALIC);然后用你想用的任何字体。为了添加一个带有粗体的表格单元格。PdfPTabletable=newPdfPTable

中加 itext section Font pdfWordCell java

java - FileInputStream 和 FileOutputStream 到同一个文件 : Is a read() guaranteed to see all write()s that "happened before"?

我正在使用一个文件作为大数据的缓存。一个线程顺序写入它，另一个线程顺序读取它。我能否确定在一个线程中(通过write())写入的所有数据都可以从另一个线程中被read()，假设适当的“在Java内存模型方面发生“之前”的关系？这种行为是否记录在案？在我的JDK中，FileOutputStream没有覆盖flush()，OutputStream.flush()是空的。这就是为什么我想知道...有问题的流完全由我完全控制的类拥有。每个流都保证只能由一个线程访问。我的测试表明它按预期工作，但我仍然想知道这是否得到保证和记录。另见thisrelateddiscussion.

FileOutputStream FileInputStream code section write java concurrency stream

java - Apache Tika 提取扫描的 PDF 文件

我在使用ApacheTIKA(版本1.10)时遇到了一些问题。我得到了一些PDF文件，它们只是扫描的纸片。这意味着每个页面只是一个图像。我的目标是提取PDF文件的文本。我的tesseract设置正确，提取JPG和PNG文件非常有效。我正在使用的代码看起来像这样(不要介意丢失的异常处理):publicStringextractText(InputStreamstream){AutoDetectParserparser=newAutoDetectParser();BodyContentHandlerhandler=newBodyContentHandler(Integer.MAX_VALU

Apache java parseContext parser PDFParserConfig pdf ocr tesseract apache-tika

java - pdfbox:尝试解密 PDF

正在关注thisanswer我正在尝试使用pdfbox解密pdf文档:PDDocumentpd=PDDocument.load(path);if(pd.isEncrypted()){try{pd.decrypt("");pd.setAllSecurityToBeRemoved(true);}catch(Exceptione){thrownewException("Thedocumentisencrypted,andwecan'tdecryptit.");}这导致Exceptioninthread"main"java.lang.NoClassDefFoundError:org/bounc

pdfbox java PDDocument section encryption

java - 使用 pdfbox 编辑 pdf 页面

如何使用java和pdfbox编辑pdf页面，方法是在我已知的特定位置(以像素为单位)进行书写？我试过了但是它覆盖了:PDDocumentdocument=null;try{document=PDDocument.load(newFile("/x/x/x/mypdf.pdf"));PDPagepage=(PDPage)document.getDocumentCatalog().getAllPages().get(0);PDFontfont=PDType1Font.HELVETICA_BOLD;PDPageContentStreamcontentStream=newPDPageConte

pdfbox java PDPageContentStream contentStream code edit

java - 将 PDF 页面导出为 Java 中的一系列图像

我需要将任意PDF文档的页面导出为一系列jpeg/png/etc格式的单独图像。我需要在Java中执行此操作。虽然我知道iText、PDFBox和各种其他javapdf库，但我希望能找到一些工作示例或一些操作方法的指针。谢谢。最佳答案这是一种方法，它结合了网络上的一些代码片段。如何将PDF绘制成图像？https://pdf-renderer.dev.java.net/examples.html从图像创建缓冲图像原创:http://www.exampledepot.com/egs/java.awt.image/Image2Buf.

java image import BufferedImage pdf export

88 89 909192 93 94