草庐IT

tagged-pdf

全部标签

Java PDFBox - 阅读和修改带有特殊字符(变音符号)的 pdf

我正在尝试使用此方法修改pdf(第一个代码块-使用PDFStreamParser并遍历PDFOperator,然后在需要时更新COSString):http://www.coderanch.com/t/556009/open-source/PdfBox-Replace-String-double-pdf我遇到了一些UTF-8字符(变音符号)的问题:当我打印要更新的文本时,它显示为“Societ??iiNa?ionale”(其中“?”是一个代码,例如0002或0004)。有趣的是:当我编写更新后的pdf文件时,字符显示正确(即使我无法检测并替换它们)如果我尝试使用PDFTextStrip

java - 可以使用 iText 将 pdf 连接/合并在一起的函数 - 导致一些问题

我使用以下代码通过iText将PDF合并在一起:publicstaticvoidconcatenatePdfs(ListlistOfPdfFiles,FileoutputFile)throwsDocumentException,IOException{Documentdocument=newDocument();FileOutputStreamoutputStream=newFileOutputStream(outputFile);PdfWriterwriter=PdfWriter.getInstance(document,outputStream);document.open();P

java - 如何检测 ‘Save as PDF…’ 是从 OS X 上的 AWT PrinterJob 中选取的

我有以下代码在我的Java应用程序中显示native打印对话框。PrinterJobjob=PrinterJob.getPrinterJob();PrintRequestAttributeSetatts=newHashPrintRequestAttributeSet();atts.add(DialogTypeSelection.NATIVE);if(job.printDialog(atts)){PrintServicenewlyUsedService=job.getPrintService();DocPrintJobdocJob=newlyUsedService.createPrint

java - 使用 FlyingSaucer 将包含阿拉伯字符的 HTML 页面转换为 PDF

我想使用FlyingSaucer将包含阿拉伯字符的HTML页面转换为PDF文件,但生成的PDF不包含组合字符并向后打印输出。HTML:جميعالحقوقJava摘录:StringinputFile="c:\\html.html";Stringurl=newFile(inputFile).toURI().toURL().toString();StringoutputFile="c:\\html.pdf";OutputStreamos=newFile

java - 如何使用java将PDF文件转换成PPT文件?

我想用java将pdf文件转换为ppt文件。有这方面的第三方库吗?我该如何使用它? 最佳答案 您可以使用Open-OfficeAPI.我个人不太喜欢这个API,因为;OpenOfficeWriter与Word的兼容性不好。API的复杂性。但是可以使用API。 关于java-如何使用java将PDF文件转换成PPT文件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/5593928

java - 对于生成的 pdf 文件,静态图像不会与 Flying Saucer 和 thymeleaf 一起显示

我使用thymeleaf作为我的模板引擎,将XHTML映射到HTML,然后使用FlyingSaucer生成pdf文件。现在我无法在生成的pdf文件中显示位于/src/main/resources/的静态图像。文件本身将显示良好,只有图像消失。甚至/src/main/resources/static或/src/main/resources/public等其他位置也没有帮助。我的HTML/XHTML看起来像:它们都不能正常工作。图像本身在localhost:8048/logo_black.png可见我不想用完整的url(http://...)引用我的图片 最佳答

java - Java 中的 PDF 解析器 API

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion我想将pdf数据转换成我们自己的文件规范。所以请帮助我选择正确的API来使用java或.net进行PDF解析。解析应该从PDF页面中提取每个组件(元素)。

java - 如何在没有用户交互的情况下将 pdf 打印到特定托盘

我正在尝试设置一项在夜间运行的服务,以自动将一堆发票和其他文档打印到一堆打印机上。截至目前,我可以很好地打印文档,但我需要能够指定一个托盘(一个带有我们公司的信笺,一个带有库存白皮书)到目前为止我尝试过的一切都没有用,我指定PrintRequestAttribute集中的MediaTray属性,但似乎没有任何作用。任何人都有过这样的经历吗?我当前用于测试的代码如下所示。//CreateaPDFFilefromaFilereferenceFilef=newFile("C:\\File.pdf");FileInputStreamfis=newFileInputStream(f);FileC

java - HTML 到 PDF 转换 - "Can' t 加载 XML 资源“错误

我正在尝试使用FlyingSaucer和iText将严格的XHTML转换为PDF。我已经验证了XHTML,并且输入和输出文件的路径是准确的。我完全不知道为什么这会在renderer.setDocument("file:/c:/example/First.html")行上抛出异常。我的类(class):packageflyingsaucerpdf;importjava.io.*;importorg.xhtmlrenderer.pdf.ITextRenderer;importcom.lowagie.text.DocumentException;publicclassFirstDoc{pub

java - XML/Java : Precise line and character positions whilst parsing tags and attributes?

我正在尝试找到一种在解析XML文档时精确确定标签和属性的行号和字符位置的方法。我想这样做,以便我可以准确地向XML文档的作者(通过Web界面)报告文档无效的地方。最终我想将a中的插入符号设置为无效标记或仅在无效属性的左引号内。(此时我没有使用XML架构,因为属性的确切格式很重要,无法单独通过架构进行验证。我什至可能希望报告某些属性在属性值的中途无效。或类似地,在开始和结束标记之间的文本中途。)我试过使用SAX(org.xml.sax)和Locator接口(interface)。这在一定程度上有效,但还远远不够好。它只会在一个事件之后报告阅读位置;例如,对于startElement(),