草庐IT

Java PDF 操作和渲染

coder 2024-03-13 原文

我希望这个问题能成为用 Java 处理和呈现 PDF 的综合指南。通过将多个开源库拼接在一起,我有一个相当全面的实现,我想对其进行改进。

背景

我的要求和当前的实现:

  1. 检查现有 PDF 文档的特定条件(PDF 版本、密码保护、字体嵌入、交叉引用表等)- 未实现。
  2. 允许通过页面坐标或其他机制定义 Acroform 字段。 - 未实现
  3. 提供迭代 PDF 中的表单字段、检查字段类型并用数据填充它的功能 - iText v 2.0.8
  4. 以不同的分辨率/DPI 将 PDF 渲染为图像 - 两种实现方式(pdfrenderer 和 IcePDF)
  5. 将 HTML/XHTML 文件呈现为 PDF - Flying Saucer xhtmlrenderer
  6. 在 Java 服务器环境中以的方式完成上述所有工作(暗示线程安全)

我不喜欢什么

我对以下内容不满意:

  1. iText 许可:iText 的新版本在 AGPL 许可下,这对我的项目(以及一般的商业项目?)来说不是启动器。商业许可证的费用是不小的(从基于使用情况的文档几美分到站点许可证的数万美元),如果我要支付软件的许可证费用,我想做一个完整的市场搜索最好的产品。 iText 的 2.x 版本工作正常,但其中有足够多的错误。
  2. PDF 版本一致性:这些库中的字体嵌入、交叉引用表等方面存在奇怪的一致性问题,造成了一定程度的损失。
  3. 渲染输出质量:从这些文件渲染到 PNG 的质量在嵌入字体、图像和图层方面存在一些问题。

我所希望的

我希望从用户和研究过 PDF 库的人那里得到一些反馈。为了完整性和后代,请尽可能多地包含以下信息。

  • 您的回答/评论是基于使用或研究
  • 名称、库版本和许可证(如果是商业许可证,请尽可能包含费用)
  • 你用图书馆做什么
  • 你喜欢它的什么地方/它有什么好处
  • 你不喜欢它的什么地方/它有什么不好的地方
  • 您的总体印象如何

最佳答案

我们的 BFO PDF 库位于 http://bfo.com可以很容易地完成大部分工作——加载 PDF 并确定其属性、创建、迭代和填充表单字段以及将 PDF 渲染为位图都是标准的东西。从 HTML 或 XHTML 转换有点棘手,但我们有一个配套产品 BFO 报告生成器,它将使用与 XHTML+CSS 非常相似的 XML 语法来完成此操作。

我不确定您所说的“PDF 版本一致性”是什么意思 - 如果您遇到特定问题,您可能想对此进行扩展,否则我不会太在意 PDF 中的实际版本号- 除了极少数异常(exception),PDF 功能几乎是向后和向前兼容的(较新的功能通常会被不理解它们的读者忽略)。

将 PDF 光栅化为位图是一大堆问题 - 正确地完成它意味着编写您自己的字体和图像格式解析器(一项艰巨的工作:Type 1 字体需要 PostScript 解析器),并击败 PDF 渲染的方钉模型放入圆孔即为AWT模型。它还取决于 PDF 创建软件能否正确完成这项工作。因此,无论您使用哪种软件,如果文件无法正确呈现,请将其通过电子邮件发送给支持团队 - 我们总是在为我们的 Collection 寻找麻烦的 PDF。

我们的网站有更多信息和可供下载的试用版,如果您需要有关许可费用的信息,请给我们留言。

干杯......迈克(CTO @ BFO)

关于Java PDF 操作和渲染,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4962371/

有关Java PDF 操作和渲染的更多相关文章

  1. ruby-on-rails - 渲染另一个 Controller 的 View - 2

    我想要做的是有2个不同的Controller,client和test_client。客户端Controller已经构建,我想创建一个test_clientController,我可以使用它来玩弄客户端的UI并根据需要进行调整。我主要是想绕过我在客户端中内置的验证及其对加载数据的管理Controller的依赖。所以我希望test_clientController加载示例数据集,然后呈现客户端Controller的索引View,以便我可以调整客户端UI。就是这样。我在test_clients索引方法中试过这个:classTestClientdefindexrender:template=>

  2. ruby-on-rails - Rails HTML 请求渲染 JSON - 2

    在我的Controller中,我通过以下方式在我的index方法中支持HTML和JSON:respond_todo|format|format.htmlformat.json{renderjson:@user}end在浏览器中拉起它时,它会自然地以HTML呈现。但是,当我对/user资源进行内容类型为application/json的curl调用时(因为它是索引方法),我仍然将HTML作为响应。如何获取JSON作为响应?我还需要说明什么? 最佳答案 您应该将.json附加到请求的url,提供的格式在routes.rb的路径中定义。这

  3. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  4. ruby - 如何使用 Selenium Webdriver 根据 div 的内容执行操作? - 2

    我有一个使用SeleniumWebdriver和Nokogiri的Ruby应用程序。我想选择一个类,然后对于那个类对应的每个div,我想根据div的内容执行一个Action。例如,我正在解析以下页面:https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=puppies这是一个搜索结果页面,我正在寻找描述中包含“Adoption”一词的第一个结果。因此机器人应该寻找带有className:"result"的div,对于每个检查它的.descriptiondiv是否包含单词“adoption

  5. ruby-on-rails - 如何处理 Grape 中特定操作的过滤器之前? - 2

    我正在我的Rails项目中安装Grape以构建RESTfulAPI。现在一些端点的操作需要身份验证,而另一些则不需要身份验证。例如,我有users端点,看起来像这样:moduleBackendmoduleV1classUsers现在如您所见,除了password/forget之外的所有操作都需要用户登录/验证。创建一个新的端点也没有意义,比如passwords并且只是删除password/forget从逻辑上讲,这个端点应该与用户资源。问题是Grapebefore过滤器没有像except,only这样的选项,我可以在其中说对某些操作应用过滤器。您通常如何干净利落地处理这种情况?

  6. ruby-on-rails - 在 Ruby on Rails 中发送响应之前如何等待多个异步操作完成? - 2

    在我做的一些网络开发中,我有多个操作开始,比如对外部API的GET请求,我希望它们同时开始,因为一个不依赖另一个的结果。我希望事情能够在后台运行。我找到了concurrent-rubylibrary这似乎运作良好。通过将其混合到您创建的类中,该类的方法具有在后台线程上运行的异步版本。这导致我编写如下代码,其中FirstAsyncWorker和SecondAsyncWorker是我编写的类,我在其中混合了Concurrent::Async模块,并编写了一个名为“work”的方法来发送HTTP请求:defindexop1_result=FirstAsyncWorker.new.async.

  7. ruby - 在 Ruby 中是否有一种惯用的方法来操作 2 个数组? - 2

    a=[3,4,7,8,3]b=[5,3,6,8,3]假设数组长度相同,是否有办法使用each或其他一些惯用方法从两个数组的每个元素中获取结果?不使用计数器?例如获取每个元素的乘积:[15,12,42,64,9](0..a.count-1).eachdo|i|太丑了...ruby1.9.3 最佳答案 使用Array.zip怎么样?:>>a=[3,4,7,8,3]=>[3,4,7,8,3]>>b=[5,3,6,8,3]=>[5,3,6,8,3]>>c=[]=>[]>>a.zip(b)do|i,j|c[[3,5],[4,3],[7,6],

  8. ruby-on-rails - 如何让 Rails View 返回其关联的操作名称? - 2

    我有一个非常简单的Controller来管理我的Rails应用程序中的静态页面:classPagesController我怎样才能让View模板返回它自己的名字,这样我就可以做这样的事情:#pricing.html.erb#-->"Pricing"感谢您的帮助。 最佳答案 4.3RoutingParametersTheparamshashwillalwayscontainthe:controllerand:actionkeys,butyoushouldusethemethodscontroller_nameandaction_nam

  9. ruby-on-rails - Rails 渲染带有驼峰命名法的 json 对象 - 2

    我在一个简单的RailsAPI中有以下Controller代码:classApi::V1::AccountsControllerehead:not_foundendendend问题在于,生成的json具有以下格式:{id:2,name:'Simpleaccount',cash_flows:[{id:1,amount:34.3,description:'simpledescription'},{id:2,amount:1.12,description:'otherdescription'}]}我需要我生成的json是camelCase('cashFlows'而不是'cash_flows'

  10. ruby-on-rails - 使用 header 渲染 JSON - 2

    我想在我的Controller中使用以下corsheader呈现JSON:'Access-Control-Allow-Origin'='*'.我试过这个:defmy_actionrender(json:some_params)response.headers['Access-Control-Allow-Origin']='*'end但是我得到了一个AbstractController::DoubleRenderError。有没有办法使用header呈现JSON? 最佳答案 您不能在渲染后设置header,因为已发送响应。所以在没有意

随机推荐