草庐IT

java - 在 PDFBox 中,如何更改 PDRectangle 对象的原点 (0,0)?

coder 2024-03-23 原文

情况:
在 PDFBox 中,PDRectangle 对象的默认原点 (0,0) 似乎是页面的左下角。

例如,以下代码在页面的左下角为您提供一个正方形,每边长 100 个单位。

PDRectangle rectangle = new PDRectangle(0, 0, 100, 100);

问题:
是否可以将原点更改为左上角,例如,上面的代码将在页面的左上角为您提供相同的正方形?

我问的原因:
我正在使用 PDFTextStripper 来获取文本的坐标(通过使用提取的 TextPosition 对象的 getX() 和 getY() 方法)。从 TextPosition 对象检索的坐标似乎在左上角有一个原点 (0,0)。我希望我的 PDRectangle 对象的坐标与我的 TextPosition 对象的坐标具有相同的原点。

我试图通过“页面高度减去 Y 坐标”来调整我的 PDRectangle 的 Y 坐标。这给了我想要的结果,但它并不优雅。我想要一个优雅的解决方案。

笔记:
有人问过类似的问题。答案是我尝试过的,这不是最优雅的。
how to change the coordiantes of a text in a pdf page from lower left to upper left

最佳答案

您可以稍微更改坐标系,但很可能最终事情不会变得更优雅。

首先...

首先让我们澄清一些误解:

你假设

In PDFBox, PDRectangle objects' default origin (0,0) seems to be the lower-left corner of a page.



并非所有情况都如此,只是经常如此。

包含显示页面区域(在纸上或屏幕上)的区域通常由 定义。裁剪框相关页面的条目:

CropBox rectangle (Optional; inheritable) A rectangle, expressed in default user space units, that shall define the visible region of default user space. When the page is displayed or printed, its contents shall be clipped (cropped) to this rectangle and then shall be imposed on the output medium in some implementation-defined manner.

... The positive x axis extends horizontally to the right and the positive y axis vertically upward, as in standard mathematical practice (subject to alteration by the Rotate entry in the page dictionary).

... In PostScript, the origin of default user space always corresponds to the lower-left corner of the output medium. While this convention is common in PDF documents as well, it is not required; the page dictionary’s CropBox entry can specify any rectangle of default user space to be made visible on the medium.



因此,原点 (0,0) 可以在任何地方 ,它可能在左下角、左上角、页面中间甚至远在显示页面区域之外。

并通过 旋转 条目,该区域甚至可以旋转 (按 90°、180° 或 270°)。

将原点(正如您似乎已经观察到的)放在左下方只是按照惯例进行的。

此外,您似乎认为坐标系是恒定的。事实也并非如此,您可以通过一些操作彻底改变用户空间坐标系,您可以平移、旋转、镜像、倾斜和/或缩放它!

因此,即使一开始坐标系是通常的坐标系,原点在左下方,x 轴向右,y 轴向上,它可能会以某种方式更改为页面内容描述中的某种奇怪的东西。绘制矩形 new PDRectangle(0, 0, 100, 100)可能会在页面中心的右侧产生一些菱形。

你可以做什么...

如您所见,PDF 用户空间中的坐标是一个非常动态的问题。你可以做些什么来驯服这种情况,取决于你使用矩形的上下文。

不幸的是,您对自己所做的事情的描述非常含糊。因此,这也会有些模糊。

页面内容中的坐标

如果要在现有页面上绘制一些矩形,首先需要一个页面内容流来写入,即 PDPageContentStream例如,它应该以保证原始用户空间坐标系不被干扰的方式准备。您可以通过使用带有三个 boolean 参数的构造函数将它们全部设置为 true 来获得这样的实例。 :
PDPageContentStream contentStream = new PDPageContentStream(doc, page, true, true, true);

然后您可以对坐标系应用变换。您希望左上角为原点,y 值向下增加。如果页面的裁剪框告诉您左上角有坐标 (xtl, ytl),因此,您应用
contentStream.concatenate2CTM(new AffineTransform(1, 0, 0, -1, xtl, ytl));

从这里开始,您有一个您想要的坐标系,原点左上角和镜像的 y 坐标。

但是请注意一件事:如果您也打算绘制文本,那么不仅文本插入点 y 坐标被镜像,而且文本本身也会被镜像,除非您通过添加一个镜像文本矩阵来抵消它!因此,如果您想添加大量文本,这可能不会像您想要的那样优雅。

注释的坐标

如果您不想在内容流中使用矩形而是添加注释,则您不受上述转换的约束,但也无法使用它。

因此,在这种情况下,您必须按原样获取裁剪框并相应地转换矩形。

为什么 PDFBox 文本提取坐标是原样

本质上,为了以正确的顺序将文本行放在一起并正确排序行,您不想要这种奇怪的情况,而是需要一个简单的稳定坐标系。一些 PDFBox 开发人员为此选择了左上角原点、y 递增向下变体,因此 TextPosition坐标已标准化为该方案。

在我看来,更好的选择是使用默认的用户空间坐标,以便更容易地重用坐标。因此,您可能想尝试使用 textPosition.getTextMatrix().getTranslateX() , textPosition.getTextMatrix().getTranslateY()对于 TextPosition textPosition

关于java - 在 PDFBox 中,如何更改 PDRectangle 对象的原点 (0,0)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28093537/

有关java - 在 PDFBox 中,如何更改 PDRectangle 对象的原点 (0,0)?的更多相关文章

  1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

    我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

  2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  3. ruby-on-rails - Ruby on Rails 迁移,将表更改为 MyISAM - 2

    如何正确创建Rails迁移,以便将表更改为MySQL中的MyISAM?目前是InnoDB。运行原始执行语句会更改表,但它不会更新db/schema.rb,因此当在测试环境中重新创建表时,它会返回到InnoDB并且我的全文搜索失败。我如何着手更改/添加迁移,以便将现有表修改为MyISAM并更新schema.rb,以便我的数据库和相应的测试数据库得到相应更新? 最佳答案 我没有找到执行此操作的好方法。您可以像有人建议的那样更改您的schema.rb,然后运行:rakedb:schema:load,但是,这将覆盖您的数据。我的做法是(假设

  4. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

    关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

  5. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  6. ruby-on-rails - 按天对 Mongoid 对象进行分组 - 2

    在控制台中反复尝试之后,我想到了这种方法,可以按发生日期对类似activerecord的(Mongoid)对象进行分组。我不确定这是完成此任务的最佳方法,但它确实有效。有没有人有更好的建议,或者这是一个很好的方法?#eventsisanarrayofactiverecord-likeobjectsthatincludeatimeattributeevents.map{|event|#converteventsarrayintoanarrayofhasheswiththedayofthemonthandtheevent{:number=>event.time.day,:event=>ev

  7. ruby-on-rails - 'compass watch' 是如何工作的/它是如何与 rails 一起使用的 - 2

    我在我的项目目录中完成了compasscreate.和compassinitrails。几个问题:我已将我的.sass文件放在public/stylesheets中。这是放置它们的正确位置吗?当我运行compasswatch时,它不会自动编译这些.sass文件。我必须手动指定文件:compasswatchpublic/stylesheets/myfile.sass等。如何让它自动运行?文件ie.css、print.css和screen.css已放在stylesheets/compiled。如何在编译后不让它们重新出现的情况下删除它们?我自己编译的.sass文件编译成compiled/t

  8. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  9. ruby - 如何指定 Rack 处理程序 - 2

    Rackup通过Rack的默认处理程序成功运行任何Rack应用程序。例如:classRackAppdefcall(environment)['200',{'Content-Type'=>'text/html'},["Helloworld"]]endendrunRackApp.new但是当最后一行更改为使用Rack的内置CGI处理程序时,rackup给出“NoMethodErrorat/undefinedmethod`call'fornil:NilClass”:Rack::Handler::CGI.runRackApp.newRack的其他内置处理程序也提出了同样的反对意见。例如Rack

  10. ruby - 如何每月在 Heroku 运行一次 Scheduler 插件? - 2

    在选择我想要运行操作的频率时,唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。 最佳答案 这不是一个优雅的解决方案,但您可以安排它每天运行,并在实际开始工作之前检查日期是否为当月的第一天。 关于ruby-如何每月在Heroku运行一次Scheduler插件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/8692687/

随机推荐