pdf-manipulation

php - Docx 到 pdf 使用 openoffice headless 方式太慢

我一直在使用PHPWord生成docx文件。而且效果很好。但现在我还需要提供其中一些文件的pdf版本。经过一些研究我发现PyODConverter使用OOo。似乎是一个不错的选择，因为我不想依赖第三方网络服务。我在我的机器上试过了，它工作得很好，所以我也在我的服务器上应用了它。它花了一点时间，但我也设法让它在那里工作。但是有一个(坏的)问题。在服务器上这需要大约21秒才能完成，而在我的机器上它不会超过2秒。:(这对我的需求来说时间太多了，所以我一直在努力找出可能导致这种延迟的原因。使用套接字创建以无修复模式启动openoffice是可以的。所以我一直在查看python脚本，试图找出可能

Python:如何使 Reportlab 移动到 PDF 输出中的下一页

我在Windows上使用开源版本Reportlab和Python。我的代码遍历多个PNG文件并将它们组合成一个PDF。每个PNG都被拉伸(stretch)到完整的LETTER规范(8.5x11)。问题是，所有保存到output.pdf的图像都夹在彼此的顶部，只有最后添加的图像是可见的。是否需要在每个drawImage()之间添加一些内容以偏移到新页面？这是我正在做的事情的简单线性View-WIDTH,HEIGHT=LETTERcanv=canvas.Canvas('output.pdf',pagesize=LETTER)canv.setPageCompression(0)page=Im

Reportlab Python section code pdf png

python - Matplotlib savefig 到 PDF 的不同页面

我有一个很长的情节，由几个水平的子情节组成一列。当我调用fig.savefig('what.pdf')时，生成的输出文件显示所有图表都挤在一个页面上。问题:有没有办法告诉savefig保存任意数量(可能自动确定)的pdf页面？如果可能的话，我宁愿避免使用多个文件，然后是os.system('merge...')。最佳答案我自己还没有尝试过，但是在matplolib常见问题解答中有一些说明可以在几页中以pdf格式保存绘图。常见问题http://matplotlib.org/faq/howto_faq.html#save-multi

Matplotlib savefig section examples python pdf pagination

python - 使用 Python 搜索和替换 PDF 中的占位符文本

我需要生成模板文档的自定义PDF副本。最简单的方法-我认为-是创建一个源PDF，其中包含一些需要进行自定义的占位符文本，即和，然后将它们替换为正确的值。我到处搜索，但真的没有办法基本上采用源模板PDF，用实际值替换占位符并写入新的PDF吗？我查看了PyPDF2和ReportLab，但似乎都无法做到。有什么建议么？我的大部分搜索都会导致使用Perl应用程序CAM::PDF，但我更愿意将其全部保留在Python中。最佳答案没有直接的方法可以可靠地执行此操作。PDF与HTML不同:它们逐个字符地指定文本的位置。它们甚至可能不包括用于呈

python PDF section noreferrer

python - 如何使用 Django 将 HTML 页面转换为 PDF

我在Django中有一个网络应用程序。这是一个存储账单和发票的平台。现在我正在尝试将这些账单导出为PDF。我正在使用xhtml2pdf，但它不工作。我正在使用这段代码进行测试:http://obroll.com/generate-pdf-with-xhtml2pdf-pisa-in-django-examples/它不会给出任何错误，但不会生成PDF文档。最佳答案尝试使用此代码。这个对我有用。更改模板的“template_testing.html”并添加要在“data={}”上呈现的数据views.py:importosfrom

python Django template section import pdf

python - 使用python解析pdf

我有一个pdf文件。它包含四列，所有页面都没有网格线。它们是学生的标记。我想对此分布进行一些分析。(直方图、折线图等)。我想将此pdf文件解析为电子表格或HTML文件(然后我可以非常轻松地解析)。pdf的链接是:Pdf这是一份公开文件，任何人都可以在这个域上公开获得。注意:我知道这可以通过将文件从adobereader导出为文本，然后将其导入LibreCalc或Excel来完成。但我想使用python脚本来执行此操作。请帮我解决这个问题。眼镜:Windows7的Python2.7 最佳答案使用PyPDF2:fromPyPDF2im

python pdf 39 section code

如何将PDF文档上的特定/特定页面链接到Word Doc上的某个单词/号码？

我如何将PDF文档上的特定页面链接到WordDoc上的某个单词/号码？看答案请按照以下步骤：-在菜单栏上，选择工具＆GT;高级编辑＆GT;链接工具。您的鼠标光标将从手光标（）更改为。使用此工具单击并拖动，在要链接的文本周围绘制一个框。完成绘制框后，释放鼠标按钮。将显示“创建链接”对话框。选择此文档选项中的打开页面。在页面字段中，输入您要链接单击时跳至的页面号。笔记：确保输入要链接到的页面的实际页码。您可以通过转到要链接到的页面来确定正确的页码，然后查看AdobeAcrobat屏幕（）的底部以查看您在哪个页面上。单击确定以应用设置，或单击“取消”即可退出，而无需应用设置。在上面的步骤中单击确定后

特定单词链接单击页面

python - 在使用 PdfPages 生成的多页 pdf 中插入目录的简单方法

我正在使用Pandas从一些数据文件中读取数据，并使用PdfPages生成多页pdf，其中每一页都包含来自一个数据文件的matplotlib图形。如果能够在每一页上获得链接的目录或书签，那将是很好的，这样我就可以轻松找到与给定数据文件对应的图形。有没有一种简单的方法可以在python3.5中实现这一点(例如通过某种方式插入数据文件的名称)？最佳答案使用Pandoc的简单解决方法。首先导入几个必要的库。importosimportnumpyasnpimportmatplotlib.pyplotasplt画一些数字。defdraw_

PdfPages python self 34 section python-3.x pandas pdf matplotlib

python - 如何防止 Jupyter Notebook 下载 PDF 打印超出边距？

在JupyterNotebook中，通过“File-Downloadas-PDFviaLaTeX(.pdf)”，我将笔记本下载为pdf文件。但是，我的许多代码块都打印在PDF页边距之外-即对于较长的代码行，它们在pdf页面右边框处被切掉。任何解决此问题的方法，以便我可以获得可读的PDF文档(除了为每一行手动添加硬回车或thewaysuggestedinthispost之外？谢谢! 最佳答案我遇到了同样的问题。最终，我在以下位置找到了答案:http://www.markus-beuckelmann.de/blog/customizi

Notebook Jupyter section stackoverflow noreferrer python pdf jupyter-notebook

python wkhtmltopdf 生成pdf

我可以使用命令行wkhtmltopdf生成pdf，但是当我在python库中使用它时fromwkhtmltopdfimportWKhtmlToPdfwkhtmltopdf=WKhtmlToPdf(url='http://www.wikipedia.org',output_file='a.pdf',)我明白了'Exception:Missingurlandoutputfilearguments' 最佳答案我认为当前版本存在问题。我有同样的问题，如果你看看他们的Githubissuespage，两天前有人发布了同样的问题。根据他们的文

wkhtmltopdf python section code

155 156 157158159 160 161