草庐IT

write_pdf

全部标签

python - Matplotlib savefig 到 PDF 的不同页面

我有一个很长的情节,由几个水平的子情节组成一列。当我调用fig.savefig('what.pdf')时,生成的输出文件显示所有图表都挤在一个页面上。问题:有没有办法告诉savefig保存任意数量(可能自动确定)的pdf页面?如果可能的话,我宁愿避免使用多个文件,然后是os.system('merge...')。 最佳答案 我自己还没有尝试过,但是在matplolib常见问题解答中有一些说明可以在几页中以pdf格式保存绘图。常见问题http://matplotlib.org/faq/howto_faq.html#save-multi

python - 使用 Python 搜索和替换 PDF 中的占位符文本

我需要生成模板文档的自定义PDF副本。最简单的方法-我认为-是创建一个源PDF,其中包含一些需要进行自定义的占位符文本,即和,然后将它们替换为正确的值。我到处搜索,但真的没有办法基本上采用源模板PDF,用实际值替换占位符并写入新的PDF吗?我查看了PyPDF2和ReportLab,但似乎都无法做到。有什么建议么?我的大部分搜索都会导致使用Perl应用程序CAM::PDF,但我更愿意将其全部保留在Python中。 最佳答案 没有直接的方法可以可靠地执行此操作。PDF与HTML不同:它们逐个字符地指定文本的位置。它们甚至可能不包括用于呈

Python:AttributeError:无法腌制本地对象 'writeBuf.<locals>.write'

我对Python一点都不熟悉,平时做Ruby或者JS。但是我需要在运行Python的系统上编写基准测试脚本。我想要做的是创建一个小脚本来获取文件大小和线程数并写入一个随机缓冲区。这是我摆弄2小时后得到的结果:frommultiprocessingimportPoolimportos,sysdefwriteBuf(buf):defwrite(n):f=open(os.path.join(directory,'n'+str(n)),'w')try:f.write(buf)f.flush()os.fsync(f.fileno)finally:f.close()returnwriteif__n

python - 如何使用 Django 将 HTML 页面转换为 PDF

我在Django中有一个网络应用程序。这是一个存储账单和发票的平台。现在我正在尝试将这些账单导出为PDF。我正在使用xhtml2pdf,但它不工作。我正在使用这段代码进行测试:http://obroll.com/generate-pdf-with-xhtml2pdf-pisa-in-django-examples/它不会给出任何错误,但不会生成PDF文档。 最佳答案 尝试使用此代码。这个对我有用。更改模板的“template_testing.html”并添加要在“data={}”上呈现的数据views.py:importosfrom

python - 使用python解析pdf

我有一个pdf文件。它包含四列,所有页面都没有网格线。它们是学生的标记。我想对此分布进行一些分析。(直方图、折线图等)。我想将此pdf文件解析为电子表格或HTML文件(然后我可以非常轻松地解析)。pdf的链接是:Pdf这是一份公开文件,任何人都可以在这个域上公开获得。注意:我知道这可以通过将文件从adobereader导出为文本,然后将其导入LibreCalc或Excel来完成。但我想使用python脚本来执行此操作。请帮我解决这个问题。眼镜:Windows7的Python2.7 最佳答案 使用PyPDF2:fromPyPDF2im

如何将PDF文档上的特定/特定页面链接到Word Doc上的某个单词/号码?

我如何将PDF文档上的特定页面链接到WordDoc上的某个单词/号码?看答案请按照以下步骤:-在菜单栏上,选择工具&GT;高级编辑&GT;链接工具。您的鼠标光标将从手光标()更改为。使用此工具单击并拖动,在要链接的文本周围绘制一个框。完成绘制框后,释放鼠标按钮。将显示“创建链接”对话框。选择此文档选项中的打开页面。在页面字段中,输入您要链接单击时跳至的页面号。笔记:确保输入要链接到的页面的实际页码。您可以通过转到要链接到的页面来确定正确的页码,然后查看AdobeAcrobat屏幕()的底部以查看您在哪个页面上。单击确定以应用设置,或单击“取消”即可退出,而无需应用设置。在上面的步骤中单击确定后

python - 在使用 PdfPages 生成的多页 pdf 中插入目录的简单方法

我正在使用Pandas从一些数据文件中读取数据,并使用PdfPages生成多页pdf,其中每一页都包含来自一个数据文件的matplotlib图形。如果能够在每一页上获得链接的目录或书签,那将是很好的,这样我就可以轻松找到与给定数据文件对应的图形。有没有一种简单的方法可以在python3.5中实现这一点(例如通过某种方式插入数据文件的名称)? 最佳答案 使用Pandoc的简单解决方法。首先导入几个必要的库。importosimportnumpyasnpimportmatplotlib.pyplotasplt画一些数字。defdraw_

python - 如何防止 Jupyter Notebook 下载 PDF 打印超出边距?

在JupyterNotebook中,通过“File-Downloadas-PDFviaLaTeX(.pdf)”,我将笔记本下载为pdf文件。但是,我的许多代码块都打印在PDF页边距之外-即对于较长的代码行,它们在pdf页面右边框处被切掉。任何解决此问题的方法,以便我可以获得可读的PDF文档(除了为每一行手动添加硬回车或thewaysuggestedinthispost之外?谢谢! 最佳答案 我遇到了同样的问题。最终,我在以下位置找到了答案:http://www.markus-beuckelmann.de/blog/customizi

python wkhtmltopdf 生成pdf

我可以使用命令行wkhtmltopdf生成pdf,但是当我在python库中使用它时fromwkhtmltopdfimportWKhtmlToPdfwkhtmltopdf=WKhtmlToPdf(url='http://www.wikipedia.org',output_file='a.pdf',)我明白了'Exception:Missingurlandoutputfilearguments' 最佳答案 我认为当前版本存在问题。我有同样的问题,如果你看看他们的Githubissuespage,两天前有人发布了同样的问题。根据他们的文

python - 寻找有关如何将 PDF 转换为结构化格式的建议

我想对即将举行的拍卖中列出的一些特性进行一些分析。不幸的是,进行拍卖的城市并未以结构化格式发布信息,而是提供了一个700+pagePDF。的属性(property)正在拍卖。我想知道社区是否有关于如何将所述PDF解析为结构化格式以插入数据库或创建属性电子表格的任何想法。这是每个页面代表的图像:这是一个列出了一些属性的页面:我对python和ruby​​很满意,所以我在编写解决方案脚本时没有任何问题,但是因为“列”和这些列中的数据没有必要捆绑在一起,所以看起来这将是一个可疑的提议。任何想法将不胜感激。 最佳答案 在处理了3个小时之后,