我有一个使用Reportlab库生成PDF文件的方法:defobtenerPDFNuevoPedido(self,handler,rsUsuarioPedido,rsPedido):handler.response.headers['Content-Type']='application/pdf'handler.response.headers['Content-Disposition']='attachment;filename=output.pdf'story=[]story.append(Paragraph('CHIPAS',ParagraphStyle(name="center
我有很多文件夹,里面有很多图片。现在我想要每个文件夹一个PDF,以便文件夹中包含的所有图像都进入PDF。我有1000个文件夹,所以我想要一些可以批处理或可以进入文件夹并开始处理的东西。 最佳答案 我会用ImageMagick解决这个问题,而不是用Python。ImageMagick有控制台工具“转换”。像这样使用它:convert*.jpgfoo.pdf参见here.(取决于你使用的是Windows、Mac还是Linux,用Google应该很容易找到) 关于python-是否有任何脚本可
我有一些超过500页的.pdf文件,但我只需要每个文件中的几页。有必要保留文档的标题页。我确切地知道程序应该删除的页数。我如何使用安装在MSVisualStudio上的Python2.7环境来做到这一点? 最佳答案 尝试使用PyPDF2.不是删除页面,而是创建一个新文档并添加您不想删除的所有页面。一些示例代码(最初改编自已失效的BinPress,存档here)。fromPyPDF2importPdfWriter,PdfReaderpages_to_keep=[1,2,10]#pagenumberingstartsfrom0infil
我应该如何对PDF文件进行base64编码以便在Python中通过XML-RPC进行传输? 最佳答案 如果不想使用xmlrpclib的Binary类,可以直接使用strings的.encode()方法:a=open("pdf_reference.pdf","rb").read().encode("base64") 关于python-如何在Python中对PDF文件进行base64编码,我们在StackOverflow上找到一个类似的问题: https://st
我有隐藏部分pdf的代码(通过用白色多边形覆盖它)但问题是,文本仍然在那里,如果你ctrl-f你仍然可以找到它。我的目标是实际从pdf本身中删除文本。使用pdfminer我设法从pdf中提取文本,但我不知道是否可以用一些空白空间来实际“替换”文本。使用python这样的事情可能吗?提取它是不够的。我需要从PDF中删除文本 最佳答案 这样的事情可能吗?是的,虽然不推荐。在我看来,最好的办法是打开并读取现有文件,将其移动为可编辑格式,删除您不希望出现的任何文本,然后将其转换回来。但是,您可以使用以下方法提取数据并将其从内存中删除:imp
我找到了两个我喜欢的jQuery图表插件-flot和jqPlot。我正在考虑在我的网站前端使用其中之一。不过,我还需要能够让用户以PDF格式导出数据。理想情况下,我正在寻找纯Python解决方案,但可以一键运行到Java或PHP。生成图表的质量是最重要的因素。我考虑过的选项是:在服务器上生成图表,并使用这些图表创建PDF。我看过matplotlib和其他几个python图表包,但这些图表看起来远没有flot或jqPlot制作的那么精美。使用Rhino和Env.js在服务器上运行相同的jQuery代码,并以某种方式捕获生成的图表并将其插入到PDF中。Rhino可以做到吗?大概有多难?我看
我有一份32页的PDF版家谱。与其将家谱全部放在一个非常大的PDF页面上(这是我想要的),不如将其格式化为一组8个单独的美国信纸大小的页面应该在整个宽度上缝合;4行这样就完成了树。每页边距均为22px。如果您以表格形式将其可视化(其中数字代表PDF页码):我已经尝试编写一些Python代码来执行此操作,但进展并不顺利。如何拼接PDF,使其成为一个大页面而不是较小的单独页面?感谢您的帮助。编辑:这是我写的代码。很抱歉最初没有发布它。frompyPdfimportPdfFileWriter,PdfFileReaderSTITCHWIDTH=8;currentpage=1;output=Pd
我必须创建PDF文件,其中需要在左下角添加行,如页脚。以下代码有效:importStringIOfromreportlab.pdfgenimportcanvasimportuuiddeftest(pdf_file_name="abc.pdf",pdf_size=(432,648),font_details=("Times-Roman",9)):#createanewPDFwithReportlatext_to_add="Iamwritinghere.."new_pdf="test_%s.pdf"%(str(uuid.uuid4()))packet=StringIO.StringIO()
是否存在将从PDF文档中删除“所有者”密码的库,以便可以通过编程方式从中提取文本?类似于PDFTechnologies'PasswordRecoverytool,但可以从命令行或python调用。一个图形用户界面对我来说并不真正有用,因为文档的数量是如此之多。请不要对程序的合法性发表评论。讨论中的pdf是拥有的,需要提取文本以形成文档集的关键字云。 最佳答案 我不了解Python库,但是对于从PDF文档中批量删除密码,我的同事在PwdRemover方面有很好的经验(不是免费的)。 关于p
我已经从网上抓取了一份pdf,例如importrequestspdf=requests.get("http://www.scala-lang.org/docu/files/ScalaByExample.pdf")我想修改这段代码来显示它fromgi.repositoryimportPoppler,Gtkdefdraw(widget,surface):page.render(surface)document=Poppler.Document.new_from_file("file:///home/me/some.pdf",None)page=document.get_page(0)win