草庐IT

python - 如何使用pypdf将字符串插入pdf?

对不起,..我是python菜鸟..我需要创建一个pdf文件,而不使用现有的pdf文件..(纯粹创建一个新文件)我有谷歌搜索,其中很多是合并2pdf或从另一个文件中的特定页面创建新文件副本......我想要实现的是制作一个报告页面(在图表中),但对于第一步或简单一个“如何将字符串插入我的pdf文件?(你好,我的世界)”..这是我用一个空白页制作一个新的pdf文件的代码frompyPdfimportPdfFileReader,PdfFileWriterop=PdfFileWriter()#heretoaddblankpageop.addBlankPage(200,200)#howtoad

python - 将 SVG 转换为 PDF(svglib + reportlab 不够好)

我正在批量创建一些SVG,需要将它们转换为PDF文档以便打印。我一直在尝试使用svglib及其svg2rlg方法,但我刚刚发现在我的文档中保留矢量图形绝对令人震惊。它几乎不能正确定位文本。我动态生成的SVG格式正确,我已经在原始输入上测试了svglib以确保这不是我引入的问题。那么,除了svglib和ReportLab,我还有哪些选择?它必须是免费的或非常便宜,因为我们已经超出了该项目的预算。我们付不起ReportLabPlus每年1000美元的费用。我正在使用Python,但在这个阶段,只要它能在我们的Ubuntu服务器上运行,我就很高兴。编辑:测试王子。好多了,但它仍然忽略了一半的

python - 在 python 中将 excel 文件中选定的工作表打印为 pdf

我需要编写一个python脚本来读取excel文件,找到每个工作表,然后使用excel中定义的标准格式将它们打印成pdf。我发现了以下问题HowcanIopenanExcelfileinPython?这让我想到了http://www.python-excel.org/这让我能够找到每个工作表的名称。importxlrdbook=xlrd.open_workbook("myfile.xls")print"Worksheetname(s):",book.sheet_names()这导致Worksheetname(s):[u'Form5',u'Form3',u'988172AdamsRoad

python - 如何使用 Python 将 .pptx 转换为 .pdf

几个小时以来,我一直在寻找通过Python脚本将.pptx文件转换为.pdf文件的方法,但似乎没有任何效果。我试过的:我试过1)thisscript它调用windows32.client,和2)unoconv,但他们似乎都不适合我。遇到的问题:使用第一个选项中的脚本会引发错误(com_error:(-2147352567,'Exceptionoccurred.',(0,None,None,None,0,-2147024894),None)),而在第二个选项中,Python似乎无法识别unoconv,即使在使用pip安装之后也是如此。我也看到了一些推荐Pandoc,但我不明白如何将它用于

python - PDF 提取中的空白和奇怪的单词解释

使用下面的代码片段,我尝试从this中提取文本数据PDF文件。importpyPdfdefget_text(path):#LoadPDFintopyPDFpdf=pyPdf.PdfFileReader(file(path,"rb"))#Iteratepagescontent=""foriinrange(0,pdf.getNumPages()):content+=pdf.getPage(i).extractText()+"\n"#Extracttextfrompageandaddtocontent#Collapsewhitespacecontent="".join(content.rep

python - 在 Python 中向现有 PDF 文档添加文本

我正在尝试将pdf转换为与我的A4页面pdf相同的大小。convertmy_pdf.pdf-density300x300-pageA4my_png.png然而,生成的png文件是595px×842px,这应该是72dpi的分辨率。我正在考虑使用PIL在某些pdf字段上写一些文本并将其转换回PDF。但目前图像出现错误。编辑:我从错误的角度处理问题。正确的方法根本不包括imagemagick。 最佳答案 经过一番搜索,我终于找到了解决方案:结果是this毕竟是正确的方法。然而,我觉得它还不够冗长。看来海报可能是从here拿来的(相同的变

python - 并行文档转换 ODT > PDF Libreoffice

我正在将数百个ODT文件转换为PDF文件,一个接一个地进行需要很长时间。我有一个多核CPU。是否可以使用bash或python编写脚本来并行执行这些操作?有没有一种方法可以从命令行使用libreoffice并行化(不确定我是否使用了正确的词)批量文档转换?我一直在python/bash中调用以下命令:libreoffice--headless--convert-topdf*appsmergeme.odt或subprocess.call(str('cd$HOME;libreoffice--headless--convert-topdf*appsmergeme.odt'),shell=Tr

python - 使用 reportlab 生成的 pdf 提供选项卡标题

这道题真的很简单,但是我找不到任何关于它的数据。当我使用reportlab生成pdf时,将httpresponse作为文件传递,配置为显示文件的浏览器会正确显示pdf。但是,选项卡的标题仍然是“(匿名)127.0.0.1/whatnot”,这对用户来说有点难看。由于大多数网站都能以某种方式显示适当的标题,我认为这是可行的...是否有某种标题参数可以传递给pdf?或者响应的一些标题?这是我的代码:defrender_pdf_report(self,context,file_name):response=HttpResponse(content_type='application/pdf'

python - 另存为 .pdf 时,Matplotlib 图会失去透明度

我看到的问题与这个问题完全相同:MatplotlibPlotsLoseTransparencyWhenSavingas.ps/.eps除了我试图输出为PDF而不是ps/eps。上一个问题的答案指出eps不支持透明度并建议光栅化或另存为PDF。当我另存为png时,我确实得到了正确的输出,所以看起来matplotlib正在正确处理透明度,但后端失败了。显然PDF确实支持透明度,所以这不是我尝试使用的格式的问题。我在OSX(Yosemite)中运行,使用默认的MacOSXmatplotlib后端并使用matplotlib1.4.1。是否有任何原因导致此设置无法生成透明PDF输出?这在过去曾经

python - 使用 PDFMiner 解析没有/Root 对象的 PDF

我正在尝试使用PDFMinerpython绑定(bind)从大量PDF中提取文本。我编写的模块适用于许多PDF,但对于一部分PDF,我遇到了这个有点神秘的错误:ipython堆栈跟踪:/usr/lib/python2.7/dist-packages/pdfminer/pdfparser.pycinset_parser(self,parser)331break332else:-->333raisePDFSyntaxError('No/Rootobject!-IsthisreallyaPDF?')334ifself.catalog.get('Type')isnotLITERAL_CATAL