pdf-viewer

python - 并行文档转换 ODT > PDF Libreoffice

我正在将数百个ODT文件转换为PDF文件，一个接一个地进行需要很长时间。我有一个多核CPU。是否可以使用bash或python编写脚本来并行执行这些操作？有没有一种方法可以从命令行使用libreoffice并行化(不确定我是否使用了正确的词)批量文档转换？我一直在python/bash中调用以下命令:libreoffice--headless--convert-topdf*appsmergeme.odt或subprocess.call(str('cd$HOME;libreoffice--headless--convert-topdf*appsmergeme.odt'),shell=Tr

python - 使用 reportlab 生成的 pdf 提供选项卡标题

这道题真的很简单，但是我找不到任何关于它的数据。当我使用reportlab生成pdf时，将httpresponse作为文件传递，配置为显示文件的浏览器会正确显示pdf。但是，选项卡的标题仍然是“(匿名)127.0.0.1/whatnot”，这对用户来说有点难看。由于大多数网站都能以某种方式显示适当的标题，我认为这是可行的...是否有某种标题参数可以传递给pdf？或者响应的一些标题？这是我的代码:defrender_pdf_report(self,context,file_name):response=HttpResponse(content_type='application/pdf'

reportlab python section pdf django pdf-generation httpresponse

python - 另存为 .pdf 时，Matplotlib 图会失去透明度

我看到的问题与这个问题完全相同:MatplotlibPlotsLoseTransparencyWhenSavingas.ps/.eps除了我试图输出为PDF而不是ps/eps。上一个问题的答案指出eps不支持透明度并建议光栅化或另存为PDF。当我另存为png时，我确实得到了正确的输出，所以看起来matplotlib正在正确处理透明度，但后端失败了。显然PDF确实支持透明度，所以这不是我尝试使用的格式的问题。我在OSX(Yosemite)中运行，使用默认的MacOSXmatplotlib后端并使用matplotlib1.4.1。是否有任何原因导致此设置无法生成透明PDF输出？这在过去曾经

Matplotlib python section 39 pdf plot

python - 使用 PDFMiner 解析没有/Root 对象的 PDF

我正在尝试使用PDFMinerpython绑定(bind)从大量PDF中提取文本。我编写的模块适用于许多PDF，但对于一部分PDF，我遇到了这个有点神秘的错误:ipython堆栈跟踪:/usr/lib/python2.7/dist-packages/pdfminer/pdfparser.pycinset_parser(self,parser)331break332else:-->333raisePDFSyntaxError('No/Rootobject!-IsthisreallyaPDF?')334ifself.catalog.get('Type')isnotLITERAL_CATAL

PDFMiner python section self stream pypdf pdf-parsing pdf-manipulation

python - 为什么 matplotlib fill_between 只在 PDF 上绘制边缘线？

在python的matplotlib.fill_between中，下面的最小工作示例正确绘制到屏幕和.png。然而，在生成的.pdf中，仍然绘制了边缘线。我该如何解决这个问题？fromnumpyimport*importpylabasplt#SampledataX=linspace(0,2*pi,1000)Y0=sin(X)Y1=sin(X+.2)Y2=sin(X+.4)#fill_kwargs(whatamImissing?)fbk={'lw':0.0,'edgecolor':None}ax=plt.subplot(111)ax.fill_between(X,0,Y0,facecol

fill_between matplotlib section code python pdf png

python - 如何在 matplotlib 生成的 PDF 中嵌入字体？

我在带有matplotlib的Linux上使用名为FreeSans的ttf字体。我将我的人物创建为:frommatplotlibimportrcplt.rcParams['ps.useafm']=Truerc('font',**{'family':'sans-serif','sans-serif':['FreeSans']})plt.rcParams['pdf.fonttype']=42plt.figure()#plotfigure...plt.savefig("myfig.pdf")当我在另一个程序(例如MacOSX上的illustrator)上打开它时，字体不会出现，而是使用默认字

何在 matplotlib section 39 python pdf

python - 使用 urllib2 从 URL 写入 PDF 文件

我正在尝试使用python模块urllib2保存从网络服务器生成的动态pdf文件。我使用以下代码从服务器获取数据并将该数据写入文件以便将pdf存储在本地磁盘中。:importurllib2importcookielibtheurl='https://myweb.com/?pdf&var1=1'cj=cookielib.CookieJar()opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))opener.addheaders.append(('Cookie',cookie))request=urllib2.Reques

urllib2 python section urllib

python - 在 Python 中从 PDF 中提取页面大小

我想阅读PDF并获取其页面列表和每页的大小。我不需要以任何方式操纵它，只需阅读它即可。目前正在试用pyPdf，它可以满足我的所有需求，除了一种获取页面大小的方法。理解我可能需要遍历，因为pdf文档中的页面大小可能会有所不同。我可以使用其他库/方法吗？我尝试使用PIL，一些在线食谱甚至使用d=Image(imagefilename)，但它从不读取我的任何PDF-它读取我扔给它的所有其他内容-甚至一些我不知道PIL可以做的事情.任何指导表示赞赏-我在windows764，python25上(因为我也做GAE的东西)，但我很乐意在Linux或更现代的pythiis上做。

python section noreferrer gt pdf

python - 我怎样才能在 python 中阅读 pdf？

这个问题在这里已经有了答案:HowtoextracttextfromaPDFfile?(32个答案)关闭5年前。如何在python中阅读pdf？我知道一种将其转换为文本的方法，但我想直接从pdf阅读内容。谁能解释一下python中哪个模块最适合提取pdf

python pdf section notice strong python-2.7 text-extraction

python - 如何在 App Engine 的后台任务中逐页生成 pdf 文档

我需要生成100多页的PDF文档。该过程需要处理大量数据，一次性生成需要更多的时间和内存。虽然我尝试了几种不同的方法来破解我的方式:xhtml2pdfHTML生成和转换rportlab生成一些页面和pyPdf合并我得到了不同的结果，但它很慢并且占用了比它应该更多的内存(有时会达到实例软内存限制)。目前，我在不同的任务中生成了一些部分，将每个部分存储在blobstore中，并将它们与pyPdf合并，但它会阻塞较大的文档。我生成的文档并没有那么复杂，主要是表格和文本，没有内部引用，没有TOC，没有任何应该注意文档其余部分的内容。我可以忍受鸭嘴兽的布局，我不需要花哨的文档外观或HTML2PD

何在 python strong section noreferrer google-app-engine reportlab

296 297 298299300 301 302