草庐IT

pdf-viewer

全部标签

python - 以编程方式更改PDF中文本的字体颜色

我根本不熟悉PDF规范。我想知道是否可以直接操作PDF文件,以便我认为重要的某些文本block以我选择的颜色突出显示。选择的语言是python。 最佳答案 这是可能的,但不一定容易,因为PDF格式非常丰富。您可以找到详细描述它的文档here.它给出的关于PDF如何显示文本的第一个基本示例是:BT/F1312Tf288720Td(ABC)TjETBT和ET是开始和结束文本对象的命令;tf是使用外部字体资源F13(恰好是Helvetica)的命令,大小为12;td是将光标定位在给定坐标的命令;Tj是为前一个字符串写入字形的命令。这种风格

python - Reportlab:如何向 pdf 文件添加页脚

我已经问过这个question但目前还没有答案,所以我想看看Reportlab,它似乎正在积极开发并且比fpdfpython库更好。我已经看过这个question给出的答案似乎或多或少与此相同blogpost.无论如何,显示的脚本充满了错误,但我不想否决它,OP接受了它,似乎解决了他的问题,我要争论谁,我宁愿问另一个问题。首先你需要导入fromreportlab.pdfgen.canvasimportCanvas而且它不是canvas,它是Canvas然后你不能只做Canvas.restoreState()或Canvas.saveState()也许还有更多的错误,我宁愿使用另一个例子。

python - 使用 R 抓取 PDF

我一直在成功地使用XML包来提取HTML表格,但想扩展到PDF。从以前的问题来看,似乎没有简单的R解决方案,但想知道最近是否有任何进展如果做不到这一点,Python中是否有某种方法(我是一个完全的新手)获得并处理pdf,以便我可以使用RXML包完成工作 最佳答案 从PDF中提取文本很困难,而且几乎总是需要非常小心。我将从pdftotext等命令行工具开始,看看它们输出了什么。问题是PDF可以按任何顺序存储文本,可以使用笨拙的字体编码,并且可以做一些事情,比如使用连字字符(你在正确排版中看到的连接的'ff'和'ij')让你失望。pdf

python - 在 Python 中创建和写入 pdf 文件

为什么这行不通:withopen('file.pdf','w')asoutfile:outfile.write("Hello")代码工作正常,但无法打开.pdf文件。普通文本文件和pdf有什么区别?如果我想在python中创建和写入pdf文件怎么办? 最佳答案 您可以安装fpdf库,然后:fromfpdfimportFPDFpdf=FPDF()pdf.add_page()pdf.set_xy(0,0)pdf.set_font('arial','B',13.0)pdf.cell(ln=0,h=5.0,align='L',w=0,txt

PythonMagick 找不到我的 pdf 文件

我已经从UnofficialWindowsBinaries.下载并安装了适用于python2.7、64位Windows7的PythonMagick。我正在尝试运行此代码(Processor.py)importPythonMagickpdf='test.pdf'p=PythonMagick.Image()p.density('600')p.read(pdf)p.write('doc.jpg')在此文件夹中(D:\PythonProjects\SheetMusicReader)但是,使用该相对pdf路径或pdf="D:\\PythonProjects\\SheetMusicReader"会

python - 我们可以使用 reportlab 创建交互式 PDF 表单吗?

我们可以使用reportlab创建交互式PDF表单吗?即,一种从读者那里获取数据并将其保存到数据库中的表单。 最佳答案 reportlab.pdfbase.pdfform.py暗示你可以,但它听起来不像是一个成熟的功能。SupportforAcrobatFormsinReportLabdocumentsThismoduleissomewhatexperimentalatthistime.Includesbasicsupportfortextfields,selectfields(dropdownlists),andcheckbutt

Element-ui中 使用图片查看器(el-image-viewer) 预览图片

1.简介注意:本文Element-ui版本2.11.1及以上Element-ui官方文档中有大图预览相关组件传送门:Element-ui图片组件,但我们不想通过使用Image组件的方式(先默认显示预览图片,再通过点击图片实现大图预览查看),又想实现直接预览大图的功能是否可行呢?答案是当然可以。2.图片查看器(el-image-viewer)的使用翻看了Image的源码,发现实现大图预览的是一个小组件image-viewer。打开看看它的props,如下:props:{urlList:{type:Array,default:()=>[]},zIndex:{type:Number,default:

python - 如何使用 PyPDF2 解密 PDF?

目前我正在使用PyPDF2作为依赖项。我遇到过一些加密文件并处理过他们像往常一样(在下面的代码中):fromPyPDF2importPdfReaderreader=PdfReader(pdf_filepath)ifreader.is_encrypted:reader.decrypt("")print(len(reader.pages))我的文件路径看起来像“~/blah/FDJKL49201921490,LFS.pdf”PDF.decrypt("")返回1,表示解密成功。但是当它点击打印PDF.getNumPages()时,它仍然会引发错误,“PyPDF2.utils.PdfReadE

python - 我如何使用python通过https下载pdf文件

我正在写一个python脚本,它会根据URL给定的格式在本地保存pdf文件。例如。https://Hostname/saveReport/file_name.pdf#savesthecontentinPDFfile.我正在通过python脚本打开这个URL:importwebbrowserwebbrowser.open("https://Hostname/saveReport/file_name.pdf")该网址包含大量图片和文字。打开此URL后,我想使用python脚本以pdf格式保存文件。这就是我到目前为止所做的。代码一:importrequestsurl="https://Hos

python - 使用 Python 生成扁平化的 PDF

当我从我的任何源PDF打印PDF时,文件大小下降并删除了表单中显示的文本框。简而言之,它将文件展平。这是我想要实现的行为。以下代码使用另一个PDF作为源(我想要展平的那个)创建PDF,它也写入文本框表单。我可以得到没有文本框的PDF吗?就像我将PDF打印为PDF时Adob​​e所做的那样。我的其他代码看起来像这样减去了一些东西:importosimportStringIOfrompyPdfimportPdfFileWriter,PdfFileReaderfromreportlab.pdfgenimportcanvasfromreportlab.lib.pagesizesimportle