pdf-viewer

python - 使 Sphinx 在 PDF 输出中生成未分类的代码块

代码块在PDF输出中看起来很难看(检查引号):我使用1.1.3版的Sphinx，并使用以下命令生成文档:$makelatexpdf此外，从PDF复制代码片段会破坏粘贴时的缩进:@view_config(route_name=’hello’)defhello_world(request):returnResponse(’HelloWorld!’)我希望这样:@view_config(route_name=’hello’)defhello_world(request):returnResponse(’HelloWorld!’)这样会更好:@view_config(route_name='h

中生 python section noreferrer Sphinx latex python-sphinx

python - Pywin32 将 .docx 保存为 pdf

我正在使用Word2013自动将报告创建为docx，然后将其另存为pdf格式。但是当我调用函数SaveAs2()时，脚本会弹出“另存为”窗口并抛出此异常:(-2147352567,'Exceptionoccurred.',(0,u'MicrosoftWord',u'Commandfailed',u'wdmain11.chm',36966,-2146824090),None)这是我打开和另存为新文件的代码:self.path=os.path.abspath(path)self.wordApp=win32.Dispatch('Word.Application')#createawordap

python Pywin noreferrer code noopener pywin32 word-2013

python - 使用 Python 解析 PDF 教科书中的索引页

我必须从PDF页面中提取带有缩进的文本到CSV文件中。PDF教科书的索引页:我应该将文本连同页码分成类和子类类型层次结构。例如在图像中，Applicationserver是类，ApacheTomcat是页码275中的子类>这是CSV的预期输出:我使用Tika解析器解析PDF，但在解析的内容中缩进没有正确维护(不是唯一的)以将文本拆分为类和子类。解析后的文本是这样的:谁能建议我满足此要求的正确方法？最佳答案尽管我不了解pdf提取，但可以从“已解析的文本”重建层次结构，因为“子类”部分总是以额外的换行符开始和结束。带有以下测试文本:

教科书教科 section strong class python pdfminer pdftotext named-entity-recognition natural-language-processing

python - pyqt4应用程序的pdf查看器？

我正在编写一个Python+Qt4应用程序，理想情况下需要每隔一段时间弹出一个窗口，以显示pdf文档并允许进行非常基本的操作，即滚动浏览不同的页面并打印文档。我发现reportLab可以创建pdf文件，但与pdf查看器无关。有谁知道任何可能有帮助的事情。我真的希望存在像QWebView小部件这样的东西......提前感谢大家最佳答案您可以使用Poppler图书馆。关于python-pyqt4应用程序的pdf查看器？，我们在StackOverflow上找到一个类似的问题：

python pyqt4 section stackoverflow https pdf qt4

python - ImageMagick 魔杖无法识别 pdf 图像？

我正在尝试使用this将一个pdf转换为jpg的博客文章，但是每次我尝试运行这个简单的脚本时，我都会收到此异常wand.exceptions.WandError:wandcontainsnoimagesMagickWand-56'@error/magick-image.c/MagickWriteImage/13001fromwand.imageimportImagewithImage(filename="myFile.pdf")asimg:img.save(filename="myFile.png")我使用的是最新版本的Wand和Python3.4.2。我唯一能想到的可能是版本兼容性问

ImageMagick python section code stackoverflow python-3.x wand

python - 制作一个 Python 文档的 PDF 文件

Python官网提供PDF文档下载，但是是按章节分开的。我下载了源代码并构建了PDF文档，它们也是单独的PDF。如何从源代码中的Makefile构建一个PDF文件？我认为那样阅读会更方便。如果串联单独的PDF不会遗漏目录(书签)，那也是可以接受的。我尝试了Imagemagick的convert，poppler-utils的pdftk和pdfunite，它们在连接后都丢失了书签。最佳答案如果您已有PDF，则无需重新创建它们。相反，使用类似PDFSplit&Merge的东西或PDFArchitect.---编辑---由于上述解决方案

python code section noreferrer pdf-generation python-sphinx

Python:将 PDF 转换为 DOC

如何将pdf文件转换为docx。有没有办法使用python来做到这一点？我看到一些页面允许用户上传PDF并返回一个DOC文件，例如PdfToWord提前致谢最佳答案如果您安装了LibreOfficelowriter--invisible--convert-todoc'/your/file.pdf'如果你想为此使用Python:importosimportsubprocessfortop,dirs,filesinos.walk('/my/pdf/folder'):forfilenameinfiles:iffilename.ends

Python PDF section code filename bash docx doc

python - 如何使用 PyPDF2 附加 PDF 页面

有没有人有使用pythonlibPyPDF2将两页PDF文件合并为一个文件的经验。当我尝试page1.mergePage(page2)时，结果是page2覆盖了page1。如何让它把page2添加到page1的底部？最佳答案当我在网上搜索pythonpdf合并解决方案时，我注意到人们对合并与附加存在普遍的误解。大多数人将附加操作称为合并，但事实并非如此。你在问题中描述的实际上是mergePage的预期用途，它应该被称为applyPageOnTopOfAnother但这有点长。你是什么(是)寻找实际上是将两个文件/页面附加到一个新

python PyPDF2 code file PdfFileReader pdf pdf-generation

python - 如何使用 Python 中的 poppler 库从 pdf 中提取图像？

我有一个pdf，我想使用Python从中提取一些图像。我可以使用poppler-utils库中的pdfimages从Linux命令行轻松提取图像likethis:pdfimagesmy_file.pdf/tmp/image接下来我为它找到了一个Python绑定(bind)here，并使用通常的sudoapt-getinstallpython-poppler安装它。在python解释器中，我现在可以这样做:>>>importpoppler>>>dir(poppler)['ACTION_GOTO_DEST','ACTION_GOTO_REMOTE','ACTION_JAVASCRIPT',

poppler python 39 ANNOT PAGE image pdf image-processing

python - PDF Miner PDF加密错误

我正在尝试从pdf文件中提取文本，然后尝试识别引用。我正在使用pdfminer20140328。对于未加密的文件，它运行良好，但我现在得到了一个文件:File"C:\Tools\Python27\lib\site-packages\pdfminer\pdfdocument.py",line348,in_initialize_passwordraisePDFEncryptionError('Unknownalgorithm:param=%r'%param)pdfminer.pdfdocument.PDFEncryptionError:Unknownalgorithm:param={'CF

PDF python 39 section filename encryption pdfminer

157 158 159160161 162 163