草庐IT

tagged-pdf

全部标签

xml - 数千个文档(pdf 和/或 xml)的可搜索存档的最佳实践

重新审视一个停滞不前的项目,并寻求对数千个“旧”文档进行现代化改造并通过网络提供它们的建议。文档以各种格式存在,有些已经过时:(.doc,PageMaker,硬拷贝(OCR),PDF)。资金可用于将文档迁移到“现代”格式,并且许多硬拷贝已经被OCR转换为PDF-我们最初假设PDF将是最终格式,但我们愿意接受建议(XML?).一旦所有文档都采用通用格式,我们希望提供它们的内容和可通过网络界面搜索.我们希望能够灵活地仅返回整个文档中找到搜索“命中”的部分(页面?)(我相信Lucene/elasticsearch使这成为可能?!?)如果内容都是XML会更灵活吗?如果是这样,如何/在哪里存储X

asp.net - Windows API 代码包缩略图提供 pdf 的预览缩略图,但不提供 Word 或 Excel

我正在使用MicrosoftAPI代码包并有一个使用以下代码的处理程序stringfilename="C:\\Hello.pdf";ShellFileshellFile=ShellFile.FromFilePath(filename);Bitmapbitmap=shellFile.Thumbnail.ExtraLargeBitmap;context.Response.ContentType="image/jpeg";bitmap.Save(context.Response.OutputStream,ImageFormat.Jpeg);这可以很好地为pdf文档生成“预览”样式的缩略图,但

windows - 在 Windows 中显示 PDF 和网站

在Windows中,是否有一种native方式来显示PDF文件和简单的网站?在Mac上,这两个任务都非常简单:[[PDFView...]setDocument:[PDFDocument...]];[[[WebView...]mainFrame]loadRequest:[NSURLRequest...]];在Windows上有什么可比较的吗?来自哪个版本? 最佳答案 在Windows中没有任何原生的东西可以在应用程序中嵌入PDF文档。您必须托管第三方ActiveX/COM容器(例如来自Adob​​eAcrobat的容器)才能处理该问题

windows - 如何使用 ImageMagick 批量转换 pdf 并对流程进行基准测试?

在第一次使用命令行和ImageMagic摆弄之后,我已经能够做到以下几点:c:\test\paper.pdfcontainsapdffilec:\test>convertpaper.pdfoutput-%d.tiffpdf文件包含五页,输出是预期的5个tiff文件:-)现在我想将多个文件放入c:\test并循环通过它们,根据原始文件名创建页面。因此假设c:\test中有以下文件:paper.pdf(5pages)example.pdf(2pages)new.pdf(1page)批处理脚本的输出应该是c:\test\tiffs\文件夹中的8个tiff文件:paper-0.tiffpape

r - 当我使用 knitr 和 RStudio 在 Windows 上生成 pdf 文件时无法安装 framed.sty

我正在尝试使用RStudio和knitr在Windows10上生成PDF文件。我的电脑上没有LaTex。单击“编译PDF”按钮时,出现以下错误消息:LaTexError:File'framed.sty'notfound.==>Fatalerroroccurred,nooutputPDFfileproduced.我在H:\R\win-library\3.3\knitr\misc下找到了一个framed.sty文件。看起来RStudio找不到路径。所以,我尝试了一些方法。例如,安装框架包。我从https://www.ctan.org/pkg/framed?lang=en下载了框架包.然而,

正则表达式:将单词开头的 <tags> 中的小写字母替换为大写字母

我有这个正则表达式:搜索:(\w+)([A-Z])替换为:\u$1$2这会将所有单词的首字母替换为大写字母。例如:Mymotherishome->MyMotherIsHome现在,我想用同样的方式替换中的所有单词标记,来自多个文件。我写了这个正则表达式,但没有将单词开头的小写字母转换为大写(来自标签)Search:(\w+)([A-Z])Replaceby:\u$1$2谁能帮我一点忙?例如:Mymotherishome应该变成MyMotherIsHome 最佳答案 您可以使用以下正则表达式解决方案:查找内容:(?:\G(?!^)|)

javascript - 如何从 UWP(通用 Windows 平台)Web 应用程序启动 PDF

我已将现有的Web应用程序(HTML5、JS、CSS等)转换为WindowsUWP应用程序,以便(希望)我可以通过Windows应用商店将其分发到SurfaceHubs,以便它可以离线运行。一切正常,除了PDF查看。如果我在新窗口中打开PDF,基于Edge的浏览器窗口就会崩溃。如果我打开一个IFRAME并将PDFJS加载到其中,那也会崩溃。我真正想做的是将PDF交给操作系统,这样用户就可以在他们安装的任何PDF查看器中查看它。我发现了一些看起来很有前途的特定于Windows的JavascriptAPI,但我无法让它们工作。例如:Windows.System.Launcher.launc

windows - 如何让 emacs 正确打印 pdf?

关闭。这个问题不满足StackOverflowguidelines.它目前不接受答案。想改善这个问题吗?更新问题,使其成为on-topic对于堆栈溢出。2年前关闭。Improvethisquestion如果您已经走上emacs之路,您就会知道它有多么强大,而它又是多么无用。完全披露:由于org-babel和use-package,我的4800行初始化文件(即将成为3000)确实设法在27.5秒内加载了125个有用的包——但我仍然没有设法让它打印pdf.哦,emacs,最简单的东西吧?所以当然emacs专家的人数正在减少,原因显而易见,但我猜这里至少有一些人已经完全征服了emacs。唉,

python - 使用 sphinx/miktex 生成在 windows 中显示 UTF8 日文 (CJK) 文本的 pdf 文件

我有ReSt(UTF8)格式的文档,我正在使用sphinx生成HTML和latex文件。(html转换没有问题)然后我想将生成的latex文件转换为PDf。目前我正在使用MiKTeX2.7的pdflatex.exe命令来执行此转换。(转换没有日语字符的源文件会正确生成预期的pdf)我使用MiKTeX包管理器安装了cjk相关包:cjk-fonts、miktex-cjkutils-bin-2.7和cjk。为了调试,我使用了以下示例:\documentclass{article}\usepackage{CJK}\begin{document}\begin{CJK}{UTF8}{song}\

windows - 使用脚本从pdf文档中获取文本

很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visitthehelpcenter.关闭10年前。如何使用脚本从pdf文档中获取文本?我使用Windows,偶尔使用Linux。