草庐IT

docsplit

全部标签

ruby-on-rails - Docsplit Ruby on Rails

我正在尝试获取docsplit使用我的Rails应用程序。现在我只是想让它在本地运行。我安装了gem和所有依赖项。所有基本示例都在命令行中运行,我能够获得Docsplit.extract_pdf('example.doc')在我的Rails应用程序中工作。但是,当我尝试使用extract_images时,即Docsplit.extract_images('example.doc',:size=>'1000x',:format=>[:png,:jpg])我收到以下错误:Docsplit::ExtractionFailed(sh:pdfinfo:commandnotfound):docsp

ruby - 使用 ruby​​ 解析 PDF 文档

我在一个文件夹中有多个具有特定结构的PDF文档:现在我希望能够解析PDF中的信息。请注意,段落的长度各不相同。显然,我并不是要你为我解决问题,但我确实需要一些关于如何实现这一目标的指导。我以前使用过nokogiri,从技术上讲,我需要类似的东西,但用于PDF。因此我的示例的伪结果如下所示:-ItemA-Title:ItemA-File:123456789.pdf-Image:ImageA.png(theimagewasstoredondisk)-Subtitle1:Contentforsubtitle1-Subtitle2:Contentforsubtitle2-Subtitle3:C

ruby - 使用 ruby​​ 应用程序时出现 remove_entry_secure 错误

我正在尝试使用docsplit将PDF文件拆分为图像。但看来我的ruby​​安装有问题。我每次都会收到以下错误:/usr/lib/ruby/1.8/fileutils.rb:694:in`remove_entry_secure':parentdirectoryisworldwritable这是完整的命令行输出:$docsplitimagespdf-test.pdf/usr/lib/ruby/1.8/fileutils.rb:694:in`remove_entry_secure':parentdirectoryisworldwritable,FileUtils#remove_entry_