草庐IT

批量PDF文本提取

全部标签

ruby - 解释这个原始文本 - 一种策略?

我有这个原始文本:________________________________________________________________________________________________________________________________PosCarCompetitor/TeamDriverVehicleCapCLLapsRace.TimeFastest...Lap16JasonClementsJasonClementsBMWM33200109:48.571030:57.3228*242DavidSkillenderDavidSkillenderHo

ruby-on-rails - 将用户生成的文本安全地存储在数据库中 (Ruby/Rails)

我正在尝试找到一种方法将用户生成的文本安全地存储在数据库中(这样只有用户才能访问他/她存储的文本)。我可以让Rails使用用户密码作为key来加密和解密用户的文本条目,但是如果用户忘记了他们的密码,就没有办法解密他们以前的内容/文本(因为Rails应用程序使用BCrypt来仅存储密码的哈希值)。有人知道怎么做吗?看起来Dropbox做了类似的事情:“存储在Dropbox服务器上的所有文件都经过加密(AES-256),没有您的帐户密码就无法访问。”(http://www.dropbox.com/help/27)然而,它们允许您重置密码,我假设它们不会在任何地方存储您的纯文本密码。我错过了

ruby-on-rails - wicked_pdf 在 unicode pdf 转换 (ruby) 上显示未知字符

我正在尝试使用wicked_pdf(版本1.1)和wkhtmltopdf-binarygem从html页面创建pdf。我的html页面包含一个日历表情符号,无论我使用什么字体,它都能在浏览器中很好地显示unicode{font-family:'OpenSansEmoji',sans-serif;}@font-face{font-family:'OpenSansEmoji';src:url(data:font/truetype;charset=utf-8;base64,)format('truetype');}📅但是,当我尝试使用Rails控制台中gem的WickedPd

ruby-on-rails - Rails 3.2,批量分配,动态角色?

我有一个Rails应用,其用户模型包含一个admin属性。它使用attr_accessible锁定。我的模型如下所示:attr_accessible:name,:email,:other_email,:plant_id,:password,:password_confirmationattr_accessible:name,:email,:other_email,:plant_id,:password,:password_confirmation,:admin,:as=>:admin下面是我的用户Controller中的更新方法:defupdate@user=User.find(par

ruby - MacVim 命令窗口文本着色帮助(Rspec 输出)

我正在尝试为ruby​​开发人员过渡到MacVim。我遇到的一个难题是快速运行规范并轻松获得结果(通过/失败)。当我运行:Rake(或:!rspec%)时,它会运行当前文件中的规范。输出显示在命令窗口中。如果我在常规终端中运行它,我会得到彩色输出。也就是说,点是绿色的,失败的是红色的。在MacVim中,我得到了这些奇怪的[32m和[0m标记。这是一个例子:关于如何解决这个问题有什么想法吗? 最佳答案 Gvim(我假设Macvim就是那个有品牌名称的:))背后没有真正的终端,所以这就是为什么你会得到这些“奇怪”的标记——它们是真正的转

ruby - 基于 OOP 的文本游戏中的优雅命令解析

我正在玩用Ruby编写MUD/文本冒险(请不要笑)。谁能给我任何关于解析输入文本的优雅的、基于oop的解决方案的建议?我们在这里谈论的只是“把魔杖放在table上”更复杂的事情。但是一切都需要柔软;我想稍后轻松地扩展命令集。我目前的想法,稍微简化一下:每个项目类别(盒子、table、房间、播放器)都知道如何识别“属于”它的命令。游戏类理解一种特定于领域的语言,涉及诸如“将对象X移入对象Y”、“显示对象X的描述”等Action。游戏类询问房间中的每个项目是否识别输入命令。先说是赢。然后它将控制传递给项目类中处理命令的方法。此方法重新表述DSL中的命令,将其传递回游戏对象以实现它。必须有一

ruby - 为 Heroku 静态编译 pdftk。需要将 PDF 拆分为单页文件

所以我们使用heroku来托管我们的rails应用程序。我们搬到了雪松堆。此堆栈未安装pdftk库。我联系了支持人员,被告知为amd64ubuntu静态编译它并将其包含在我的应用程序中。事实证明,这比我想象的要难。最初我下载了ubuntu的包(http://packages.ubuntu.com/natty/pdftk),将其解压缩,并包含二进制文件和共享库。我收到奇怪的错误,例如:UnhandledJavaException:java.lang.NullPointerExceptionatcom.lowagie.text.pdf.PdfCopy.copyIndirect(pdftk)

ruby-on-rails - rails : new asset path for PDF's not being recognised

我有一个Rails应用程序,我在其中添加了一个新Assets。我在Assets文件夹中添加了一个名为information的新文件夹,其中有一个名为xyz.pdf的PDF。问题是我正在尝试链接到该PDF,但是应用程序抛出错误:Noroutematches[GET]"/assets/information/xyz.pdf"我在config/application.rb文件中添加了新Assets:config.assets.paths这是我正在使用的链接:"links"%> 最佳答案 在使用Assets管道时,您应该通过以下方式引用应用

ruby - 将元数据添加到 PDF

我需要将元数据添加到我使用prawn创建的PDF中.该元数据稍后可能会被pdf-reader提取。.此元数据将包含内部文档编号和下游工具所需的其他信息。将元数据与PDF的每一页相关联会很方便。ThePDFspecification声称我可以将每页私有(private)数据存储在“Page-PieceDictionary”中。第14.5节指出:Apage-piecedictionary(PDF1.3)maybeusedtoholdprivateconformingproductdata.ThedatamaybeassociatedwithapageorformXObjectbymeans

Ruby:如何从日期时间字符串中提取一个小时(或一天)

我正在从一个大型CSV文件中提取日期时间字符串,如下所示:"11/19/200821:56"我只想提取小时,这样我就可以构建所有小时的直方图以找到最频繁的小时。同样,我想从日期中提取星期几(名称)并构建最频繁日期的直方图。我是Ruby的新手,查了资料,初学者尝试了以下各种形式,但没有运气:require'date'putsDateTime.strptime("11/19/200821:56",'%I')您能否建议一种简单(清晰)的方法来完成上述任务?此外,任何关于如何表示结果的建议都会很棒。我在想一个小时的哈希数组(24个条目)和一个天的哈希数组(7个条目)?当我遍历日期时间字符串时加