草庐IT

Html2Pdf

全部标签

ruby - Jekyll - 生成 JSON 文件和 HTML 文件

我想让Jekyll为每个页面和帖子创建一个HTML文件和一个JSON文件。这是为了提供我的Jekyll博客的JSONAPI——例如可以在/posts/2012/01/01/my-post.html或/posts/2012/01/01/my-post.json访问帖子有谁知道是否有Jekyll插件,或者我将如何开始编写这样的插件来并排生成两组文件? 最佳答案 我也在寻找类似的东西,所以我学习了一些ruby​​并制作了一个脚本来生成Jekyll博客文章的JSON表示。我仍在努力,但大部分都在那里。我将其与Gruntjs、Sass、Bac

ruby - 将 HTML 转换为纯文本(包含 <br>s)

是否可以使用Nokogiri将HTML转换为纯文本?我还想包括标签。例如,给定这个HTML:alamakotaikottoidiota我想要这个输出:alamakotaikottoidiota当我调用Nokogiri::HTML(my_html).text它不包括标签:alamakotaikottoidiota 最佳答案 我没有编写复杂的正则表达式,而是使用了Nokogiri。工作解决方案(K.I.S.S!):defstrip_html(str)document=Nokogiri::HTML.parse(str)document.c

ruby - 使用 Mechanize 读取本地 HTML 文件

我正在构建一个爬虫,我知道如何使用ruby​​mechanize使用以下代码从网上读取页面:require'mechanize'agent=Mechanize.newagent.get"http://google.com"但是我可以使用Mechanize从文件系统中读取HTML文件吗?怎么办? 最佳答案 仅使用file://协议(protocol)对我来说效果很好:html_dir=File.dirname(__FILE__)page=agent.get("file:///#{html_dir}/example-file.html"

ruby - 我如何使用 .html.erb 作为 Sinatra View 的文件扩展名?

如果我有以下Sinatra代码:get'/hi'doerb:helloend如果我有一个名为views/hello.erb的文件,这会很好用。但是,如果我有一个名为views/hello.html.erb的文件,Sinatra找不到该文件并给我一个错误。我如何告诉Sinatra我希望它查找.html.erb作为有效的.erb扩展名? 最佳答案 Sinatra使用Tilt呈现其模板,并将扩展与其相关联。您所要做的就是告诉Tilt它应该使用ERB来呈现该扩展:Tilt.registerTilt::ERBTemplate,'html.er

ruby - 将数字签名插入现有的 pdf 文件

我需要使用Rails应用程序服务器将数字签名插入到现有的pdf文件中。(基本上,客户端上传pdf文件,服务器用本地证书签名)我一直在使用JSignpdf将数字签名插入pdf文件,并开始探索ruby​​的gems...我在ruby​​pdf网站上找到了另一个可移植文件来完成这项工作http://soft.rubypdf.com/software/pdf-digital-signe,但在ruby​​中找不到任何gem甚至示例代码来执行此操作。我也看过DigitalsignatureverificationwithOpenSSL,但无法理解如何使用本地证书文件对现有文档进行实际签名。我也在h

ruby - 使用 Ruby 填写 PDF 表单

我正在尝试使用ruby​​以编程方式填写pdf。pdf包含允许输入文本的字段:我过去通过pdf_formgem使用pdftk取得了成功,但是它没有找到这个特定pdf中的字段:$pry[1]pry(main)>require'pdf_forms'=>true[2]pry(main)>pdftk=PdfForms.new('/usr/local/bin/pdftk')=>#[3]pry(main)>pdftk.get_field_names('designation.pdf')=>[]如何使用ruby​​填写pdf? 最佳答案 PdfT

ruby-on-rails - Prawn pdf附件在邮件中

在我的Rails应用程序中,我尝试将发票附加到电子邮件中:definvoice(invoice)attachment:content_disposition=>"attachment",:body=>InvoicePdf.new(invoice),:content_type=>"application/pdf",:filename=>'invoice.pdf'mail(:to=>@user.email,:subject=>"YourInvoice")endInvoicePdf是一个PrawnPDF文档:classInvoicePdf我在电子邮件中没有收到附件。我究竟做错了什么?任何提示

ruby - 将 .doc 或 .pdf 转换为图像并在 Ruby 中显示缩略图?

将.doc或.pdf转换为图像并在Ruby中显示缩略图?有谁知道如何在Ruby(或C、python...)中生成文档缩略图 最佳答案 将PDF转换为PNG的简单RMagick示例是:require'RMagick'pdf=Magick::ImageList.new("doc.pdf")thumb=pdf.scale(300,300)thumb.write"doc.png"要转换MSWord文档,它不会那么容易。您最好的选择可能是先将其转换为PDF,然后再生成缩略图。生成PDF的选项在很大程度上取决于您运行的操作系统。一种可能是使用O

ruby-on-rails - 从 HTML 页面中删除所有 JavaScript

我试过使用Sanitizegem清理包含网站HTML的字符串。它只删除了标记,而不是脚本标记内的JavaScript。我可以使用什么从页面中删除JavaScript? 最佳答案 require'open-uri'#includedwithRuby;onlyneededtoloadHTMLfromaURLrequire'nokogiri'#geminstallnokogirireadmoreathttp://nokogiri.orghtml=open('http://stackoverflow.com')#GettheHTMLsour

ruby - 我如何在 Nokogiri 中获取下一个 HTML 元素?

假设我的HTML文档是这样的:NewsSomeinterestingnewshereSportsBaseballisfun!我可以使用以下代码获取标题div:require'rubygems'require'nokogiri'require'open-uri'url="mypage.html"doc=Nokogiri::HTML(open(url))doc.css(".headline").eachdo|item|putsitem.textend但我如何访问以下p标签中的内容,以便News与Someinterestingnewshere等相关? 最佳答案