草庐IT

html - 抓取网站并将其转换为 HTML?

全部标签

ruby-on-rails - Ruby:在转换数组中的对象后传递键/值

给定数据:data=[{"id":14,"sort":1,"content":"9",foo:"2022"},{"id":14,"sort":4,"content":"5",foo:"2022"},{"id":14,"sort":2,"content":"1",foo:"2022"},{"id":14,"sort":3,"content":"0",foo:"2022"},{"id":15,"sort":4,"content":"4",foo:"2888"},{"id":15,"sort":2,"content":"1",foo:"2888"},{"id":15,"sort":1,"co

ruby - 使用默认值将 Ruby 字符串转换为整数

是否有一个Ruby方法接受一个字符串和一个默认值,如果字符串表示整数则将其转换为整数,否则返回默认值?更新我认为以下答案更可取:classStringdeftry_to_i(default=nil)/^\d+$/===self?to_i:defaultendend以下是您应该避免异常的证据:>deftime;t=Time.now;yield;Time.now-tend>time{1000000.times{|i|('_'1.3491532>time{1000000.times{|i|Integer.new('_'27.190596426 最佳答案

ruby - 使用 open-uri 和 nokogiri 在完全加载之前读取 HTML

我正在使用open-uri和nokogiri以及ruby​​来进行一些简单的网络爬虫。有一个问题,有时html在完全加载之前就被读取了。在这种情况下,我无法获取加载图标和导航栏以外的任何内容。告诉open-uri或nokogiri等待页面完全加载的最佳方法是什么?目前我的脚本是这样的:require'nokogiri'require'open-uri'url="https://www.the-page-i-wanna-crawl.com"doc=Nokogiri::HTML(open(url,ssl_verify_mode:OpenSSL::SSL::VERIFY_NONE))puts

ruby-on-rails - 在 Rails 中,如何使用字符串数组实现 HTML 选择菜单?

我有一个FinancialDocument#document_type模型属性。我想让用户从由字符串数组填充的HTML选择菜单中选择文档类型...doctypes=['Invoice','Packingslip','Other']对于每个选项,显示的标签和返回的值都是相同的。我查看了select和collection_select助手,但它们似乎适合选择子模型,而不仅仅是一个String值。我找不到如何让它们达到我的目的。这是我正在尝试的方法(我使用的是Haml,而不是Erb)...form_for(@financial_document)do|f|-doctypes=['Invoic

ruby-on-rails - 将 Date 对象转换为 TimeWithZone

我需要将Date对象转换为TimeWithZone对象,表示给定时区中那一天的开始。以下方法可行,但似乎太复杂了,因为它需要我将日期转换为字符串:?>date=Date.parse("2010-02-17")=>Wed,17Feb2010>>ActiveSupport::TimeZone['EasternTime(US&Canada)'].parse(date.to_s)=>Wed,17Feb201000:00:00EST-05:00>>ActiveSupport::TimeZone['UTC'].parse(date.to_s)=>Wed,17Feb201000:00:00UTC00

ruby - 将转义的 unicode 字符串转换为 ruby​​ 1.8 中的字符

我必须阅读一些包含以下内容的文本文件:\u201CGushingCross的小贩夫人\u201D在ruby​​1.9终端中,当我创建一个包含以下内容的字符串时:ruby-1.9.1-p378>"\u2714\u2714mygreatstring\u2714\u2714"=>"✔✔mygreatstring✔✔"在ruby​​1.8中,我没有将unicode代码转换为它们的字符:ree-1.8.7-2010.01>"\u2714\u2714mygreatstring\u2714\u2714"=>"u2714u2714mygreatstringu2714u2714"有什么简单的方法可以在R

Ruby:将十进制的日期转换为名称的日期

是否可以将strftime("%u")值快速转换为strftime("%A")或我是否需要构建一个等价散列,如{"Monday"=>1,.........“星期日”=>6}我有一个以某天为十进制值的数组class_index=[2,6,7]我想遍历这个数组来构建这样的天数数组[nil,"Tuesday",nil,nil,nil,"Saturday","Sunday"]所以我可以做class_list=[]class_index.eachdo|x|class_list[x-1]=convertxvaluetodaynameend这可能吗? 最佳答案

ruby - 在 Ruby 中使用 Nokogiri 解析 HTML

使用此HTML代码:....................如何使用Nokogiri选择类为1的第二个或第三个div? 最佳答案 您可以使用Ruby将大型结果集缩减为特定项目:page.css('div.one')[1,2]#Twoitemsstartingatindex1(2nditem)page.css('div.one')[1..2]#Itemswithindicesbetween1and2,inclusive因为Ruby索引从零开始,所以你必须注意你想要的项目。或者,您可以使用CSS选择器来查找nthitem:#Second

ruby-on-rails - 如果 Mechanize 在无响应的网站上等待,我该怎么办?

我注意到当我使用Mechanize获取没有响应的站点时,它只是继续等待。我该如何克服这个问题? 最佳答案 有几种方法可以处理它。Open-Uri和Net::HTTP有传递超时值的方法,然后告诉底层网络堆栈您愿意等待多长时间。例如,Mechanize允许您在初始化实例时获取其设置,例如:mech=Mechanize.new{|agent|agent.open_timeout=5agent.read_timeout=5}所有这些都在new的文档中,但您必须查看源代码才能了解您可以获得哪些实例变量。或者你可以使用Ruby的timeout模

ruby-on-rails - Rails 3 和 PDFKit,如何将 HTML 文件转换为横向 PDF?

我可以很好地将HTML页面转换为PDF文档。问题是,我不知道如何将HTML文件转换为横向PDF。有没有办法在Controller中设置它?从Controller...defpdf_customer_shipments@customer=Customer.find(params[:id])@shipments=Shipment.where("customer_id=?ANDstatus='Open'",@customer.id)render:layout=>'pdf'end 最佳答案 如果这有帮助,我正在使用PDFKit,并且可以使用