草庐IT

提取页面

全部标签

ruby - 如何使用 Mechanize/Nokogiri 获取页面源

我使用Mechanize登录到网页/servlet。我有一个页面对象:jobShortListPg=agent.get(addressOfPage)当我使用时:putsjobShortListPg我得到了我不想要的页面的“Mechanize”版本:#如何获取页面的HTML源代码? 最佳答案 使用.body:putsjobShortListPg.body 关于ruby-如何使用Mechanize/Nokogiri获取页面源,我们在StackOverflow上找到一个类似的问题:

ruby-on-rails - 使用 Rspec + Capybara 在 Rails 中测试错误页面

在Rails3.2.9中,我有如下定义的自定义错误页面:#application.rbconfig.exceptions_app=self.routes#routes.rbmatch'/404'=>'errors#not_found'效果如预期。当我在development.rb中设置config.consider_all_requests_local=false时,我在访问/foo时得到了not_foundView/p>但是我该如何使用Rspec+Capybara来测试呢?我已经试过了:#/spec/features/not_found_spec.rbrequire'spec_hel

ruby-on-rails - ruby on rails 如何在没有布局和其他头部字段的情况下呈现页面

elserespond_todo|format|format.html{render"tabelle/show"}endend我想呈现页面......只有该页面中的代码......不添加...布局和rubyonrails中的字段。我只想在页面tabelle/show.html.haml中显示代码的结果 最佳答案 你可以这样做:format.html{render"tabelle/show",:layout=>false} 关于ruby-on-rails-rubyonrails如何在没有布

uni-app制作一个左侧导航scroll-view组件,并和页面主体展示联动

先给大家看看最终效果首先我们来定义数据data(){ return{ lsit:[ 'https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fpic118.nipic.com%2Ffile%2F20161216%2F24271963_122609717000_2.jpg&refer=http%3A%2F%2Fpic118.nipic.com&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1656923017&t=183ece148b13b64e9dd503afd1b15c91'

ruby - 使用 Nokogiri 提取链接时如何获取绝对 URL?

我正在使用Nokogiri从页面中提取链接,但我想获得绝对路径,即使页面上的链接是相对路径。我怎样才能做到这一点? 最佳答案 Nokogiri是无关的,除了它为您提供链接anchor这一事实。使用Ruby的URI管理路径的库:absolute_uri=URI.join(page_url,href).to_s实际可见:require'uri'#TheURLofthepagewiththelinkspage_url='http://foo.com/zee/zaw/zoom.html'#Avarietyoflinkstotest.href

ruby-on-rails - 如何从用户数组中提取电子邮件

如果我执行User.all.pluck(:email)那么它工作正常。但如果我这样做arr=Array.newarr=User.all然后arr.pluck(:email)这是引发以下错误undefinedmethod`pluck'for#这意味着我不能将pluck与数组一起使用,那么我们如何才能像上面那样仅在一行中从一组记录中获取特定字段值。我不想遍历数组中的每条记录。 最佳答案 pluck可用于执行极简数据库查询。当你有一个数组时,只需使用map:arr.map(&:email) 关

ruby-on-rails - Rails 开发服务器很慢,需要很长时间才能加载一个简单的页面

关于Rails在开发模式下运行缓慢的类似帖子也有,但这些帖子中的解决方案都没有对我产生任何影响。我试过安装可以提高性能的gem并修改配置文件,但都没有成功。我刚开始使用Rails,所以我正在运行“Rails入门”指南中的启动应用程序,这是一个小博客。我已经按照推荐安装了Ruby1.9.3和Rails3.2.13。我在OS/X10.7.5上运行。当加载教程应用的起始页时,实际上只有1行文本和1个链接,需要20-40秒。对任何页面的每个后续请求都需要20-40秒。然而,当我查看服务器日志时,Rails所做的任何事情似乎都不会花费很长时间。日志中的事件之间的时间一直在占用。作为Rails的初

ruby-on-rails - 在 Nokogiri 中获取属性值以提取链接 URL

我有一个看起来像这样的文档:link我无法让Nokogiri为我获取href属性的值。我想将地址作为字符串存储在Ruby变量中。 最佳答案 html=linkHTMLdoc=Nokogiri::HTML(html)doc.xpath('//div/a/@href')#=>[#]或者如果您想更具体地了解div:>>doc.xpath('//div[@id="block"]/a/@href')=>[#]>>doc.xpath('//div[@id="block"]/a/@href').first.value=>"http://googl

ruby-on-rails - 在 Ruby on Rails 中添加新页面

对RubyonRails还很陌生,我可能被困在一个简单的任务上。基本上我正在开发一个同事的应用程序,需要添加一个额外的页面来向用户展示该应用程序的工作原理。我已经编写了HTML和样式。我只是不知道如何准确地将它添加到Rails并正确配置路由。任何帮助将不胜感激! 最佳答案 首先确保您的同事尚未创建Controller来处理静态页面。在app/controllers下查找标题类似于directories_controller或pages_controller等的Controller。如果他/她有,请遵循您的同事已经采用的模式设置(此时

ruby-on-rails - Ruby:从字符串中提取单词

我正在尝试从字符串中解析单词并将它们放入数组中。我试过以下方法:@string1="orienteddesign,decomposition,encapsulation,andtesting.Uses"puts@string1.scan(/\s([^\,\.\s]*)/)它似乎可以解决问题,但它有点不稳定(例如,我应该包括更多特殊字符)。在ruby中有更好的方法吗?可选:我有一个CS类(class)描述。我打算把里面的所有单词都提取出来放在一个字符串数组中,从生成的数组中去掉英语中最常见的单词,然后把剩下的单词作为标签,用户可以用来搜索cs类(class)。