草庐IT

javascript获取当前页面的html

全部标签

ruby - 如何在 Ruby 中获取字符串匹配正则表达式的特定部分?

我有一个字符串Unnecessary:12357927251data并且我需要选择冒号和数字之后的所有数据。我将使用Regexp来完成。string.scan(/:\d+.+$/)这会给我:12357927251data,但是我可以只选择需要的信息.+(data)吗? 最佳答案 正则表达式中括号中的任何内容都将被捕获为一个组,您可以在$1、$2等中或使用[]在匹配对象上:string.match(/:\d+(.+)$/)[1]如果将扫描与捕获组一起使用,您将获得一组数组:"Unnecessary:123data\nUnnecessa

ruby-on-rails - 从 HTML 页面中删除所有 JavaScript

我试过使用Sanitizegem清理包含网站HTML的字符串。它只删除了标记,而不是脚本标记内的JavaScript。我可以使用什么从页面中删除JavaScript? 最佳答案 require'open-uri'#includedwithRuby;onlyneededtoloadHTMLfromaURLrequire'nokogiri'#geminstallnokogirireadmoreathttp://nokogiri.orghtml=open('http://stackoverflow.com')#GettheHTMLsour

ruby - 下载前获取文件大小并计算已经下载了多少 (http+ruby)

谁能帮帮我在我开始下载之前获取文件大小显示已经下载了多少%.require'net/http'require'uri'url="http://www.onalllevels.com/2009-12-02TheYangShow_Squidoo_Part1.flv"url_base=url.split('/')[2]url_path='/'+url.split('/')[3..-1].join('/')Net::HTTP.start(url_base)do|http|resp=http.get(URI.escape(url_path))open("test.file","wb")do|fi

Ruby:有没有办法获取类的封闭模块常量?

我正在用Ruby进行一些元编程,我需要在模块内动态生成一个同级类。这样做时,我想在模块上调用const_set,但直到运行时我才知道要调用哪个模块常量。一个例子:给定的类Foo::Bar::BazFoo::Quox::Quack我希望能够调用这样的函数(这里过于简单):defgenerate_fromklassmod=klass.enclosing_module#当使用Baz调用时,我最终想要的是一个定义为的新类Foo::Bar::GeneratedClassName还有嘎嘎,我想要Foo::Quox::GeneratedClassName我知道的唯一方法是拆分klass.name,然

ruby - 我如何在 Nokogiri 中获取下一个 HTML 元素?

假设我的HTML文档是这样的:NewsSomeinterestingnewshereSportsBaseballisfun!我可以使用以下代码获取标题div:require'rubygems'require'nokogiri'require'open-uri'url="mypage.html"doc=Nokogiri::HTML(open(url))doc.css(".headline").eachdo|item|putsitem.textend但我如何访问以下p标签中的内容,以便News与Someinterestingnewshere等相关? 最佳答案

ruby-on-rails - 从 Ruby 中的哈希数组生成 HTML 表

从哈希数组生成HTML表格的最佳方法是什么(最好是gem,但如果需要,也可以是代码片段)?例如,这个哈希数组:[{"col1"=>"v1","col2"=>"v2"},{"col1"=>"v3","col2"=>"v4"}]应该产生这个表:col1col2v1v2v3v4 最佳答案 #modifiedfromHarish'sanswer,totakecareofsparsehashes:require'builder'defhasharray_to_html(hashArray)#collectallhashkeys,evenift

ruby - 从 Curb 获取响应头

我打算从RubyonRails应用程序进行调用:c=Curl::Easy.http_post("https://example.com",json_string_goes_here)do|curl|curl.headers['Accept']='application/json'curl.headers['Content-Type']='application/json'curl.headers['Api-Version']='2.2'end响应应该有自定义header:X-Custom1:"somevalue"X-Custom2:"anothervalue"我如何遍历响应header

ruby - 使用 Ruby 获取网页的所有链接

我正在尝试使用Ruby检索网页的每个外部链接。我将String.scan与此正则表达式一起使用:/href="https?:[^"]*|href='https?:[^']*/i然后,我可以使用gsub删除href部分:str.gsub(/href=['"]/)这工作正常,但我不确定它在性能方面是否有效。这可以使用还是我应该使用更具体的解析器(例如nokogiri)?哪种方式更好?谢谢! 最佳答案 使用正则表达式对于快速而肮脏的脚本来说很好,但Nokogiri使用起来非常简单:require'nokogiri'require'open

Web学习(一)——html基础标签

html基础标签学习网站:https://www.acwing.com/学习查询网站:https://developer.mozilla.org/zh-CN/!+tab自动出现框架1.1文档结构html的所有标签都为树形结构,例如:Web应用课第一讲html标签HTML元素表示一个HTML文档的根(顶级元素),所以它也被称为根元素。所有其他元素必须是此元素的后代。head标签HTML元素规定文档相关的配置信息(元数据),包括文档的标题,引用的文档样式和脚本等。body标签HTML元素表示文档的内容。document.body属性提供了可以轻松访问文档的body元素的脚本。title标签HTML

ruby - 为 github PROJECT 页面配置 Jekyll

我已经无计可施了。我一直在尝试查看我能找到的所有其他示例github项目页面,甚至是博客,但没有一个显示出我遇到的问题。首先,我正在尝试为我的repo创建一个项目页面。我通过遵循通常的教程,在我的项目repo中创建一个gh-pages分支并推送来做到这一点。我设法做到了这些并为我的文件制作了模板。我什至设法使用HAML和SASS(它们仍然都转换为html/css,这就是我推送到repo的内容,所以没有问题)。我只是认为我错误地配置了我的jekyll。首先,我在其他人的页面中没有看到任何使用config.yml上的baseurl或url的配置。我的问题是循环浏览我的帖子时:{%forpo