草庐IT

解析HTML

全部标签

ruby-on-rails - 如何在 Rails 中的 CSV 解析期间更改编码

我想知道如何在导入和解析CSV文件时更改它的编码。我有这段代码:csv=CSV.parse(output,:headers=>true,:col_sep=>";")csv.eachdo|row|row=row.to_hash.with_indifferent_accessinsert_data_method(row)end当我读取我的文件时,我得到这个错误:Encoding::CompatibilityErrorinFileImportingController#load_fileincompatiblecharacterencodings:ASCII-8BITandUTF-8我阅读了

ruby - Elasticsearch:SearchPhaseExecutionException/解析失败

我在elasticsearch上运行了以下查询curl-XGET"http://localhost:9200/games_201403031340/_search?pretty=true"-d'{"query":{"field":{"title":"ca"}}}'结果我得到了这个错误"error":"SearchPhaseExecutionException[Failedtoexecutephase[query],allshardsfailed;shardFailures{[znmo0cd5Q3S2_ymuDANqKw][games_201403031340][1]:SearchPar

ruby-on-rails - 如何解析 url 以获取基本 url? -- rails 3.1

我怎样才能像这样解析urlhttp://www.1800contacts.com/productlist.aspx?dl=P&source=cj&ac=8.2.0007只得到http://www.1800contacts.com?附言。有些url有子域等,所以我不能在这里使用正则表达式。 最佳答案 尝试使用“uri”库:require'uri'address='http://www.1800contacts.com/productlist.aspx?dl=P&source=cj&ac=8.2.0007'uri=URI.parse(a

ruby-on-rails - 从 HTML 页面中删除所有 JavaScript

我试过使用Sanitizegem清理包含网站HTML的字符串。它只删除了标记,而不是脚本标记内的JavaScript。我可以使用什么从页面中删除JavaScript? 最佳答案 require'open-uri'#includedwithRuby;onlyneededtoloadHTMLfromaURLrequire'nokogiri'#geminstallnokogirireadmoreathttp://nokogiri.orghtml=open('http://stackoverflow.com')#GettheHTMLsour

ruby - 有什么办法可以延迟资源的属性解析到 "execute"阶段?

我有两个LWRP。第一个涉及创建磁盘卷、对其进行格式化并将其安装到虚拟机上,我们将此资源称为cloud_volume。第二个资源(它的作用并不重要)需要新格式化卷的UUID,这是必需的属性,我们将此资源称为foobar。资源cloud_volume和foobar被用在类似下面的配方中。volumes.eachdo|mount_point,volume|cloud_volume"#{mount_point}"dosizevolume['size']labelvolume['label']action[:create,:initialize]endfoobar"#{mount_point}

ruby - 我如何在 Nokogiri 中获取下一个 HTML 元素?

假设我的HTML文档是这样的:NewsSomeinterestingnewshereSportsBaseballisfun!我可以使用以下代码获取标题div:require'rubygems'require'nokogiri'require'open-uri'url="mypage.html"doc=Nokogiri::HTML(open(url))doc.css(".headline").eachdo|item|putsitem.textend但我如何访问以下p标签中的内容,以便News与Someinterestingnewshere等相关? 最佳答案

ruby - 如何在 ruby​​ 中解析天/小时/分钟/秒?

是否有gem或其他东西来解析像“4h30m”“1d4h”这样的字符串——有点像JIRA或任务规划器中的估计,也许,国际化? 最佳答案 发布第二个答案,因为慢性(这是我最初的答案所建议的)不会给你时间跨度,而是时间戳。这是我的解析器。classTimeParserTOKENS={"m"=>(60),"h"=>(60*60),"d"=>(60*60*24)}attr_reader:timedefinitialize(input)@input=input@time=0parseenddefparse@input.scan(/(\d+)(\

ruby-on-rails - 从 Ruby 中的哈希数组生成 HTML 表

从哈希数组生成HTML表格的最佳方法是什么(最好是gem,但如果需要,也可以是代码片段)?例如,这个哈希数组:[{"col1"=>"v1","col2"=>"v2"},{"col1"=>"v3","col2"=>"v4"}]应该产生这个表:col1col2v1v2v3v4 最佳答案 #modifiedfromHarish'sanswer,totakecareofsparsehashes:require'builder'defhasharray_to_html(hashArray)#collectallhashkeys,evenift

ruby - 解析单个键/值的字符串的 "ruby way"是什么?

我正在尝试解析一个多行字符串并让该行的其余部分遵循某种模式。文本:hellojohnyourusernameis:jjthanksforsigningupIwanttoextractjj,akaeverythingafter"yourusernameis:"Oneway:text="hellojohn\nyourusernameis:jj\nthanksforsigningup\n"match=text[/yourusernameis:(.*)/]value=$1但是这让我想起了perl...并没有像我告诉ruby​​那样自然地“阅读”。有没有更简洁的方法?又名“ruby”方式?谢谢

Web学习(一)——html基础标签

html基础标签学习网站:https://www.acwing.com/学习查询网站:https://developer.mozilla.org/zh-CN/!+tab自动出现框架1.1文档结构html的所有标签都为树形结构,例如:Web应用课第一讲html标签HTML元素表示一个HTML文档的根(顶级元素),所以它也被称为根元素。所有其他元素必须是此元素的后代。head标签HTML元素规定文档相关的配置信息(元数据),包括文档的标题,引用的文档样式和脚本等。body标签HTML元素表示文档的内容。document.body属性提供了可以轻松访问文档的body元素的脚本。title标签HTML