xml - HTTP \'charset\' 和 XML \'encoding\' 不匹配

ruby - open-uri 没有将 http 重定向到 https

我正在使用Hpricot和OpenURI来解析网页并从中提取URL。当我收到类似“http:rapidshare.com”的链接时，它不会重定向到https。这是我得到的错误:/home/leonidus/.rvm/rubies/ruby-1.9.3-p125/lib/ruby/1.9.1/open-uri.rb:216:in`open_loop':redirectionforbidden:http:.................=>https:...........................我尝试使用异常处理程序OPENURI::HTTPREDIRECT但我又遇到了同样的错

Ruby、Tor 和 Net::HTTP::Proxy

如果这是一个愚蠢的疑问，我提前道歉:我想在我的Ruby代码中使用代理来获取一些网页。我想偷偷摸摸!所以我正在使用Tor。我正在运行Tor，我可以像往常一样使用Net::HTTP.get(uri)。但我不知道如何使用Net::HTTP::Proxy来获取uri。我也无法弄清楚使用Tor将如何帮助使我的抓取匿名。非常感谢任何帮助。请不要只添加linktotheruby-docpageforNet::HTTP::Proxy.如果我明白这一点，我就不会在这里问这个了:-)另一种简单的方法是使用SOCKSify，但在这种情况下，我收到以下错误:/usr/lib/ruby/gems/1.9.2-p

Proxy Ruby section strong HTTP tor net-http

ruby-on-rails - 在 Ruby Net::HTTP.start 中为服务调用设置 read_timeout

我想在我的ruby代码中覆盖服务调用的默认超时。我打开连接如下。res=Net::HTTP.start(@@task_url.host,@@task_url.port)do|http|http.get("/tasks/#{task_id}")end我尝试如下设置read_timeout时间，但随后我的代码中出现了NoMethodError异常。res=Net::HTTP.start(@@task_url.host,@@task_url.port)res.read_timeout=10resdo|http|http.get("/tasks/#{task_id}")end建议我应该如何

ruby-on-rails read_timeout code start http ruby

ruby - 在一行中查找不区分大小写的单词匹配项

我需要查找一行中出现的所有单词，但搜索必须不区分大小写。我还需要向我的正则表达式添加什么？arr=line.scan(/\s+#{word}\s+/) 最佳答案你需要修饰符/iarr=line.scan(/\b#{word}\b/i)http://www.tutorialspoint.com/ruby/ruby_regular_expressions.htm最好使用\b作为单词边界，因为正则表达式中的第二个\s+eats空格，可用于另一个匹配词的第一个\s+；您的正则表达式在行首和行尾也失败:>"asdasdasdasd".sca

单词 ruby code section asd regex

ruby - 在 Ruby 的情况下使用带正则表达式匹配的命名捕获……什么时候？

我想使用命名捕获来解析用户输入以提高可读性。当他们键入命令时，我想捕获一些参数并传递它们。我在case语句中使用RegExp，因此无法分配/pattern/.named_captures的返回值。这是我希望能够做的(例如):whilecommand!="quit"print"Command:"command=gets.chompcasecommandwhen/load(?\w+)/load(filename)endend 最佳答案 namedcaptures在此语法时设置局部变量。regex-literal=~string不要在其他

hellip 命名 section code string ruby regex switch-statement capture

ruby - 用于类似正则表达式匹配的 xpath 表达式？

我想在具有特定模式的html文档中搜索divid。我想在正则表达式中匹配这个模式:foo_([[:digit:]]{1.8})使用xpath。上述模式的xpath等价物是什么？我坚持//div[@id="foo_然后什么？如果有人能为它继续一个合法的表达。编辑抱歉，我想我必须详细说明一下。其实不是foo_，它是post_message_顺便说一句，我使用mechanize/nokogiri(ruby)这是片段:html_doc=Nokogiri::HTML(open(myfile))message_div=html_doc.xpath('//div[substring(@id,13

xpath ruby substring code substring-after regex

Ruby HTTP 获取参数

如何通过ruby发送带参数的HTTPGET请求？我尝试了很多例子，但都失败了。最佳答案我知道这篇文章很旧，但是为了那些由谷歌带到这里的人，有一种更简单的方法可以以URL安全的方式对您的参数进行编码。我不确定为什么我没有在其他地方看到这个，因为该方法记录在Net::HTTP页面上。我已经看到Arsen7描述的方法也是其他几个问题的公认答案。在Net::HTTP中提到文档是URI.encode_www_form(params):#Letssaywehaveapathandparamsthatlooklikethis:path="

Ruby HTTP params path section get request

ruby - Vim 和 Ruby - 匹配 "do"s 和 "end"s？

我相信我们都熟悉“意外的kEnd”问题。它们总是(对我来说)很难找到，因为Vim不匹配“do”和“end”。(显然，还有其他以“end”结尾的元素，例如“if”)有没有办法配置Vim来显示这些匹配项以帮助简化调试？最佳答案如果您使用的是最新的vim(我使用的是7.4)，内置的matchit宏可以很好地处理ruby代码。只需将以下内容添加到您的.vimrc中即可启用它runtimemacros/matchit.vim点击%以匹配ruby文件中的do/end组合和许多其他组合。

amp 34 section stackoverflow end ruby vim

ruby - 如何使用 Net::HTTP 只读取正文的 x 个字节？

在读取网页正文时，Ruby的Net::HTTP方法似乎是全有或全无。例如，我如何读取正文的前100个字节？如果请求的文件不可用，我正在尝试从内容服务器读取内容服务器，该内容服务器会在响应正文中返回一条简短的错误消息。我需要阅读足够多的正文以确定文件是否存在。文件很大，所以我不想让整个body只是为了检查文件是否可用。最佳答案这是一个旧线程，但根据我的研究，如何在Ruby中通过HTTP只读取文件的一部分的问题仍然是一个大部分没有答案的问题。这是我通过猴子修补Net::HTTP得到的一个解决方案:require'net/http'#

ruby HTTP code section request

ruby - 在 Ruby 中，使用 "net/http"，我们必须加入 url 并自己使用 "?"进行查询？

在下面的代码中，我们必须使用?字符加入url.path和url.query吗？有更优雅的方法吗？我必须使用net/http，因为在某些情况下我也想在用户代理的header中放置一个字符串。require'net/http'url_string='http://www.time.gov/timezone.cgi?Pacific/d/-8'url=URI.parse(url_string)response=Net::HTTP.start(url.host,url.port)do|http|http.get(url.path+'?'+url.query)endputsresponse.bod

amp 34 code url http ruby

16 17 181920 21 22