草庐IT

文本处理

全部标签

ruby - RobuSTLy 调用不稳定的 API:使用 Net::HTTP 进行正确的错误处理

我将其组合在一起,作为一种看似可靠的方式来调用不稳定的Web服务,该服务会出现超时和偶尔的名称解析或套接字错误或其他任何问题。我想我会把它放在这里以防它有用,或者更有可能被告知执行此操作的更好方法。require'net/http'retries=5beginurl=URI.parse('http://api.flakywebservice.com')http=Net::HTTP.new(url.host,url.port)http.read_timeout=600#beverypatientres=nilhttp.start{|http|req=Net::HTTP::Post.new

ruby - 模糊文档匹配/文本指纹识别的最佳库

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭2个月前。Improvethisquestion我正在考虑构建一个API,让程序可以提交学术出版物的“指纹”,将其与开放获取期刊的文章数据库进行匹配,如果找到,则向用户发送规范的引文信息。最初这将针对一个特定的小型研究领域,因此不一定需要处理2000万篇论文才能成功(即使涵盖了该领域1000篇最常被引用的论文,这对生产力来说也是一个巨大的福音和协作)。我想知道哪个库(理想情况下能够与Ruby交互)最适合执行此“指

ruby-on-rails - 将散列作为函数参数处理

我正在使用RubyonRails3,我正在尝试将散列作为函数参数进行处理。例如,如果我这样声明一个函数:deffunction_name(options={})...end我想向function_name传递一个类似的散列{"key1"=>"value_1","key2"=>"value2","..."=>"..."}然后在函数内部使用它。什么是最佳\常见(Rails)方法?P.S.:我在某处看到了extract_option!方法,但我不知道在哪里可以找到一些文档,也不知道我是否需要这些文档才能实现我的目标。 最佳答案 只需使用您

ruby-on-rails - ActiveResource 错误处理

我一直在寻找一段时间,但我还没有找到满意的答案。我有两个应用程序。FrontApp和BackApp。FrontApp有一个事件资源,它模仿BackApp中的模型。所有模型级别的验证都在BackApp中进行,我需要在FrontApp中处理这些BackApp验证。我有以下事件资源代码:classRemoteUser这模拟了如下模型classUser每当我在前面的应用程序中创建一个新的RemoteUser时;我调用.save。例如:user=RemoteSession.new(:username=>"user",:password=>"")user.save但是,由于密码为空,我需要将错误从

ruby - 如何通过正则表达式查找括号内的文本,但有一些异常(exception)?

我有一个正则表达式/^\[(text:\s*.+?\s*)\]/mi目前可以捕获以text开头的括号中的文本:。以下是它的工作示例:[text:hereismytextthatiscapturedwithinthebrackets.]现在,我想添加一个异常(exception),以便它允许某些括号,如下例所示:[text:hereismytextthatiscapturedwithinthebracketsandalsoinclude![](/some/path)]基本上,我需要它允许匹配中的![](/some/path)括号。如有任何帮助,我们将不胜感激。谢谢。更新:下面是括号内的文

ruby - Ruby 中的 Sinatra 错误处理

我有一个简单的Sinatra休息,但我无法捕获错误。我也承认我对Ruby和Sinatra还很陌生。当我在post端点中引发错误时,我想报告传入的文档。我需要1)处理发布结果中的错误(我可以访问@incoming)或2)将传入文档传递给错误并在那里报告。什么是更好的选择,选项1还是选项2?如果我坚持使用选项1,我该如何防止错误发现错误(就像它现在所做的那样)如果我转到选项2,我如何将incoming传递给error?下面是我的代码示例:post('/result')dobegin@incoming=JSON.parse(request.body.read)//dosomethingtha

ruby - 正则表达式 - 匹配某些字符后的文本

我想从一些文本中抓取数据并将其转储到一个数组中。将以下文本作为示例数据:|ExampleData|Title:Thisisasampletitle|Content:Thisissamplecontent|Date:12/21/2012我目前正在使用以下正则表达式来抓取“冒号”字符后指定的数据:/((?=:).+)/不幸的是,这个正则表达式也抓取了冒号和冒号后面的空格。如何只抓取数据?此外,我不确定我这样做是否正确..但看起来好像外部括号导致匹配返回数组。这是parens的功能吗?编辑:我正在使用Rubular来测试我的正则表达式 最佳答案

ruby - 如何使用 Ruby(和 open-uri)并行处理数组中的项目

我想知道如何使用open-uri打开多个并发连接?我认为我需要以某种方式使用线程或纤维,但我不确定。示例代码:defget_doc(url)beginNokogiri::HTML(open(url).read)rescueException=>exputs"Failedat#{Time.now}"puts"Error:#{ex}"endendarray_of_urls_to_process=[......]#HowcanIiterateoveritemsinthearrayinparallel(insteadofoneatatime?)array_of_urls_to_process.

ruby - 将 HTML 转换为纯文本(包含 <br>s)

是否可以使用Nokogiri将HTML转换为纯文本?我还想包括标签。例如,给定这个HTML:alamakotaikottoidiota我想要这个输出:alamakotaikottoidiota当我调用Nokogiri::HTML(my_html).text它不包括标签:alamakotaikottoidiota 最佳答案 我没有编写复杂的正则表达式,而是使用了Nokogiri。工作解决方案(K.I.S.S!):defstrip_html(str)document=Nokogiri::HTML.parse(str)document.c

ruby-on-rails - 如何在 Ajax 请求处理期间显示动画图标 - Rails 3

我正在尝试为每个ajax请求显示一个加载指示器,我在Rails3应用程序中工作。HTML:"loading-indicator",:style=>"display:none")%>CSS:#loading-indicator{position:absolute;left:10px;top:10px;}loading.js:我放在assest/javascripts/$(document).ready(function(){$(document).ajaxSend(function(event,request,settings){$('#loading-indicator').show(