草庐IT

regex - 快速替换出现的正则表达式

全部标签

ruby - Ruby 字符串字典中的快速模糊/近似搜索

我有一个包含50K到100K字符串的字典(最多可以包含50个以上的字符),我正在尝试查找给定字符串是否在具有“编辑”距离公差的字典中。(例如Levenshtein)。在进行搜索之前,我可以预先计算任何类型的数据结构。我的目标是尽快针对该字典运行数千个字符串并返回最近的邻居。如果有一个明显更快的算法,我会得到一个bool值来说明给定的是否在字典中为此,我首先尝试计算所有Levenshtein距离并取最小值,这显然非常慢。所以我尝试根据这篇文章实现一个LevenshteinTriehttp://stevehanov.ca/blog/index.php?id=114在这里查看我的重现基准的要

ruby - 条件语句出现在表达式之前还是之后有关系吗?

如果这是一个愚蠢的问题,我很抱歉,但我是一个在ruby​​周围摸索的C#人..在ruby​​中,我注意到很多人这样做:do_something(withparams)if1=1那个和这个之间有什么区别吗(甚至是轻微的):if1=1do_something(withparams)还是为了更清楚而写的相同内容? 最佳答案 后者在句法上是无效的。你需要写:if1==1thendo_something(withparams)end单行条件句必须始终尾随。是的,有区别。试试这些:bar1=iffoo1=14foo1*3end#=>42bar2

ruby - 希望正则表达式在第一次出现 "."和 ";"时停止

我正在尝试从段落中提取句子到,模式如下Current.timeissixthirtyatScotland.Past.timewasfivethirtyatIndia;Current.timeisfivethirtyatScotland.Past.timewasfivethirtyatScotland.Current.timeisfivetenatScotland.当我将正则表达式用作/current\..*scotland\./i这匹配所有字符串Current.timeissixthirtyatScotland.Past.timewassixthirtyatIndia;Current.

ruby - 为什么只有有限数量的正则表达式捕获存储在 `global_variables` 中?

如果我用包含十个捕获的正则表达式进行匹配:/(o)(t)(th)(f)(fi)(s)(se)(e)(n)(t)/.match("otthffisseent")然后,对于$10,我得到:$10#=>"t"但global_variables中缺少它。我得到(在irbsession中):[:$;,:$-F,:$@,:$!,:$SAFE,:$~,:$&,:$`,:$',:$+,:$=,:$KCODE,:$-K,:$,,:$/,:$-0,:$\,:$_,:$stdin,:$stdout,:$stderr,:$>,:$这里只列出前九个:$1,:$2,:$3,:$4,:$5,:$6,:$7,:$8,

ruby - 如何编写正则表达式以仅查找四位数的数字?

我正在尝试在Ruby中编写一个正则表达式来搜索字符串中只有四位数字的数字。我正在使用/\d{4}/但这是给我四位数或更多位数的数字。例如:“12345-456-6575一些文本9897”在这种情况下,我只需要9897和6575,但我还得到了长度为五个字符的1234。 最佳答案 "12345-456-6575sometext9897".scan(/\b\d{4}\b/)=>["6575","9897"] 关于ruby-如何编写正则表达式以仅查找四位数的数字?,我们在StackOverflo

ruby - 在 Ruby 中动态替换对象上的方法实现

我想用用户指定的block替换对象方法的实现。在JavaScript中,这很容易实现:functionFoo(){this.bar=function(x){console.log(x)}}foo=newFoo()foo.bar("baz")foo.bar=function(x){console.error(x)}foo.bar("baz")在C#中也很容易classFoo{publicActionBar{get;set;}publicFoo(){Bar=x=>Console.WriteLine(x);}}varfoo=Foo.new();foo.Bar("baz");foo.Bar=x

ruby/regex 获取每个单词的第一个字母

我想把每个单词的第一个字母放在一起,使“我需要帮助”变成“Inh”。我当时想剪掉所有东西,然后从那里开始,或者立即抓取每个第一个字母。 最佳答案 您可以在这里简单地使用split、ma​​p和join。string='Ineedhelp'result=string.split.map(&:first).joinputsresult#=>"Inh" 关于ruby/regex获取每个单词的第一个字母,我们在StackOverflow上找到一个类似的问题: http

ruby-on-rails - 将字符串与 rspec 中的正则表达式进行比较?

我在做expect(@link.url_address=='abc').tobe_true但url_address可能在abc之后有其他文本,所以我正在尝试expect(@link.url_address=~'abc').tobe_true但是我得到了Failure/Error:expect(@link.url_address=~/abc/).tobe_trueexpectedtorespondto`true?`我也试过expect(@link.url_address).to=~/abc/但是我明白了Failure/Error:expect(@link.url_address).to=

出现错误时的 Ruby/Thor 退出状态

我是Thor(和Ruby)的新手,我正在考虑在构建脚本中使用它,因为据说它可以替代Rake(从而替代Make)。然而,经过短暂的试用,我对它返回的错误状态感到困惑。我快速浏览了wiki,但没有看到任何提及。只有第一个“简单示例”,test.thor:classTest版本号:eruve>thorversionThor0.18.1我尝试了以下,故意错误的命令:eruve>ruby--version;thortest:examplebadarg;echoexitstatus:$?ruby2.0.0p195(2013-05-14revision40734)[x86_64-darwin10.8

ruby - 从第二次出现的字符拆分字符串

如何从第二次出现的字符拆分字符串str="20050451100_9253629709-2-2"Ineedtheoutput["20110504151100_9253629709-2","2"] 最佳答案 没有什么比得上单线了:)str.reverse.split('-',2).collect(&:reverse).reverse它将反转字符串,用“-”分割一次,从而返回2个元素(第一个“-”前面的内容和它后面的所有内容),然后反转两个元素,然后反转数组本身。编辑*before,after=str.split('-')puts[be