草庐IT

Java 正则表达式死于堆栈溢出 : need a better version

全部标签

ruby-on-rails - 在尊重 CDATA 的同时转义 HTML 符号的正则表达式

我编写了一个内容管理系统,它使用服务器端正则表达式在将页面响应发送到客户端浏览器之前转义页面响应中的&符号。正则表达式注意已经转义或属于HTML实体一部分的&符号。例如,以下内容:a&b,c&d,©2009getschangedtothis:a&b,c&d,©2009(Onlythefirst&ismodified.)Hereistheregularexpression,whichwastakenandmodifiedfromaRailshelper:html.gsub(/&(?!([a-zA-Z][a-zA-Z0-9]*|(#\d+));)

Ruby Koans - 正则表达式和 .sub : Don't understand reason behind answer

为了澄清,这里是about_regular_expressions.rb文件中我遇到问题的确切问题:deftest_sub_is_like_find_and_replaceassert_equal__,"onetwo-three".sub(/(t\w*)/){$1[0,1]}end我知道这个问题的答案是什么,但我不明白得到这个答案是怎么回事。我对Ruby和正则表达式还很陌生,尤其是我对大括号之间的代码以及它如何发挥作用感到困惑。 最佳答案 大括号内的代码是一个blocksub用于替换匹配项:Intheblockform[...]Th

没有正则表达式反向引用的 Ruby 字符串子

我正在尝试用Ruby做一个简单的字符串子。sub()的第二个参数是一长段精简的JavaScript,其中包含正则表达式。此字符串中正则表达式中的反向引用似乎影响了sub的结果,因为被替换的字符串(即第一个参数)出现在输出字符串中。例子:input="stringishere"output=input.sub("","\&")我希望输出为:"string\&ishere"不是:"string&ishere"或者如果转义正则表达式"stringishere"基本上,我想要一些方法来做一个完全没有正则表达式结果的字符串子-只是一个简单的字符串替换。 最佳答案

ruby - 正则表达式蛋白质消化

所以,我正在用一种enzyme(出于好奇,Asp-N)消化蛋白质序列,这种enzyme在单字母编码序列中由B或D编码的蛋白质之前切割。我的实际分析使用String#scan进行捕获。我试图弄清楚为什么以下正则表达式不能正确消化它...(\w*?)(?=[BD])|(.*\b)前提(.*\b)存在以捕获序列的末尾。对于:MTMDKPSQYDKIEAELQDICNDVLELLDSKGDYFRYLSEVASGDN这应该给出如下内容:[MTM,DKPSQY,DKIEAELQ,DICN,DVLELL,DSKG,...]但会遗漏序列中的每个D。我一直在使用http://www.rubular.co

ruby - 如何在正则表达式中使用双括号?

正则表达式中的双方括号是什么意思?我对以下示例感到困惑:/[[^abc]]//[^abc]/我正在使用Rubular进行测试,但我没有看到双括号和单括号之间的任何区别。 最佳答案 Posixcharacterclasses使用[:alpha:]符号,它在正则表达式中使用,例如:/[[:alpha:][:digit:]]/您需要向下滚动以获取上面链接中的Posix信息。来自文档:POSIXbracketexpressionsarealsosimilartocharacterclasses.Theyprovideaportablealt

ruby - 表示 "at least one non-digit"的正则表达式

我想根据这个模式验证用户名:允许的字符:字母、数字、连字符、下划线第一个字符必须是字母或数字用户名不能全是数字这个正则表达式满足上面的1和2,但是我想不通如何满足3:/^[a-zA-Z\d][\w\-]+$/(我正在使用Ruby,如果相关的话) 最佳答案 不是很高效,但是很简单:/^(?!\d+$)[a-zA-Z\d][\w\-]+$/前瞻只是意味着:“后面不是一串数字,一直持续到最后”。 关于ruby-表示"atleastonenon-digit"的正则表达式,我们在StackOver

ruby-on-rails - RoR 字符类正则表达式

我的RubyonRails应用程序中有以下代码行,它检查给定的字符串是否包含韩文字符:isKorean=!/\p{Hangul}/.match(word).nil?它在控制台中完美运行,但会引发实际应用程序的语法错误:invalidcharacterpropertyname{Hangul}:/\p{Hangul}/我缺少什么以及如何让它发挥作用? 最佳答案 这是字符编码问题,需要补充:#encoding:utf-8到您正在使用该正则表达式的Ruby文件的顶部。如果您愿意,您可以使用您正在使用的字符类存在的任何编码而不是UTF-8。请

ruby - 在 ruby​​ 正则表达式中匹配换行符 `\n`

我试图理解为什么以下返回false:(**我应该放“输出0”**)puts"a\nb"=~Regexp.new(Regexp.escape("a\nb"),Regexp::MULTILINE|Regexp::EXTENDED)也许有人可以解释。我正在尝试从匹配字符串的多行字符串生成正则表达式。提前致谢 最佳答案 puts将始终返回nil。您的代码应该可以正常工作,尽管很长。=~返回匹配的位置,即0。您还可以使用:"a\nb"=~/a\sb/m或"a\nb"=~/a\nb/m注意:m选项在此示例中不是必需的,但演示了在没有Regexp

ruby-on-rails - 什么是类似 Twitter 名称的正则表达式?

我已经编码了一段时间,但直到最近才需要正则表达式。我需要像Twitter一样做一个接受用户名的正则表达式。基本上,我想一次允许一个下划线。名称中可以有多个下划线,但不能是连续的字符。也允许使用字母数字字符。但是数字不能作为名字的开头。名称如_我的名字67我的名字67我的名字_my_67_name_有效但是94我的名字__我的名字我的名字我的名字无效。我玩过Rubular并想出几个正则表达式:/^[^0-9\s+](_?[a-z0-9]+_?)+$/i/^([a-z_?])+$/i我一直遇到的问题是这些匹配多个下划线。 最佳答案 已编

ruby - 针对每一行的多个(15+)正则表达式解析文本正文的最佳方法是什么?

我有一段文本需要扫描,每行至少包含2部分信息,有时包含4部分信息。问题是每一行可能是15-20种不同操作中的一种。在ruby​​中,当前代码看起来像这样:text.split("\n").eachdo|line|#around20times................expressions['actions'].eachdo|pat,reg|#around20times.................这显然是“问题所在”。通过将所有正则表达式合并为一个,我确实设法使其更快(在C++中提高了50%),但这仍然不是我需要的速度——我需要快速解析数千个这些文件!现在我将它们与正则表达式