草庐IT

javascript - 从JS变量构建正则表达式不起作用

coder 2025-01-27 原文

我正在尝试从静态文本以及javascript中的变量构建正则表达式。显然,我缺少一些非常基本的东西,请参见下面的代码中的注释。非常感谢您的帮助:

var test_string = "goodweather";

// One regexp we just set: 
var regexp1 = /goodweather/;

// The other regexp we built from a variable + static text:
var regexp_part = "good";
var regexp2 = "\/" + regexp_part + "weather\/";

// These alerts now show the 2 regexp are completely identical:
alert (regexp1);
alert (regexp2);

// But one works, the other doesn't ??
if (test_string.match(regexp1))
  alert ("This is displayed.");

if (test_string.match(regexp2))
  alert ("This is not displayed.");

最佳答案

首先,问题的答案:

其他答案几乎是正确的,但是没有考虑当要匹配的文本包含文字反斜杠时(即:regexp_part包含文字反斜杠)时会发生什么。例如,当regexp_part等于:"C:\Windows"时会发生什么?在这种情况下,建议的方法将无法正常工作(结果正则表达式变为:/C:\Windows/,其中\W被错误地解释为非单词字符类)。正确的解决方案是先转义regexp_part中的任何反斜杠(所需的正则表达式实际上是:/C:\\Windows/)。

为了说明解决此问题的正确方法,以下是一个函数,该函数采用传递的短语并创建一个正则表达式,并将该短语包装在\b字边界内:

// Given a phrase, create a RegExp object with word boundaries.
function makeRegExp(phrase) {
    // First escape any backslashes in the phrase string.
    //  i.e. replace each backslash with two backslashes.
    phrase = phrase.replace(/\\/g, "\\\\");
    // Wrap the escaped phrase with \b word boundaries.
    var re_str = "\\b"+ phrase +"\\b";
    // Create a new regex object with "g" and "i" flags set.
    var re = new RegExp(re_str, "gi");
    return re;
}
// Here is a condensed version of same function.
function makeRegExpShort(phrase) {
    return new RegExp("\\b"+ phrase.replace(/\\/g, "\\\\") +"\\b", "gi");
}

为了更深入地理解这一点,下面是一个讨论...

深入讨论,或“所有这些反斜杠是怎么回事!?”

JavaScript有两种创建RegExp对象的方法:
  • /pattern/flags -您可以直接指定RegExp Literal表达式,其中使用一对正斜杠对模式进行定界,后跟三个模式修饰符标志的任意组合:即'g'全局,'i'忽略大小写或'm'多行。这种类型的正则表达式不能动态创建。
  • 新的RegExp(“pattern”,“flags”)-您可以通过调用RegExp()构造函数来创建RegExp对象,并将该模式​​作为字符串(不带正斜杠定界符)作为第一个参数和可选的模式修饰符标志进行传递(也作为字符串)作为第二个(可选)参数。这种类型的正则表达式可以动态创建。

  • 下面的示例演示使用这两种方法创建一个简单的RegExp对象。假设我们希望匹配单词"apple"。我们需要的正则表达式模式很简单:apple。另外,我们希望设置所有三个修饰符标志。

    示例1:没有特殊字符的简单模式:apple
    // A RegExp literal to match "apple" with all three flags set:
    var re1 = /apple/gim;
    
    // Create the same object using RegExp() constructor:
    var re2 = new RegExp("apple", "gim");
    

    很简单。但是,在转义字符的处理方面,这两种方法之间存在显着差异。 regex文字语法非常方便,因为您只需要转义正斜杠-所有其他字符将不更改直接传递给regex引擎。但是,在使用RegExp构造函数方法时,您将模式作为字符串传递,并且需要考虑两个转义级别:首先是字符串的解释,其次是正则表达式引擎的解释。几个例子将说明这些差异。

    首先让我们考虑一个包含单个文字正斜杠的模式。假设我们希望以不区分大小写的方式匹配文本序列:"and/or"。所需的模式是:and/or

    示例2:具有一个正斜杠的模式:and/or
    // A RegExp literal to match "and/or":
    var re3 = /and\/or/i;
    
    // Create the same object using RegExp() :
    var re4 = new RegExp("and/or", "i");
    

    请注意,使用regex文字语法时,必须转义正斜杠(以单个反斜杠开头),因为使用regex文字,正斜杠具有特殊含义(这是一个特殊的元字符,用于分隔模式)。另一方面,使用RegExp构造函数语法(使用字符串存储模式),正斜杠没有任何特殊含义,也不需要转义。

    接下来让我们考虑一种模式,该模式包括一个特殊的:\b单词边界正则表达式元序列。假设我们希望创建一个正则表达式来将单词"apple"仅作为一个整体匹配(这样它就不会匹配"pineapple")。模式(由正则表达式引擎看到)需要为:\bapple\b:

    示例3:具有\b单词边界的模式:\bapple\b
    // A RegExp literal to match the whole word "apple":
    var re5 = /\bapple\b/;
    
    // Create the same object using RegExp() constructor:
    var re6 = new RegExp("\\bapple\\b");
    

    在这种情况下,使用RegExp构造函数方法时必须转义反斜杠,因为该模式存储在字符串中,并且要将字面反斜杠转换为字符串,必须将其与另一个反斜杠一起转义。但是,使用正则表达式文字,无需转义反斜杠。 (请记住,使用正则表达式文字,唯一的特殊元字符是正斜杠。)

    反斜杠汤!

    当我们需要匹配文字反斜杠时,事情变得更加有趣。假设我们要匹配文本序列:"C:\Program Files\JGsoft\RegexBuddy3\RegexBuddy.exe"。正则表达式引擎要处理的模式需要为:C:\\Program Files\\JGsoft\\RegexBuddy3\\RegexBuddy\.exe。 (请注意,与单个反斜杠匹配的正则表达式模式为\\,即每个均必须转义。)这是使用两种JavaScript语法创建所需的RegExp对象的方式

    示例4:匹配文字反斜杠的模式:
    // A RegExp literal to match the ultimate Windows regex debugger app:
    var re7 = /C:\\Program Files\\JGsoft\\RegexBuddy3\\RegexBuddy\.exe/;
    
    // Create the same object using RegExp() constructor:
    var re8 = new RegExp(
        "C:\\\\Program Files\\\\JGsoft\\\\RegexBuddy3\\\\RegexBuddy\\.exe");
    

    这就是为什么/regex literal/语法通常比new RegExp("pattern", "flags")方法更受青睐的原因-它完全避免了可能经常出现的反斜杠。但是,当您需要动态创建一个正则表达式时(如OP所需要的那样),您将不得不使用new RegExp()语法并处理反斜杠。 (一旦把头缠好,它的确不是那么糟糕。)

    RegexBuddy的营救!

    RegexBuddy是一个Windows应用程序,可以解决此反斜杠汤问题-它了解正则表达式的语法和多种语言的转义要求,并且在粘贴到应用程序和从应用程序粘贴时会根据需要自动添加和删除反斜杠。在应用程序内部,您以 native 正则表达式格式编写和调试正则表达式。一旦正则表达式正常工作,就可以使用许多“复制为...”选项之一将其导出,以获取所需的语法。非常便利!

    关于javascript - 从JS变量构建正则表达式不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6802601/

    有关javascript - 从JS变量构建正则表达式不起作用的更多相关文章

    1. ruby-on-rails - 如何使用 instance_variable_set 正确设置实例变量? - 2

      我正在查看instance_variable_set的文档并看到给出的示例代码是这样做的:obj.instance_variable_set(:@instnc_var,"valuefortheinstancevariable")然后允许您在类的任何实例方法中以@instnc_var的形式访问该变量。我想知道为什么在@instnc_var之前需要一个冒号:。冒号有什么作用? 最佳答案 我的第一直觉是告诉你不要使用instance_variable_set除非你真的知道你用它做什么。它本质上是一种元编程工具或绕过实例变量可见性的黑客攻击

    2. ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2

      在我的应用程序中,我需要能够找到所有数字子字符串,然后扫描每个子字符串,找到第一个匹配范围(例如5到15之间)的子字符串,并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串,例如,re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项,并且只替换第N个匹配项,我该怎么做?例如,如果我想替换第三个匹配项“10”(匹配项[2]),我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg

    3. ruby - 通过 ruby​​ 进程共享变量 - 2

      我正在编写一个gem,我必须在其中fork两个启动两个webrick服务器的进程。我想通过基类的类方法启动这个服务器,因为应该只有这两个服务器在运行,而不是多个。在运行时,我想调用这两个服务器上的一些方法来更改变量。我的问题是,我无法通过基类的类方法访问fork的实例变量。此外,我不能在我的基类中使用线程,因为在幕后我正在使用另一个不是线程安全的库。所以我必须将每个服务器派生到它自己的进程。我用类变量试过了,比如@@server。但是当我试图通过基类访问这个变量时,它是nil。我读到在Ruby中不可能在分支之间共享类变量,对吗?那么,还有其他解决办法吗?我考虑过使用单例,但我不确定这是

    4. ruby-on-rails - 如果 Object::try 被发送到一个 nil 对象,为什么它会起作用? - 2

      如果您尝试在Ruby中的nil对象上调用方法,则会出现NoMethodError异常并显示消息:"undefinedmethod‘...’fornil:NilClass"然而,有一个tryRails中的方法,如果它被发送到一个nil对象,它只返回nil:require'rubygems'require'active_support/all'nil.try(:nonexisting_method)#noNoMethodErrorexceptionanymore那么try如何在内部工作以防止该异常? 最佳答案 像Ruby中的所有其他对象

    5. ruby-on-rails - 如何在我的 Rails 应用程序 View 中打印 ruby​​ 变量的内容? - 2

      我是一个Rails初学者,但我想从我的RailsView(html.haml文件)中查看Ruby变量的内容。我试图在ruby​​中打印出变量(认为它会在终端中出现),但没有得到任何结果。有什么建议吗?我知道Rails调试器,但更喜欢使用inspect来打印我的变量。 最佳答案 您可以在View中使用puts方法将信息输出到服务器控制台。您应该能够在View中的任何位置使用Haml执行以下操作:-puts@my_variable.inspect 关于ruby-on-rails-如何在我的R

    6. ruby-on-rails - 使用 ruby​​ 将多个实例变量转换为散列的更好方法? - 2

      我收到格式为的回复#我需要将其转换为哈希值(针对活跃商家)。目前我正在遍历变量并执行此操作:response.instance_variables.eachdo|r|my_hash.merge!(r.to_s.delete("@").intern=>response.instance_eval(r.to_s.delete("@")))end这有效,它将生成{:first="charlie",:last=>"kelly"},但它似乎有点hacky和不稳定。有更好的方法吗?编辑:我刚刚意识到我可以使用instance_variable_get作为该等式的第二部分,但这仍然是主要问题。

    7. ruby - Rack:如何将 URL 存储为变量? - 2

      我正在编写一个简单的静态Rack应用程序。查看下面的config.ru代码:useRack::Static,:urls=>["/elements","/img","/pages","/users","/css","/js"],:root=>"archive"map'/'dorunProc.new{|env|[200,{'Content-Type'=>'text/html','Cache-Control'=>'public,max-age=6400'},File.open('archive/splash.html',File::RDONLY)]}endmap'/pages/search.

    8. ruby - 在 Ruby 中构建长字符串的简洁方法 - 2

      在编写Ruby(客户端脚本)时,我看到了三种构建更长字符串的方法,包括行尾,所有这些对我来说“闻起来”有点难看。有没有更干净、更好的方法?变量递增。ifrender_quote?quote="NowthatthereistheTec-9,acrappyspraygunfromSouthMiami."quote+="ThisgunisadvertisedasthemostpopularguninAmericancrime.Doyoubelievethatshit?"quote+="Itactuallysaysthatinthelittlebookthatcomeswithit:themo

    9. ruby - 正则表达式将非英文字母匹配为非单词字符 - 2

      @raw_array[i]=~/[\W]/非常简单的正则表达式。当我用一些非拉丁字母(具体来说是俄语)尝试时,条件是错误的。我能用它做什么? 最佳答案 @raw_array[i]=~/[\p{L}]/使用西里尔字符进行测试。引用:http://www.regular-expressions.info/unicode.html#prop 关于ruby-正则表达式将非英文字母匹配为非单词字符,我们在StackOverflow上找到一个类似的问题: https://

    10. ruby-on-rails - 应用程序的名称是否可以作为变量使用? - 2

      当我创建一个Rails应用程序时,控制台:railsnewfoo我的代码可以使用字符串“foo”吗?puts"Yourapp'snameis"+app_name_bar 最佳答案 Rails.application.class将为您提供应用程序的全名(例如YourAppName::Application)。从那里您可以使用Rails.application.class.parent获取模块名称。 关于ruby-on-rails-应用程序的名称是否可以作为变量使用?,我们在StackOve

    随机推荐