草庐IT

java - java 是否支持 if-then-else 正则表达式构造(Perl 构造)?

coder 2024-03-26 原文

我在尝试编译以下正则表达式时收到 PatternSyntaxException:

"bd".matches("(a)?b(?(1)c|d)")

这个正则表达式匹配 bd 和 abc。它与 bc 不匹配。

有什么想法吗?谢谢。

好的,我需要编写正则表达式来匹配接下来的 4 个字符串:

*date date* date date1*date2

不应该匹配:

*date* date1*date2* *date1*date2 date** ...

但这应该通过单个匹配来完成,而不是多个。

请不要发布如下答案:

(date*date)|(*date)|(date*)|(date)

最佳答案

想象一下,如果您可以使用一种缺少 else 的语言声明,但您想效仿它。而不是写作

if (condition) { yes part }
else           { no part  }

你必须写

if (condition)   { yes part }
if (!condition)  { no part  }

好吧,这就是你必须在这里做的,但在模式中。在没有条件的 Java 中,您所做的是在 ELSE block (实际上是 OR block )中重复条件,但否定它。

因此,例如,不要使用像 Perl 这样在模式中提供条件支持的语言来编写:

# definition of \b using a conditional in the pattern like Perl
#
(?(?<=      \w)     # if there is a word character to the left
      (?!   \w)     #    then there must be no word character to the right
  |   (?=   \w)     #    else there must be a  word character to the right
)

你必须用 Java 写:

# definition of \b using a duplicated condition like Java
#
(?:   (?<=  \w)     # if there is a word character to the left
      (?!   \w)     #    then there must be no word character to the right
  |                 # ...otherwise...
      (?<!  \w)     # if there is no word character to the left
      (?=   \w)     #    then there must be a word character to the right
)

您可能认为这是 \b 的定义.那么这里同样适用于 \B的定义,首先使用条件:

# definition of \B using a conditional in the pattern like Perl
#
(?(?<=      \w)     # if there is a word character to the left
      (?=   \w)     #    then there must be a  word character to the right
  |   (?!   \w)     #    else there must be no word character to the right
)

现在通过在 OR 分支中重复(现在否定的)条件:

# definition of \B using a duplicated condition like Java
#
(?:   (?<=  \w)     # if there is a word character to the left
      (?!   \w)     #    then there must be no word character to the right
  |                 # ...otherwise...
      (?<!  \w)     # if there is no word character to the left
      (?=   \w)     #    then there must be a word character to the right
)

请注意,无论您如何滚动它们,\b 的相应定义都是如此和 \B同样完全取决于 \w 的定义, 永远不会 \W ,更不用说 \s .

能够使用条件语句不仅可以节省打字时间,还可以减少出错的几率。它们也可能是您不关心对条件进行两次评估的情况。

在这里,我利用它来定义几个正则表达式子例程,这些子例程为我提供了希腊语原子和相同的边界:

(?(DEFINE)
    (?<greeklish>            [\p{Greek}\p{Inherited}]   )
    (?<ungreeklish>          [^\p{Greek}\p{Inherited}]  )
    (?<greek_boundary>
        (?(?<=      (?&greeklish))
              (?!   (?&greeklish))
          |   (?=   (?&greeklish))
        )
    )
    (?<greek_nonboundary>
        (?(?<=      (?&greeklish))
              (?=   (?&greeklish))
          |   (?!   (?&greeklish))
        )
    )
)

注意边界和非边界如何只使用 (&?greeklish) , 从不 (?&ungreeklish) ?你永远不需要非任何东西来做边界。你把 not 放到你的 lookarounds 中,就像 \b\B两者都有。

尽管在 Perl 中定义一个新的自定义属性可能更容易(尽管不那么通用),\p{IsGreeklish} (及其补充 \P{IsGreeklish} ):

 sub IsGreeklish {
     return <<'END';
 +utf8::IsGreek
 +utf8::IsInherited
 END
 }

尽管这不是因为 Java 缺乏对条件的支持,而是因为它的模式语言不允许 (DEFINE),但您将无法将其中任何一个翻译成 Java。 block 或正则表达式子例程调用,如 (?&greeklish) — 实际上,您的模式甚至不能在 Java 中递归。您也不能在 Java 中定义自定义属性,例如 \p{IsGreeklish} .

当然,Perl 正则表达式中的条件可以不仅仅是环顾四周:它们甚至可以是要执行的代码块——这就是为什么您当然不希望被迫对同一条件求值两次,以免产生副作用.这不适用于 Java,因为它做不到。您不能混合模式和代码,这对您的限制比您在养成这样做的习惯之前想象的要多。

使用 Perl 正则表达式引擎可以做很多其他语言做不到的事情,这只是其中的一部分。难怪新的第 4 版 Programming Perl 中大大扩展的 Regexes 章节,加上完全重写的 Unicode 章节,现在紧跟在 Regexes 章节之后(已提升为内核的一部分),有一个组合页数大约 130 页,因此是第 3 版中有关模式匹配的旧章节长度的两倍。

您刚才在上面看到的是新的第 4 版的一部分,应该会在下个月左右打印。

关于java - java 是否支持 if-then-else 正则表达式构造(Perl 构造)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8072756/

有关java - java 是否支持 if-then-else 正则表达式构造(Perl 构造)?的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby - 如何将脚本文件的末尾读取为数据文件(Perl 或任何其他语言) - 2

    我正在寻找执行以下操作的正确语法(在Perl、Shell或Ruby中):#variabletoaccessthedatalinesappendedasafileEND_OF_SCRIPT_MARKERrawdatastartshereanditcontinues. 最佳答案 Perl用__DATA__做这个:#!/usr/bin/perlusestrict;usewarnings;while(){print;}__DATA__Texttoprintgoeshere 关于ruby-如何将脚

  3. ruby - 检查数组是否在增加 - 2

    这个问题在这里已经有了答案:Checktoseeifanarrayisalreadysorted?(8个答案)关闭9年前。我只是想知道是否有办法检查数组是否在增加?这是我的解决方案,但我正在寻找更漂亮的方法:n=-1@arr.flatten.each{|e|returnfalseife

  4. java - 等价于 Java 中的 Ruby Hash - 2

    我真的很习惯使用Ruby编写以下代码:my_hash={}my_hash['test']=1Java中对应的数据结构是什么? 最佳答案 HashMapmap=newHashMap();map.put("test",1);我假设? 关于java-等价于Java中的RubyHash,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/22737685/

  5. ruby - 检查字符串是否包含散列中的任何键并返回它包含的键的值 - 2

    我有一个包含多个键的散列和一个字符串,该字符串不包含散列中的任何键或包含一个键。h={"k1"=>"v1","k2"=>"v2","k3"=>"v3"}s="thisisanexamplestringthatmightoccurwithakeysomewhereinthestringk1(withspecialcharacterslike(^&*$#@!^&&*))"检查s是否包含h中的任何键的最佳方法是什么,如果包含,则返回它包含的键的值?例如,对于上面的h和s的例子,输出应该是v1。编辑:只有字符串是用户定义的。哈希将始终相同。 最佳答案

  6. ruby-on-rails - Ruby 检查日期时间是否为 iso8601 并保存 - 2

    我需要检查DateTime是否采用有效的ISO8601格式。喜欢:#iso8601?我检查了ruby​​是否有特定方法,但没有找到。目前我正在使用date.iso8601==date来检查这个。有什么好的方法吗?编辑解释我的环境,并改变问题的范围。因此,我的项目将使用jsapiFullCalendar,这就是我需要iso8601字符串格式的原因。我想知道更好或正确的方法是什么,以正确的格式将日期保存在数据库中,或者让ActiveRecord完成它们的工作并在我需要时间信息时对其进行操作。 最佳答案 我不太明白你的问题。我假设您想检查

  7. ruby - 检查日期是否在过去 7 天内 - 2

    我的日期格式如下:"%d-%m-%Y"(例如,今天的日期为07-09-2015),我想看看是不是在过去的七天内。谁能推荐一种方法? 最佳答案 你可以这样做:require"date"Date.today-7 关于ruby-检查日期是否在过去7天内,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/32438063/

  8. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  9. ruby - 是否可以覆盖 gemfile 进行本地开发? - 2

    我们的git存储库中目前有一个Gemfile。但是,有一个gem我只在我的环境中本地使用(我的团队不使用它)。为了使用它,我必须将它添加到我们的Gemfile中,但每次我checkout到我们的master/dev主分支时,由于与跟踪的gemfile冲突,我必须删除它。我想要的是类似Gemfile.local的东西,它将继承从Gemfile导入的gems,但也允许在那里导入新的gems以供使用只有我的机器。此文件将在.gitignore中被忽略。这可能吗? 最佳答案 设置BUNDLE_GEMFILE环境变量:BUNDLE_GEMFI

  10. ruby-on-rails - `a ||= b` 和 `a = b if a.nil 之间的区别? - 2

    我正在检查一个Rails项目。在ERubyHTML模板页面上,我看到了这样几行:我不明白为什么不这样写:在这种情况下,||=和ifnil?有什么区别? 最佳答案 在这种特殊情况下没有区别,但可能是出于习惯。每当我看到nil?被使用时,它几乎总是使用不当。在Ruby中,很少有东西在逻辑上是假的,只有文字false和nil是。这意味着像if(!x.nil?)这样的代码几乎总是更好地表示为if(x)除非期望x可能是文字false。我会将其切换为||=false,因为它具有相同的结果,但这在很大程度上取决于偏好。唯一的缺点是赋值会在每次运行

随机推荐