草庐IT

php - 正则表达式、PHP 和邪恶的嵌套 (?R)

coder 2024-04-22 原文

更新

所以我仍然在搞乱这个,并且已经找到了标签的所有实例,尽管我宁愿只找到最深的堆叠实例,因为那样生活会更容易......无论如何这就是我得到..

/(({{)(?:(?=([^\/][^ ]*?))\3|(\/[\w])))([a-zA-Z0-9\$\'\"\s\#\%\^\&\!\.\_\+\=\-\\\*\(\)\ ]+?}})/

是否有任何正则表达式大师可以给我一些指示或模仿我需要的正则表达式?这只会获得像这样结束的 {{tag}} 的最深堆栈实例 {{//tag}}

原创

好的,所以我遇到了一个问题,我看到其他人也遇到过,但是采用了不同的方法..或者我认为..所以我很好奇是否还有其他人可以帮助我进一步解决这个问题..

我有一个充满模板的数据库,我需要在 PHP 中使用这些模板,这些模板由另一个系统制作和使用,因此无法更改。话虽如此,这些模板添加了层次结构样式标签。我需要做的是从数据库中获取这些模板,然后以编程方式找到这些标签、它们的函数名称(或标签名称)和它们的内部内容,以及括号内函数(标签)名称后面的任何内容。 . 这些标签之一的示例是,{{FunctionName some (otherStuff) !Here}} Some content sits inside and it ends {{/FunctionName}}

这是更有趣的地方,模板有另一个随机标签,我猜这是这些标签的“可变”样式,因为它们通常总是相同的语法。看起来像这样,${RandomTag},但也有一些函数样式在那里但没有结束标记,就像这样.. {{RandomLoner}}

示例模板...

{{FunctionTag (Condition?)}}
    <div>This is an {{CheckOfSomeSort someTimesThese !orThese}}
        example of some {{Random}} data
    {{/CheckOfSomeSort}} that will be ${worked} on</div>
{{/FunctionTag}}

好吧,这绝不是一个真正的模板,但它遵循了我目前所见的所有规则。

现在我已经尝试使用 regex 和 preg_match_all 进行不同的操作来提取匹配项,并将每个匹配项放入一个漂亮的数组中。到目前为止我得到的是这个(在示例模板上使用它以确保它仍然有效)

Array
(
    [0] => Array
        (
            [0] => {{CheckOfSomeSort someTimesThese !orThese}}example of some datas{{/CheckOfSomeSort}}
            [1] => {{CheckOfSomeSort someTimesThese !orThese}}
            [2] => CheckOfSomeSort
            [3] => example of some data
            [4] => {{/CheckOfSomeSort}}
        )
)

我尝试了几种方法,(我花了将近 8 个小时才完成)

/({{([^\/].[^ ]*)(?:.[^ ][^{{]+)}})(?:(?=([^{{]+))\3|{{(?!\2[^}}]*}}))*?({{\/\2}})/

AND, more recently...

/({{([^\/].[^ ]*)(?:.[^ ][^{{]+)}})((?:(?!\{\{|\}\}).)++|(?R)*)({{\/\2}})/

我绝不是正则表达式的大师,实际上我是在过去一天左右才学会的,试图让它发挥作用。我已经用谷歌搜索了这个,并意识到 regexp 不是为嵌套的东西设计的,但是 (?R) 似乎在我在互联网上看到的简单括号示例上做了把戏,但他们总是只考虑到之间的东西{ 和 } 或 ( 和 ) 或 < 和="">。在阅读了几乎整个正则表达式信息网站并玩了之后,我想出了这两个版本。

所以我需要做的(我认为),首先从 DEEPEST 层次结构标记中进行正则表达式工作,然后解决问题(如果我可以在 php 的帮助下做到这一点,那对我来说没问题)。我在考虑找到最深层,获取它的数据,然后向后工作,直到所有内容都在 1 个胖数组中。我以为这就是 ($R) 会为我做的,但事实并非如此。

所以任何关于我遗漏的帮助都会很棒,还要注意我的 {{}} 似乎有问题,没有它的结束版本。因此,就像我的 {{Random}} 示例一样,为了我解析数组示例而被删除。我觉得这些标签以及 ${} 标签可以单独保留(如果我知道如何使用 regexp 做到这一点),并且只保留在它们所在的文本中。我或多或少对这些函数感兴趣,并将它们的数据放入多维数组中以供我进一步使用。

抱歉发了这么长的帖子,我整晚都在为此苦思冥想。我开始假设它会更容易一些..直到我意识到嵌套的标签:/

感谢任何帮助!谢谢!

最佳答案

哇,多么奇怪的模板语法。

我可能用来解决这个问题的方法是这样的:

  • 使用一个简单的正则表达式来更改所有 {{tags}}<tags>
  • 使用另一个简单的正则表达式将标签内以空格分隔的参数/条件转换为类似 XML 的属性语法(例如 {{foo bar !baz}} 将变为 <foo arg1="bar" arg2="!baz"> 或类似格式)
  • 将其处理为 DOMDocument .

玩得开心。 :-)

关于php - 正则表达式、PHP 和邪恶的嵌套 (?R),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8855975/

有关php - 正则表达式、PHP 和邪恶的嵌套 (?R)的更多相关文章

  1. ruby-on-rails - Rails 编辑表单不显示嵌套项 - 2

    我得到了一个包含嵌套链接的表单。编辑时链接字段为空的问题。这是我的表格:Editingkategori{:action=>'update',:id=>@konkurrancer.id})do|f|%>'Trackingurl',:style=>'width:500;'%>'Editkonkurrence'%>|我的konkurrencer模型:has_one:link我的链接模型:classLink我的konkurrancer编辑操作:defedit@konkurrancer=Konkurrancer.find(params[:id])@konkurrancer.link_attrib

  2. ruby - 将散列转换为嵌套散列 - 2

    这道题是thisquestion的逆题.给定一个散列,每个键都有一个数组,例如{[:a,:b,:c]=>1,[:a,:b,:d]=>2,[:a,:e]=>3,[:f]=>4,}将其转换为嵌套哈希的最佳方法是什么{:a=>{:b=>{:c=>1,:d=>2},:e=>3,},:f=>4,} 最佳答案 这是一个迭代的解决方案,递归的解决方案留给读者作为练习:defconvert(h={})ret={}h.eachdo|k,v|node=retk[0..-2].each{|x|node[x]||={};node=node[x]}node[

  3. ruby 正则表达式 - 如何替换字符串中匹配项的第 n 个实例 - 2

    在我的应用程序中,我需要能够找到所有数字子字符串,然后扫描每个子字符串,找到第一个匹配范围(例如5到15之间)的子字符串,并将该实例替换为另一个字符串“X”。我的测试字符串s="1foo100bar10gee1"我的初始模式是1个或多个数字的任何字符串,例如,re=Regexp.new(/\d+/)matches=s.scan(re)给出["1","100","10","1"]如果我想用“X”替换第N个匹配项,并且只替换第N个匹配项,我该怎么做?例如,如果我想替换第三个匹配项“10”(匹配项[2]),我不能只说s[matches[2]]="X"因为它做了两次替换“1fooX0barXg

  4. Ruby——嵌套类和子类是一回事吗? - 2

    下面例子中的Nested和Child有什么区别?是否只是同一事物的不同语法?classParentclassNested...endendclassChild 最佳答案 不,它们是不同的。嵌套:Computer之外的“Processor”类只能作为Computer::Processor访问。嵌套为内部类(namespace)提供上下文。对于ruby​​解释器Computer和Computer::Processor只是两个独立的类。classComputerclassProcessor#Tocreateanobjectforthisc

  5. ruby - 模块嵌套代码风格偏好 - 2

    我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的

  6. ruby-on-rails - 使用回形针的嵌套形式 - 2

    我有一个名为posts的模型,它有很多附件。附件模型使用回形针。我制作了一个用于创建附件的独立模型,效果很好,这是此处说明的View(https://github.com/thoughtbot/paperclip):@attachment,:html=>{:multipart=>true}do|form|%>posts中的嵌套表单如下所示:prohibitedthispostfrombeingsaved:@attachment,:html=>{:multipart=>true}do|at_form|%>附件记录已创建,但它是空的。文件未上传。同时,帖子已成功创建...有什么想法吗?

  7. ruby-on-rails - Rails 3,嵌套资源,没有路由匹配 [PUT] - 2

    我真的为这个而疯狂。我一直在搜索答案并尝试我找到的所有内容,包括相关问题和stackoverflow上的答案,但仍然无法正常工作。我正在使用嵌套资源,但无法使表单正常工作。我总是遇到错误,例如没有路线匹配[PUT]"/galleries/1/photos"表格在这里:/galleries/1/photos/1/edit路线.rbresources:galleriesdoresources:photosendresources:galleriesresources:photos照片Controller.rbdefnew@gallery=Gallery.find(params[:galle

  8. ruby - 正则表达式将非英文字母匹配为非单词字符 - 2

    @raw_array[i]=~/[\W]/非常简单的正则表达式。当我用一些非拉丁字母(具体来说是俄语)尝试时,条件是错误的。我能用它做什么? 最佳答案 @raw_array[i]=~/[\p{L}]/使用西里尔字符进行测试。引用:http://www.regular-expressions.info/unicode.html#prop 关于ruby-正则表达式将非英文字母匹配为非单词字符,我们在StackOverflow上找到一个类似的问题: https://

  9. ruby - 正则表达式在哪个位置失败? - 2

    我需要一个非常简单的字符串验证器来显示第一个符号与所需格式不对应的位置。我想使用正则表达式,但在这种情况下,我必须找到与表达式相对应的字符串停止的位置,但我找不到可以做到这一点的方法。(这一定是一种相当简单的方法……也许没有?)例如,如果我有正则表达式:/^Q+E+R+$/带字符串:"QQQQEEE2ER"期望的结果应该是7 最佳答案 一个想法:你可以做的是标记你的模式并用可选的嵌套捕获组编写它:^(Q+(E+(R+($)?)?)?)?然后你只需要计算你获得的捕获组的数量就可以知道正则表达式引擎在模式中停止的位置,你可以确定匹配结束

  10. ruby - 如何根据长度将路径数组转换为嵌套数组或散列 - 2

    我需要根据字符串路径的长度将字符串路径数组转换为符号、哈希和数组的数组给定以下数组:array=["info","services","about/company","about/history/part1","about/history/part2"]我想生成以下输出,对不同级别进行分组,根据级别的结构混合使用符号和对象。产生以下输出:[:info,:services,about:[:company,history:[:part1,:part2]]]#altsyntax[:info,:services,{:about=>[:company,{:history=>[:part1,:pa

随机推荐