草庐IT

php - preg_match 函数中的 RegExp 返回浏览器错误

coder 2023-06-15 原文

下面的函数打破了我在 $pattern 变量中提供的正则表达式。如果我更改正则表达式我很好,所以我认为这就是问题所在。但是,我没有看到问题,即使它们已打开,我也没有收到标准的 PHP 错误。

function parseAPIResults($results){
//Takes results from getAPIResults, returns array.

    $pattern = '/\[(.|\n)+\]/';
    $resultsArray = preg_match($pattern, $results, $matches);

}

Firefox 6: The connection was reset

Chrome 14: Error 101 (net::ERR_CONNECTION_RESET): The connection was reset.

IE 8: Internet Explorer cannot display the webpage



更新:
Apache/PHP 可能会崩溃。这是我运行脚本时的 Apache 错误日志:

[Sat Oct 01 11:41:40 2011] [notice] Parent: child process exited with status 255 -- Restarting.
[Sat Oct 01 11:41:40 2011] [notice] Apache/2.2.11 (Win32) PHP/5.3.0 configured -- resuming normal operations



在 Windows 7 上运行 WAMP 2.0。

最佳答案

简单的问题。复杂的答案!

是的,由于堆栈溢出,此类正则表达式将重复(并且静默地)使 Apache/PHP 崩溃,并出现未处理的段错误!

背景:

PHP preg_*正则表达式系列使用强大的 PCRE library菲利普·哈泽尔 (Philip Hazel)在这个库中,有一类正则表达式需要对其内部 match() 进行大量递归调用。函数,这会占用大量堆栈空间,(使用的堆栈空间与匹配的主题字符串的大小成正比)。因此,如果主题字符串太长,则会发生堆栈溢出和相应的段错误。此行为在 PCRE documentation 中有所描述。在标题为以下部分的末尾:pcrestack .

PHP 错误 1:PHP 集:pcre.recursion_limit太大了。

PCRE 文档描述了如何通过将递归深度限制为一个安全值来避免堆栈溢出段错误,该值大致等于链接应用程序的堆栈大小除以 500。当递归深度按照建议适当限制时,库不会生成堆栈溢出,而是优雅地退出并显示错误代码。在 PHP 下,此最大递归深度由 pcre.recursion_limit 指定。配置变量和(不幸的是)默认值设置为 100,000。 这个值太大了! 这是 pcre.recursion_limit 的安全值表对于各种可执行堆栈大小:

Stacksize   pcre.recursion_limit
 64 MB      134217
 32 MB      67108
 16 MB      33554
  8 MB      16777
  4 MB      8388
  2 MB      4194
  1 MB      2097
512 KB      1048
256 KB      524

因此,对于 Apache 网络服务器 ( httpd.exe ) 的 Win32 版本,其堆栈大小(相对较小)为 256KB,pcre.recursion_limit 的正确值应该设置为 524。 这可以通过以下 PHP 代码行来完成:

ini_set("pcre.recursion_limit", "524"); // PHP default is 100,000.

将此代码添加到 PHP 脚本时,不会发生堆栈溢出,而是生成有意义的错误代码。也就是说,它应该生成一个错误代码! (但不幸的是,由于另一个 PHP 错误,preg_match() 没有。)

PHP 错误 2:preg_match()出错时不返回 FALSE。
preg_match() 的 PHP 文档说它在出错时返回 FALSE。不幸的是,PHP 5.3.3 及以下版本有一个错误 ( #52732 ),其中 preg_match()不返回 FALSE出错时(而是返回 int(0) ,这与在不匹配的情况下返回的值相同)。此错误已在 PHP 5.3.4 版中修复。

解决方案:

假设您将继续使用 WAMP 2.0(使用 PHP 5.3.0),解决方案需要考虑上述两个错误。以下是我的建议:
  • 需要减少pcre.recursion_limit到安全值:524。
  • 每当 preg_match() 时都需要明确检查 PCRE 错误返回除 int(1) 以外的任何内容.
  • preg_match()返回 int(1) ,则匹配成功。
  • preg_match()返回 int(0) ,则匹配要么不成功,要么出现错误。

  • 这是脚本的修改版本(设计为从命令行运行),用于确定导致递归限制错误的主题字符串长度:

    <?php
    // This test script is designed to be run from the command line.
    // It measures the subject string length that results in a
    // PREG_RECURSION_LIMIT_ERROR error in the preg_match() function.
    
    echo("Entering TEST.PHP...\n");
    
    // Set and display pcre.recursion_limit. (set to stacksize / 500).
    // Under Win32 httpd.exe has a stack = 256KB and 8MB for php.exe.
    //ini_set("pcre.recursion_limit", "524");       // Stacksize = 256KB.
    ini_set("pcre.recursion_limit", "16777");   // Stacksize = 8MB.
    echo(sprintf("PCRE pcre.recursion_limit is set to %s\n",
        ini_get("pcre.recursion_limit")));
    
    function parseAPIResults($results){
        $pattern = "/\[(.|\n)+\]/";
        $resultsArray = preg_match($pattern, $results, $matches);
        if ($resultsArray === 1) {
            $msg = 'Successful match.';
        } else {
            // Either an unsuccessful match, or a PCRE error occurred.
            $pcre_err = preg_last_error();  // PHP 5.2 and above.
            if ($pcre_err === PREG_NO_ERROR) {
                $msg = 'Successful non-match.';
            } else {
                // preg_match error!
                switch ($pcre_err) {
                    case PREG_INTERNAL_ERROR:
                        $msg = 'PREG_INTERNAL_ERROR';
                        break;
                    case PREG_BACKTRACK_LIMIT_ERROR:
                        $msg = 'PREG_BACKTRACK_LIMIT_ERROR';
                        break;
                    case PREG_RECURSION_LIMIT_ERROR:
                        $msg = 'PREG_RECURSION_LIMIT_ERROR';
                        break;
                    case PREG_BAD_UTF8_ERROR:
                        $msg = 'PREG_BAD_UTF8_ERROR';
                        break;
                    case PREG_BAD_UTF8_OFFSET_ERROR:
                        $msg = 'PREG_BAD_UTF8_OFFSET_ERROR';
                        break;
                    default:
                        $msg = 'Unrecognized PREG error';
                        break;
                }
            }
        }
        return($msg);
    }
    
    // Build a matching test string of increasing size.
    function buildTestString() {
        static $content = "";
        $content .= "A";
        return '['. $content .']';
    }
    
    // Find subject string length that results in error.
    for (;;) { // Infinite loop. Break out.
        $str = buildTestString();
        $msg = parseAPIResults($str);
        printf("Length =%10d\r", strlen($str));
        if ($msg !== 'Successful match.') break;
    }
    
    echo(sprintf("\nPCRE_ERROR = \"%s\" at subject string length = %d\n",
        $msg, strlen($str)));
    
    echo("Exiting TEST.PHP...");
    
    ?>
    

    当您运行此脚本时,它会提供主题字符串当前长度的连续读数。如果pcre.recursion_limit保留其过高的默认值,这允许您测量导致可执行文件崩溃的字符串的长度。

    注释:
  • 在调查这个问题的答案之前,我不知道 PHP bug where preg_match()返回失败 FALSE当 PCRE 库中发生错误时。这个错误肯定会引起很多使用 preg_match 的代码的问题。 ! (我当然会清点我自己的 PHP 代码。)
  • 在 Windows 下,Apache 网络服务器可执行文件 (httpd.exe) 的堆栈大小为 256KB。 PHP 命令行可执行文件 ( php.exe ) 的堆栈大小为 8MB。 pcre.recursion_limit 的安全值应根据运行脚本的可执行文件进行设置(分别为 524 和 16777)。
  • 在 *nix 系统下,Apache webserver 和命令行可执行文件通常都是用 8MB 的堆栈大小构建的,所以这个问题不会经常遇到。
  • PHP 开发者应该设置默认值 pcre.recursion_limit到安全值。
  • PHP 开发人员应该申请 preg_match() PHP 5.2 版的错误修正。
  • 可以使用 CFF Explorer 手动修改 Windows 可执行文件的堆栈大小。免费软件程序。您可以使用此程序来增加 Apache httpd.exe 的堆栈大小可执行。 (这在 XP 下有效,但 Vista 和 Win7 可能会提示。)
  • 关于php - preg_match 函数中的 RegExp 返回浏览器错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7620910/

    有关php - preg_match 函数中的 RegExp 返回浏览器错误的更多相关文章

    1. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

      总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

    2. ruby - 其他文件中的 Rake 任务 - 2

      我试图在一个项目中使用rake,如果我把所有东西都放到Rakefile中,它会很大并且很难读取/找到东西,所以我试着将每个命名空间放在lib/rake中它自己的文件中,我添加了这个到我的rake文件的顶部:Dir['#{File.dirname(__FILE__)}/lib/rake/*.rake'].map{|f|requiref}它加载文件没问题,但没有任务。我现在只有一个.rake文件作为测试,名为“servers.rake”,它看起来像这样:namespace:serverdotask:testdoputs"test"endend所以当我运行rakeserver:testid时

    3. ruby-on-rails - Ruby net/ldap 模块中的内存泄漏 - 2

      作为我的Rails应用程序的一部分,我编写了一个小导入程序,它从我们的LDAP系统中吸取数据并将其塞入一个用户表中。不幸的是,与LDAP相关的代码在遍历我们的32K用户时泄漏了大量内存,我一直无法弄清楚如何解决这个问题。这个问题似乎在某种程度上与LDAP库有关,因为当我删除对LDAP内容的调用时,内存使用情况会很好地稳定下来。此外,不断增加的对象是Net::BER::BerIdentifiedString和Net::BER::BerIdentifiedArray,它们都是LDAP库的一部分。当我运行导入时,内存使用量最终达到超过1GB的峰值。如果问题存在,我需要找到一些方法来更正我的代

    4. ruby-on-rails - Rails 3 中的多个路由文件 - 2

      Rails2.3可以选择随时使用RouteSet#add_configuration_file添加更多路由。是否可以在Rails3项目中做同样的事情? 最佳答案 在config/application.rb中:config.paths.config.routes在Rails3.2(也可能是Rails3.1)中,使用:config.paths["config/routes"] 关于ruby-on-rails-Rails3中的多个路由文件,我们在StackOverflow上找到一个类似的问题

    5. ruby-on-rails - Rails - 一个 View 中的多个模型 - 2

      我需要从一个View访问多个模型。以前,我的links_controller仅用于提供以不同方式排序的链接资源。现在我想包括一个部分(我假设)显示按分数排序的顶级用户(@users=User.all.sort_by(&:score))我知道我可以将此代码插入每个链接操作并从View访问它,但这似乎不是“ruby方式”,我将需要在不久的将来访问更多模型。这可能会变得很脏,是否有针对这种情况的任何技术?注意事项:我认为我的应用程序正朝着单一格式和动态页面内容的方向发展,本质上是一个典型的网络应用程序。我知道before_filter但考虑到我希望应用程序进入的方向,这似乎很麻烦。最终从任何

    6. ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996?但是 4.2%2==0.2 - 2

      为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返

    7. ruby-on-rails - Rails 3.2.1 中 ActionMailer 中的未定义方法 'default_content_type=' - 2

      我在我的项目中添加了一个系统来重置用户密码并通过电子邮件将密码发送给他,以防他忘记密码。昨天它运行良好(当我实现它时)。当我今天尝试启动服务器时,出现以下错误。=>BootingWEBrick=>Rails3.2.1applicationstartingindevelopmentonhttp://0.0.0.0:3000=>Callwith-dtodetach=>Ctrl-CtoshutdownserverExiting/Users/vinayshenoy/.rvm/gems/ruby-1.9.3-p0/gems/actionmailer-3.2.1/lib/action_mailer

    8. ruby-on-rails - Rails 应用程序中的 Rails : How are you using application_controller. rb 是新手吗? - 2

      刚入门rails,开始慢慢理解。有人可以解释或给我一些关于在application_controller中编码的好处或时间和原因的想法吗?有哪些用例。您如何为Rails应用程序使用应用程序Controller?我不想在那里放太多代码,因为据我了解,每个请求都会调用此Controller。这是真的? 最佳答案 ApplicationController实际上是您应用程序中的每个其他Controller都将从中继承的类(尽管这不是强制性的)。我同意不要用太多代码弄乱它并保持干净整洁的态度,尽管在某些情况下ApplicationContr

    9. ruby-on-rails - form_for 中不在模型中的自定义字段 - 2

      我想向我的Controller传递一个参数,它是一个简单的复选框,但我不知道如何在模型的form_for中引入它,这是我的观点:{:id=>'go_finance'}do|f|%>Transferirde:para:Entrada:"input",:placeholder=>"Quantofoiganho?"%>Saída:"output",:placeholder=>"Quantofoigasto?"%>Nota:我想做一个额外的复选框,但我该怎么做,模型中没有一个对象,而是一个要检查的对象,以便在Controller中创建一个ifelse,如果没有检查,请帮助我,非常感谢,谢谢

    10. ruby - rspec 需要 .rspec 文件中的 spec_helper - 2

      我注意到像bundler这样的项目在每个specfile中执行requirespec_helper我还注意到rspec使用选项--require,它允许您在引导rspec时要求一个文件。您还可以将其添加到.rspec文件中,因此只要您运行不带参数的rspec就会添加它。使用上述方法有什么缺点可以解释为什么像bundler这样的项目选择在每个规范文件中都需要spec_helper吗? 最佳答案 我不在Bundler上工作,所以我不能直接谈论他们的做法。并非所有项目都checkin.rspec文件。原因是这个文件,通常按照当前的惯例,只

    随机推荐