草庐IT

php - 从 HTML 中删除带有换行符的空标签

coder 2024-04-21 原文

我有以下 HTML:

<body>Summary: <br>
    <table class="stats data tablesorter marg-bottom">
        <thead><tr><th>Team</th><th>Wins</th><th>Losses</th><th>Ties</th><th>Win %</th></tr></thead>
        <tbody>

            <tr>
                <td>Team 1</td>
                <td>95</td>
                <td>74</td>
                <td>0</td>
                <td>56.21</td>
            </tr>

            <tr>
                <td>Team 2</td>
                <td>74</td>
                <td>95</td>
                <td>0</td>
                <td>43.79</td>
            </tr>

        </tbody>
    </table>


<div>
    </div>
</body>

我想要这样的结果:

<body>Summary: <br>
    <table class="stats data tablesorter marg-bottom">
        <thead><tr><th>Team</th><th>Wins</th><th>Losses</th><th>Ties</th><th>Win %</th></tr></thead>
        <tbody>
            <tr>
                <td>Team 1</td>
                <td>95</td>
                <td>74</td>
                <td>0</td>
                <td>56.21</td>
            </tr>
            <tr>
                <td>Team 2</td>
                <td>74</td>
                <td>95</td>
                <td>0</td>
                <td>43.79</td>
            </tr>
        </tbody>
    </table>
</body>

最简单的方法是正确编码,不幸的是,它来自一个非常非常旧的 CKEditor 版本,我无法升级它(由于其他影响)。

什么 preg_replace或递归函数或循环我可以运行以删除空的 <div>标签和不需要的空行?

最佳答案

假设您将此 HTML 保存在名为 $html 的变量中:

// Replace empty <div> tags with nothing
$html = preg_replace("/<div>\s*<\/div>/", "", $html);

// Replace multiple newlines in a row with a single newline
$html = preg_replace("/\n+/", "\n", $html);

echo $html;

编辑

完整的工作代码,包括输出:

<?php

$html = <<<END
<body>Summary: <br>
    <table class="stats data tablesorter marg-bottom">
        <thead><tr><th>Team</th><th>Wins</th><th>Losses</th><th>Ties</th><th>Win %</th></tr></thead>
        <tbody>

            <tr>
                <td>Team 1</td>
                <td>95</td>
                <td>74</td>
                <td>0</td>
                <td>56.21</td>
            </tr>

            <tr>
                <td>Team 2</td>
                <td>74</td>
                <td>95</td>
                <td>0</td>
                <td>43.79</td>
            </tr>

        </tbody>
    </table>


<div>
    </div>
</body>

END;

// Replace empty <div> tags with nothing
$html = preg_replace("/<div>\s*<\/div>/", "", $html);

// Replace multiple newlines in a row with a single newline
$html = preg_replace("/\n+/", "\n", $html);

echo $html;

// OUTPUT:

// <body>Summary: <br>
//     <table class="stats data tablesorter marg-bottom">
//         <thead><tr><th>Team</th><th>Wins</th><th>Losses</th><th>Ties</th><th>Win %</th></tr></thead>
//         <tbody>
//             <tr>
//                 <td>Team 1</td>
//                 <td>95</td>
//                 <td>74</td>
//                 <td>0</td>
//                 <td>56.21</td>
//             </tr>
//             <tr>
//                 <td>Team 2</td>
//                 <td>74</td>
//                 <td>95</td>
//                 <td>0</td>
//                 <td>43.79</td>
//             </tr>
//         </tbody>
//     </table>
// </body>

?>

关于php - 从 HTML 中删除带有换行符的空标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38137487/

有关php - 从 HTML 中删除带有换行符的空标签的更多相关文章

  1. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  2. ruby-on-rails - 如何从 format.xml 中删除 <hash></hash> - 2

    我有一个对象has_many应呈现为xml的子对象。这不是问题。我的问题是我创建了一个Hash包含此数据,就像解析器需要它一样。但是rails自动将整个文件包含在.........我需要摆脱type="array"和我该如何处理?我没有在文档中找到任何内容。 最佳答案 我遇到了同样的问题;这是我的XML:我在用这个:entries.to_xml将散列数据转换为XML,但这会将条目的数据包装到中所以我修改了:entries.to_xml(root:"Contacts")但这仍然将转换后的XML包装在“联系人”中,将我的XML代码修改为

  3. ruby - 我可以使用 Ruby 从 CSV 中删除列吗? - 2

    查看Ruby的CSV库的文档,我非常确定这是可能且简单的。我只需要使用Ruby删除CSV文件的前三列,但我没有成功运行它。 最佳答案 csv_table=CSV.read(file_path_in,:headers=>true)csv_table.delete("header_name")csv_table.to_csv#=>ThenewCSVinstringformat检查CSV::Table文档:http://ruby-doc.org/stdlib-1.9.2/libdoc/csv/rdoc/CSV/Table.html

  4. ruby - 在院子里用@param 标签警告 - 2

    我试图使用yard记录一些Ruby代码,尽管我所做的正是所描述的here或here#@param[Integer]thenumberoftrials(>=0)#@param[Float]successprobabilityineachtrialdefinitialize(n,p)#initialize...end虽然我仍然得到这个奇怪的错误@paramtaghasunknownparametername:the@paramtaghasunknownparametername:success然后生成的html看起来很奇怪。我称yard为:$yarddoc-mmarkdown我做错了什么?

  5. ruby-on-rails - Rails HTML 请求渲染 JSON - 2

    在我的Controller中,我通过以下方式在我的index方法中支持HTML和JSON:respond_todo|format|format.htmlformat.json{renderjson:@user}end在浏览器中拉起它时,它会自然地以HTML呈现。但是,当我对/user资源进行内容类型为application/json的curl调用时(因为它是索引方法),我仍然将HTML作为响应。如何获取JSON作为响应?我还需要说明什么? 最佳答案 您应该将.json附加到请求的url,提供的格式在routes.rb的路径中定义。这

  6. ruby - 我可以使用 aws-sdk-ruby 在 AWS S3 上使用事务性文件删除/上传吗? - 2

    我发现ActiveRecord::Base.transaction在复杂方法中非常有效。我想知道是否可以在如下事务中从AWSS3上传/删除文件:S3Object.transactiondo#writeintofiles#raiseanexceptionend引发异常后,每个操作都应在S3上回滚。S3Object这可能吗?? 最佳答案 虽然S3API具有批量删除功能,但它不支持事务,因为每个删除操作都可以独立于其他操作成功/失败。该API不提供任何批量上传功能(通过PUT或POST),因此每个上传操作都是通过一个独立的API调用完成的

  7. ruby-on-rails - 使用 Sublime Text 3 突出显示 HTML 背景语法中的 ERB? - 2

    所以我在关注Railscast,我注意到在html.erb文件中,ruby代码有一个微弱的背景高亮效果,以区别于其他代码HTML文档。我知道Ryan使用TextMate。我正在使用SublimeText3。我怎样才能达到同样的效果?谢谢! 最佳答案 为SublimeText安装ERB包。假设您安装了SublimeText包管理器*,只需点击cmd+shift+P即可获得命令菜单,然后键入installpackage并选择PackageControl:InstallPackage获取包管理器菜单。在该菜单中,键入ERB并在看到包时选择

  8. ruby-on-rails - Ruby url 到 html 链接转换 - 2

    我正在使用Rails构建一个简单的聊天应用程序。当用户输入url时,我希望将其输出为html链接(即“url”)。我想知道在Ruby中是否有任何库或众所周知的方法可以做到这一点。如果没有,我有一些不错的正则表达式示例代码可以使用... 最佳答案 查看auto_linkRails提供的辅助方法。这会将所有URL和电子邮件地址变成可点击的链接(htmlanchor标记)。这是文档中的代码示例。auto_link("Gotohttp://www.rubyonrails.organdsayhellotodavid@loudthinking.

  9. ruby - 如何安全地删除文件? - 2

    在Ruby中是否有Gem或安全删除文件的方法?我想避免系统上可能不存在的外部程序。“安全删除”指的是覆盖文件内容。 最佳答案 如果您使用的是*nix,一个很好的方法是使用exec/open3/open4调用shred:`shred-fxuz#{filename}`http://www.gnu.org/s/coreutils/manual/html_node/shred-invocation.html检查这个类似的帖子:Writingafileshredderinpythonorruby?

  10. ruby-on-rails - capybara ::ElementNotFound:无法找到 xpath "/html" - 2

    我正在学习http://ruby.railstutorial.org/chapters/static-pages上的RubyonRails教程并遇到以下错误StaticPagesHomepageshouldhavethecontent'SampleApp'Failure/Error:page.shouldhave_content('SampleApp')Capybara::ElementNotFound:Unabletofindxpath"/html"#(eval):2:in`text'#./spec/requests/static_pages_spec.rb:7:in`(root)'

随机推荐