php - � 使用带有 strip_tags() 和 utf-8 字符集的 character_limiter() 出现

coder 2024-04-20 原文

当我将 Codeigniter 的 character_limiter() 与 PHP 的原生 strip_tags() 结合使用时，我得到了 � 个字符。这是我正在使用的代码:

<?php echo character_limiter(strip_tags($block->body), 60); ?>

$block->body 是存储在数据库中的 HTML 字符串。如果我只使用其中一个函数，我不会得到这个意外的输出。它看起来像这样:

这是 HTML 的样子:

^{我没有粘贴实际的 HTML，因为将其张贴在这里会修改字符串，见下文}

这是 Codeigniter 函数 character_limiter:

function character_limiter($str, $n = 500, $end_char = '&#8230;')
{
    if (strlen($str) < $n)
    {
        return $str;
    }

    $str = preg_replace("/\s+/", ' ', str_replace(array("\r\n", "\r", "\n"), ' ', $str));

    if (strlen($str) <= $n)
    {
        return $str;
    }

    $out = "";
    foreach (explode(' ', trim($str)) as $val)
    {
        $out .= $val.' ';

        if (strlen($out) >= $n)
        {
            $out = trim($out);
            return (strlen($out) == strlen($str)) ? $out : $out.$end_char;
        }
    }
}

我发现有一些不可见的字符或其他可能导致此问题的原因，因为当我将 HTML 粘贴到文本编辑器中，然后返回到图像中的“HTML 源代码编辑器”(这只是 TinyMCE) ，然后保存，奇怪的字符就消失了。

我正在全面(尽可能地)使用 utf-8 字符集。原始数据确实来自未知数据库的转储，并使用 SQL 客户端导入。但是，当我保存现有字符串(在 CMS 中)时，没有任何改变。

当一起使用时，我无法将这两个函数之间的点连接起来导致此输出，而且我不通常得到 � 字符。我仅在使用时看到此输出:

character_limiter(strip_tags($html))

可能是什么原因造成的，我该如何预防？

注意:我绝对想使用 character_limiter 函数或其变体。如果它的长度比第二个参数长，它会在字符串的末尾创建一个省略号。单独使用它(没有 strip_tags)工作得很好(没有奇怪的字符)。

更新:对于无法重现此问题的任何人，我将一个 SQL 文件放在网上以演示该问题。我正在用 MySQL Query Browser 导入它.当 HTML 来自数据库时，我似乎只得到这个输出。这是链接(忽略内容，这是客户的错):http://wesleymurch.com/test/test1.sql

最佳答案

� 用于替换未知或不可打印字符的替换字符在 php 中，我们通常使用多字节字符串函数来解决这个问题。将 mb_substr 与 strip 标签一起使用，例如:

mb_substr( strip_tags($text) , 0,300 ,'UTF-8' );//or what ever your charset

或者您可以修改 codeigniter 函数并使用多字节字符串函数。

更新

function character_limiter($str, $n = 500, $end_char = '&#8230;')
{
    if (mb_strlen($str) < $n)
    {
        return $str;
    }

    $str = mb_ereg_replace("\s+", ' ', str_replace(array("\r\n", "\r", "\n"), ' ', $str));

    if (mb_strlen($str) <= $n)
    {
        return $str;
    }

    $out = "";
    foreach (explode(' ', trim($str)) as $val)
    {
        $out .= $val.' ';

        if (mb_strlen($out) >= $n)
        {
            $out = trim($out);
            return (mb_strlen($out) == mb_strlen($str)) ? $out : $out.$end_char;
        }
    }
}

关于php - � 使用带有 strip_tags() 和 utf-8 字符集的 character_limiter() 出现，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7729868/

有关php - � 使用带有 strip_tags() 和 utf-8 字符集的 character_limiter() 出现的更多相关文章

ruby-on-rails - date_field_tag，如何设置默认日期？ [ rails 上的 ruby ] - 2
我想设置一个默认日期，例如实际日期，我该如何设置？还有如何在组合框中设置默认值顺便问一下，date_field_tag和date_field之间有什么区别？最佳答案试试这个:将默认日期作为第二个参数传递。youcorrectlysetthedefaultvalueofcomboboxasshowninyourquestion. 关于ruby-on-rails-date_field_tag，如何设置默认日期？[rails上的ruby]，我们在StackOverflow上找到一个类似的问
ruby-on-rails - 事件记录 : Select max of limit - 2
我正在尝试将以下SQL查询转换为ActiveRecord，它正在融化我的大脑。deletefromtablewhereid有什么想法吗？我想做的是限制表中的行数。所以，我想删除少于最近10个条目的所有内容。编辑:通过结合以下几个答案找到了解决方案。Temperature.where('id这给我留下了最新的10个条目。最佳答案从您的SQL来看，您似乎想要从表中删除前10条记录。我相信到目前为止的大多数答案都会如此。这里有两个额外的选择:基于MurifoX的版本:Table.where(:id=>Table.order(:id).
ruby-on-rails - ActiveRecord:除非另有说明，否则在保存之前使所有文本字段都调用 strip - 2
多年来，我在各种网站上遇到过各种问题，用户在字符串和文本字段的开头/结尾放置空格。有时这些会导致格式/布局问题，有时会导致搜索问题(即搜索顺序看起来不对，但实际上并非如此)，有时它们实际上会使应用程序崩溃。我认为这会很有用，而不是像我过去所做的那样放入一堆before_save回调，向ActiveRecord添加一些功能以在保存之前自动调用任何字符串/文本字段上的.strip，除非我告诉它不是，例如do_not_strip:field_x,:field_y或类定义顶部的类似内容。在我去弄清楚如何做到这一点之前，有没有人看到更好的解决方案？明确一点，我已经知道我可以做到这一点:befor
ruby-on-rails - Rails 导入 CSV 错误 : invalid byte sequence in UTF-8 - 2
尝试在我的Rails应用程序中导入CSV文件时，出现错误UTF-8中的无效字节序列。一切正常，直到我添加了一个gsub方法来将其中一个CSV列与我的数据库中的一个字段进行比较。当我导入CSV文件时，我想检查每一行的地址是否包含在特定客户端的不同地址数组中。我有一个带有alt_addresses属性的客户端模型，其中包含客户端地址的几种不同可能格式。然后我有一个引用模型(如果您熟悉本地SEO，您就会知道这个术语)。引用模型没有地址字段，但它有一个nap_correct?字段(NAP代表“姓名”、“地址”、“电话号码”)。如果CSV行的名称、地址和电话号码与我在该客户的数据库中拥有的相同，
ruby-on-rails - 这个 C 和 PHP 程序员如何学习 Ruby 和 Rails？ - 2
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visitthehelpcenter指导。关闭9年前。我来自C、php和bash背景，很容易学习，因为它们都有相同的C结构，我可以将其与我已经知道的联系起来。然后2年前我学了Python并且学得很好，Python对我来说比Ruby更容易学。然后从去年开始，我一直在尝试学习Ruby，然后是Rails，我承认，直到现在我还是学不会，讽刺的是那些打着简单易学的烙印，但是对于我这样一个老练的程序员来说，我只是无法将它
ruby-on-rails - 如何防止错误 "code converter not found (UTF-8)"？ - 2
我在生产环境(CentOS5.6)中遇到此错误，但在开发环境(Ubuntu11.04)中运行良好。在这两种环境中，该应用程序都使用Ruby1.9.3和Rails3.0.9，并由passenger和nginx提供服务。我的Mechanizegem版本是2.3。未找到代码转换器(UTF-8)此代码的最后一行触发它:mech=Mechanize.newpage=mech.get("http://myurl.com/login.php?login_name=a&password=b")form=page.form_with(:name=>"loginForm")form.field_with(
ruby - 为什么 shell 输出经常在其输出中使用 `mixed_characters'？ - 2
我看到反引号(`)(也称为重音符)字符与撇号字符(')混合在一起用于各种命令行输出。当然，为什么在某个地方在线记录了背后的原因/历史，但我找不到在哪里。以下是我所说的几个例子:来自make手册页:Ifmakefileis`-',thestandardinputisread.一些rake输出:.../ruby_koans/koans/about_strings.rb:6:in`test_double_quoted_strings_are_strings'为什么不一致？我想这里更广泛的问题是“为什么不适本地使用‘适当的’单引号或双引号？”但我意识到撇号(和重音符)在“标准”美国键盘上更容易
Ruby:模糊测试所有 unicode 字符(UTF8/编码/字符串操作) - 2
我无法遍历整个unicode字符范围。我到处找...我正在构建一个模糊器，并希望将所有unicode字符(一次一个)嵌入到一个url中。例如:http://www.example.com?a=\uff1c我知道有一些内置工具，但我需要更多的灵active。如果我能像下面那样做:"\u"+"ff1c"那就太好了。这是我得到的最接近的:char="\u0000"...#withiniterationchar.succ!...但在字符"\u0039"之后，即数字9，我将得到"10"而不是":" 最佳答案您可以使用pack将数字转换为UT
ruby ， `match' : invalid byte sequence in UTF-8 - 2
我对UTF-8编码有一些问题。我在这里阅读了一些帖子，但它仍然无法正常工作。这是我的代码:#!/bin/envruby#encoding:utf-8defdeterminefile=File.open("/home/lala.txt")file.eachdo|line|puts(line)type=line.match(/DOG/)puts('aaaaa')iftype!=nilputs(type[0])breakendendend这是我文件的前3行:;?lalalalal60000065535-1362490443-0000006334-0000018467-0000000041en
ruby-on-rails - 带有选项的 link_to image_tag (rel, title) - 2
在HTML中我会写:但我必须针对rubyonrails对其进行调整，而且我对它还很陌生...所以我尝试了:rel="lightbox"title="mycaption">...但它不起作用，因为“rel="lightbox"title="mycaption">”部分未应用但出现在html部分上+我看到了2个图像，而我应该只看到“imagethumb”。我也试过:"lightbox",:title=>"mycaption")%>我也看到了这两张图...我应该怎么做才能获得与我编写的HTML代码等效的内容？最佳答案试试这个"")

php - � 使用带有 strip_tags() 和 utf-8 字符集的 character_limiter() 出现

有关php - � 使用带有 strip_tags() 和 utf-8 字符集的 character_limiter() 出现的更多相关文章

随机推荐