当我将 Codeigniter 的 character_limiter() 与 PHP 的原生 strip_tags() 结合使用时,我得到了 � 个字符。这是我正在使用的代码:
<?php echo character_limiter(strip_tags($block->body), 60); ?>
$block->body 是存储在数据库中的 HTML 字符串。如果我只使用其中一个函数,我不会得到这个意外的输出。它看起来像这样:
这是 HTML 的样子:
我没有粘贴实际的 HTML,因为将其张贴在这里会修改字符串,见下文
这是 Codeigniter 函数 character_limiter:
function character_limiter($str, $n = 500, $end_char = '…')
{
if (strlen($str) < $n)
{
return $str;
}
$str = preg_replace("/\s+/", ' ', str_replace(array("\r\n", "\r", "\n"), ' ', $str));
if (strlen($str) <= $n)
{
return $str;
}
$out = "";
foreach (explode(' ', trim($str)) as $val)
{
$out .= $val.' ';
if (strlen($out) >= $n)
{
$out = trim($out);
return (strlen($out) == strlen($str)) ? $out : $out.$end_char;
}
}
}
我发现有一些不可见的字符或其他可能导致此问题的原因,因为当我将 HTML 粘贴到文本编辑器中,然后返回到图像中的“HTML 源代码编辑器”(这只是 TinyMCE) ,然后保存,奇怪的字符就消失了。
我正在全面(尽可能地)使用 utf-8 字符集。原始数据确实来自未知数据库的转储,并使用 SQL 客户端导入。但是,当我保存现有字符串(在 CMS 中)时,没有任何改变。
当一起使用时,我无法将这两个函数之间的点连接起来导致此输出,而且我不通常得到 � 字符。我仅在使用时看到此输出:
character_limiter(strip_tags($html))
可能是什么原因造成的,我该如何预防?
注意:我绝对想使用 character_limiter 函数或其变体。如果它的长度比第二个参数长,它会在字符串的末尾创建一个省略号。单独使用它(没有 strip_tags)工作得很好(没有奇怪的字符)。
更新:对于无法重现此问题的任何人,我将一个 SQL 文件放在网上以演示该问题。我正在用 MySQL Query Browser 导入它.当 HTML 来自数据库时,我似乎只得到这个输出。这是链接(忽略内容,这是客户的错):http://wesleymurch.com/test/test1.sql
最佳答案
� 用于替换未知或不可打印字符的替换字符 在 php 中,我们通常使用多字节字符串函数来解决这个问题。 将 mb_substr 与 strip 标签一起使用,例如:
mb_substr( strip_tags($text) , 0,300 ,'UTF-8' );//or what ever your charset
或者您可以修改 codeigniter 函数并使用多字节字符串函数。
更新
function character_limiter($str, $n = 500, $end_char = '…')
{
if (mb_strlen($str) < $n)
{
return $str;
}
$str = mb_ereg_replace("\s+", ' ', str_replace(array("\r\n", "\r", "\n"), ' ', $str));
if (mb_strlen($str) <= $n)
{
return $str;
}
$out = "";
foreach (explode(' ', trim($str)) as $val)
{
$out .= $val.' ';
if (mb_strlen($out) >= $n)
{
$out = trim($out);
return (mb_strlen($out) == mb_strlen($str)) ? $out : $out.$end_char;
}
}
}
关于php - � 使用带有 strip_tags() 和 utf-8 字符集的 character_limiter() 出现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7729868/
我想设置一个默认日期,例如实际日期,我该如何设置?还有如何在组合框中设置默认值顺便问一下,date_field_tag和date_field之间有什么区别? 最佳答案 试试这个:将默认日期作为第二个参数传递。youcorrectlysetthedefaultvalueofcomboboxasshowninyourquestion. 关于ruby-on-rails-date_field_tag,如何设置默认日期?[rails上的ruby],我们在StackOverflow上找到一个类似的问
我正在尝试将以下SQL查询转换为ActiveRecord,它正在融化我的大脑。deletefromtablewhereid有什么想法吗?我想做的是限制表中的行数。所以,我想删除少于最近10个条目的所有内容。编辑:通过结合以下几个答案找到了解决方案。Temperature.where('id这给我留下了最新的10个条目。 最佳答案 从您的SQL来看,您似乎想要从表中删除前10条记录。我相信到目前为止的大多数答案都会如此。这里有两个额外的选择:基于MurifoX的版本:Table.where(:id=>Table.order(:id).
多年来,我在各种网站上遇到过各种问题,用户在字符串和文本字段的开头/结尾放置空格。有时这些会导致格式/布局问题,有时会导致搜索问题(即搜索顺序看起来不对,但实际上并非如此),有时它们实际上会使应用程序崩溃。我认为这会很有用,而不是像我过去所做的那样放入一堆before_save回调,向ActiveRecord添加一些功能以在保存之前自动调用任何字符串/文本字段上的.strip,除非我告诉它不是,例如do_not_strip:field_x,:field_y或类定义顶部的类似内容。在我去弄清楚如何做到这一点之前,有没有人看到更好的解决方案?明确一点,我已经知道我可以做到这一点:befor
尝试在我的Rails应用程序中导入CSV文件时,出现错误UTF-8中的无效字节序列。一切正常,直到我添加了一个gsub方法来将其中一个CSV列与我的数据库中的一个字段进行比较。当我导入CSV文件时,我想检查每一行的地址是否包含在特定客户端的不同地址数组中。我有一个带有alt_addresses属性的客户端模型,其中包含客户端地址的几种不同可能格式。然后我有一个引用模型(如果您熟悉本地SEO,您就会知道这个术语)。引用模型没有地址字段,但它有一个nap_correct?字段(NAP代表“姓名”、“地址”、“电话号码”)。如果CSV行的名称、地址和电话号码与我在该客户的数据库中拥有的相同,
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭9年前。我来自C、php和bash背景,很容易学习,因为它们都有相同的C结构,我可以将其与我已经知道的联系起来。然后2年前我学了Python并且学得很好,Python对我来说比Ruby更容易学。然后从去年开始,我一直在尝试学习Ruby,然后是Rails,我承认,直到现在我还是学不会,讽刺的是那些打着简单易学的烙印,但是对于我这样一个老练的程序员来说,我只是无法将它
我在生产环境(CentOS5.6)中遇到此错误,但在开发环境(Ubuntu11.04)中运行良好。在这两种环境中,该应用程序都使用Ruby1.9.3和Rails3.0.9,并由passenger和nginx提供服务。我的Mechanizegem版本是2.3。未找到代码转换器(UTF-8)此代码的最后一行触发它:mech=Mechanize.newpage=mech.get("http://myurl.com/login.php?login_name=a&password=b")form=page.form_with(:name=>"loginForm")form.field_with(
我看到反引号(`)(也称为重音符)字符与撇号字符(')混合在一起用于各种命令行输出。当然,为什么在某个地方在线记录了背后的原因/历史,但我找不到在哪里。以下是我所说的几个例子:来自make手册页:Ifmakefileis`-',thestandardinputisread.一些rake输出:.../ruby_koans/koans/about_strings.rb:6:in`test_double_quoted_strings_are_strings'为什么不一致?我想这里更广泛的问题是“为什么不适本地使用‘适当的’单引号或双引号?”但我意识到撇号(和重音符)在“标准”美国键盘上更容易
我无法遍历整个unicode字符范围。我到处找...我正在构建一个模糊器,并希望将所有unicode字符(一次一个)嵌入到一个url中。例如:http://www.example.com?a=\uff1c我知道有一些内置工具,但我需要更多的灵active。如果我能像下面那样做:"\u"+"ff1c"那就太好了。这是我得到的最接近的:char="\u0000"...#withiniterationchar.succ!...但在字符"\u0039"之后,即数字9,我将得到"10"而不是":" 最佳答案 您可以使用pack将数字转换为UT
我对UTF-8编码有一些问题。我在这里阅读了一些帖子,但它仍然无法正常工作。这是我的代码:#!/bin/envruby#encoding:utf-8defdeterminefile=File.open("/home/lala.txt")file.eachdo|line|puts(line)type=line.match(/DOG/)puts('aaaaa')iftype!=nilputs(type[0])breakendendend这是我文件的前3行:;?lalalalal60000065535-1362490443-0000006334-0000018467-0000000041en
在HTML中我会写:但我必须针对rubyonrails对其进行调整,而且我对它还很陌生...所以我尝试了:rel="lightbox"title="mycaption">...但它不起作用,因为“rel="lightbox"title="mycaption">”部分未应用但出现在html部分上+我看到了2个图像,而我应该只看到“imagethumb”。我也试过:"lightbox",:title=>"mycaption")%>我也看到了这两张图...我应该怎么做才能获得与我编写的HTML代码等效的内容? 最佳答案 试试这个"")