smarty截取中文字符乱码问题？gb2312-------utf-8

作者：用户qqpgrvet8m | 来源：互联网 | 2013-06-27 15:08

一般网站页面的显示都不可避免的会涉及子字符串的截取，这个时候truncate就派上用场了，但是它只适合英文用户，对与中文用户来说

一般网站页面的显示都不可避免的会涉及子字符串的截取，这个时候truncate就派上用场了，但是它只适合英文用户，对与中文用户来说，使用truncate会出现乱码，而且对于中文英文混合串来说，截取同样个数的字符串，实际显示长度上却不同，视觉上会显得参差不齐，影像美观。这是因为一个中文的长度大致相当与两个英文的长度。此外，truncate也不能同时兼容GB2312, UTF-8等编码。

改良的smartTruncate：文件名：modifier.smartTruncate.php

function smartDetectUTF8($string)
{
static $result = array();

    if(! array_key_exists($key = md5($string), $result))
    {
        $utf8 = "
            /^(?:
                [x09x0Ax0Dx20-x7E]             # ASCII
                | [xC2-xDF][x80-xBF]            # non-overlong 2-byte
                | xE0[xA0-xBF][x80-xBF]        # excluding overlongs
                | [xE1-xECxEExEF][x80-xBF]{2} # straight 3-byte
                | xED[x80-x9F][x80-xBF]        # excluding surrogates
                | xF0[x90-xBF][x80-xBF]{2}     # planes 1-3
                | [xF1-xF3][x80-xBF]{3}         # planes 4-15
                | xF4[x80-x8F][x80-xBF]{2}     # plane 16
            )+$/xs
        ";

$result[$key] = preg_match(trim($utf8), $string);
}

return $result[$key];
}

function smartStrlen($string)
{
$result = 0;

$number = smartDetectUTF8($string) ? 3 : 2;

for($i = 0; $i {
$bytes = ord(substr($string, $i, 1)) > 127 ? $number : 1;

$result += $bytes > 1 ? 1.0 : 0.5;
}

return $result;
}

function smartSubstr($string, $start, $length = null)
{
$result = '';

$number = smartDetectUTF8($string) ? 3 : 2;

    if($start <0)
    {
        $start = max(smartStrlen($string) + $start, 0);
    }

    for($i = 0; $i     {
        if($start <= 0)
        {
            break;
        }

$bytes = ord(substr($string, $i, 1)) > 127 ? $number : 1;

$start -= $bytes > 1 ? 1.0 : 0.5;
}

    if(is_null($length))
    {
        $result = substr($string, $i);
    }
    else
    {
        for($j = $i; $j         {
            if($length <= 0)
            {
                break;
            }

            if(($bytes = ord(substr($string, $j, 1)) > 127 ? $number : 1) > 1)
            {
                if($length <1.0)
                {
                    break;
                }

                $result .= substr($string, $j, $bytes);
                $length -= 1.0;
            }
            else
            {
                $result .= substr($string, $j, 1);
                $length -= 0.5;
            }
        }
    }

return $result;
}

function smarty_modifier_smartTruncate($string, $length = 80, $etc = '...',
                                       $break_words = false, $middle = false)
{
    if ($length == 0)
        return '';

    if (smartStrlen($string) > $length) {
        $length -= smartStrlen($etc);
        if (!$break_words && !$middle) {
            $string = preg_replace('/s+?(S+)?$/', '', smartSubstr($string, 0, $length+1));
        }
        if(!$middle) {
            return smartSubstr($string, 0, $length).$etc;
        } else {
            return smartSubstr($string, 0, $length/2) . $etc . smartSubstr($string, -$length/2);
        }
    } else {
        return $string;
    }
}
?>

以上代码完整实现了truncate的原有功能，而且可以同时兼容GB2312和UTF-8编码，在判断字符长度的时候，一个中文字符算1.0，一个英文字符算0.5，所以在截取子字符串的时候不会出现参差不齐的情况.

插件的使用方式没有特别之处，这里简单测试一下：

{$content|smartTruncate:5:".."}（$content等于"A中B华C人D民E共F和G国H"）

显示：A中B华C.. （中文符号长度算1.0，英文符号长度算0.5，并且考虑省略符号的长度）

不管你是使用GB2312编码还是UTF-8编码，你会发现结果都正确，这也是为什么我在插件名字里加上smart字样的原因之一。

推荐阅读

php
深入理解父组件与子组件的引用和访问

本文详细介绍了如何在Vue.js中通过$children和$refs属性实现父组件对子组件的访问，并提供了具体的代码示例及最佳实践。 ... [详细]

蜡笔小新 2024-12-28 13:15:10
php
LeetCode 540：有序数组中的唯一元素

来源：力扣（LeetCode），链接：https://leetcode-cn.com/problems/single-element-in-a-sorted-array。题目要求在仅包含整数的有序数组中，找到唯一出现一次的元素，并确保算法的时间复杂度为 O(log n) 和空间复杂度为 O(1)。 ... [详细]

蜡笔小新 2024-12-28 13:14:07
jsp
2023 ARM嵌入式系统全国技术巡讲

2023 ARM嵌入式系统全国技术巡讲旨在分享ARM公司在半导体知识产权(IP)领域的最新进展。作为全球领先的IP提供商，ARM在嵌入式处理器市场占据主导地位，其产品广泛应用于90%以上的嵌入式设备中。此次巡讲将邀请来自ARM、飞思卡尔以及华清远见教育集团的行业专家，共同探讨当前嵌入式系统的前沿技术和应用。 ... [详细]

蜡笔小新 2024-12-28 11:58:48
email
解决 IIS 中 PHP 页面无法访问的问题

本文介绍如何解决在 IIS 环境下 PHP 页面无法找到的问题。主要步骤包括配置 Internet 信息服务管理器中的 ISAPI 扩展和 Active Server Pages 设置，确保 PHP 脚本能够正常运行。 ... [详细]

蜡笔小新 2024-12-28 11:54:54
get
Python 异步编程：深入理解 asyncio 库（上）

本文介绍了 Python 3.4 版本引入的标准库 asyncio，该库为异步 IO 提供了强大的支持。我们将探讨为什么需要 asyncio，以及它如何简化并发编程的复杂性，并详细介绍其核心概念和使用方法。 ... [详细]

蜡笔小新 2024-12-28 11:52:00
int
周期性出现的时间戳字段异常问题

探讨一个老旧 PHP MySQL 系统中，时间戳字段不定期出现异常值的问题及其可能原因。 ... [详细]

蜡笔小新 2024-12-28 11:46:54
jsp
国内BI工具迎战国际巨头Tableau，稳步崛起

尽管商业智能（BI）工具在中国的普及程度尚不及国际市场，但近年来，随着本土企业的持续创新和市场推广，国内主流BI工具正逐渐崭露头角。面对国际品牌如Tableau的强大竞争，国内BI工具通过不断优化产品和技术，赢得了越来越多用户的认可。 ... [详细]

蜡笔小新 2024-12-28 11:12:44
get
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
get
郑州大学在211高校中的地位与排名解析

本文将详细解读郑州大学作为一所位于河南省的211和双一流B类高校，在全国211高校中的地位与排名，帮助高三学生更好地了解这所知名学府的实力与发展前景。 ... [详细]

蜡笔小新 2024-12-28 10:08:34
jsp
深入理解 Oracle 存储函数：计算员工年收入

本文介绍如何使用 Oracle 存储函数查询特定员工的年收入。我们将详细解释存储函数的创建过程，并提供完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 09:49:42
jsp
优化ASM字节码操作：简化类转换与移除冗余指令

本文探讨如何利用ASM框架进行字节码操作，以优化现有类的转换过程，简化复杂的转换逻辑，并移除不必要的加0操作。通过这些技术手段，可以显著提升代码性能和可维护性。 ... [详细]

蜡笔小新 2024-12-28 09:35:00
jsp
2018回顾与2019展望

本文总结了2018年的关键成就，包括职业变动、购车、考取驾照等重要事件，并分享了读书、工作、家庭和朋友方面的感悟。同时，展望2019年，制定了健康、软实力提升和技术学习的具体目标。 ... [详细]

蜡笔小新 2024-12-28 09:10:26
jsp
电子元件封装库：三极管、MOS管及部分LDO（含3D模型）

本资源汇集了常用的插件和贴片三极管、MOS管以及部分LDO的封装，涵盖TO和SOT系列。所有封装均配有高质量的3D模型，共计96种，满足日常设计需求。 ... [详细]

蜡笔小新 2024-12-28 09:05:19
jsp
四载相伴，与51CTO学院共成长

在计算机技术的学习道路上，51CTO学院以其专业性和专注度给我留下了深刻印象。从2012年接触计算机到2014年开始系统学习网络技术和安全领域，51CTO学院始终是我信赖的学习平台。 ... [详细]

蜡笔小新 2024-12-28 08:20:07
jsp
CSS 布局：液态三栏混合宽度布局

本文介绍了如何使用 CSS 实现液态的三栏布局，其中各栏具有不同的宽度设置。通过调整容器和内容区域的属性，可以实现灵活且响应式的网页设计。 ... [详细]

蜡笔小新 2024-12-28 02:40:28

用户qqpgrvet8m

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章