热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

php中英文混合文本截取字符串函数

下面要提供两款php中英文混合文本截取字符串函数,这两款字符串截取函数都是自于不同的cms一款是dede字符串截取函数,一款是phpcms的,现在拿来给各位使用.PHP代码如下:functionstr_cut($string,$leng...

下面要提供两款php中英文混合文本截取字符串函数,这两款字符串截取函数都是自于不同的cms一款是dede字符串截取函数,一款是phpcms的,现在拿来给各位使用.

PHP代码如下:

  1. function str_cut($string$length$dot = '...')  
  2. {  
  3. $strlen = strlen($string);  
  4. if($strlen <= $lengthreturn $string;  
  5. $string = str_replace(array(&#39; &#39;&#39;&&#39;&#39;"&#39;&#39;&#39;&#39;, &#39;&#39;, &#39;&#39;, &#39;&#39;, &#39;<&#39;, &#39;>&#39;, &#39;·&#39;, &#39;&#39;), array(&#39; &#39;, &#39;&&#39;, &#39;"&#39;, "&#39;", &#39;“&#39;&#39;”&#39;&#39;—&#39;&#39;<&#39;&#39;>&#39;&#39;·&#39;&#39;…&#39;), $string);  
  6. $strcut = &#39;&#39;;  
  7. if(strtolower(charset) == &#39;utf-8&#39;)  
  8. {  
  9. $n = $tn = $noc = 0;  
  10. while($n < $strlen)  
  11. {  
  12. $t = ord($string[$n]);  
  13. if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {  
  14. $tn = 1; $n++; $noc++;  
  15. elseif(194 <= $t && $t <= 223) {  
  16. $tn = 2; $n += 2; $noc += 2;  
  17. elseif(224 <= $t && $t < 239) {  
  18. $tn = 3; $n += 3; $noc += 2;  
  19. elseif(240 <= $t && $t <= 247) {  
  20. $tn = 4; $n += 4; $noc += 2;  
  21. elseif(248 <= $t && $t <= 251) {  
  22. $tn = 5; $n += 5; $noc += 2;  
  23. elseif($t == 252 || $t == 253) {  
  24. $tn = 6; $n += 6; $noc += 2;  
  25. else {  
  26. $n++;  
  27. }  
  28. if($noc >= $lengthbreak;  
  29. }  
  30. if($noc > $length$n -= $tn;  
  31. $strcut = substr($string, 0, $n);  
  32. }  
  33. else  
  34. {  
  35. $dotlen = strlen($dot);  
  36. $maxi = $length - $dotlen - 1;  
  37. for($i = 0; $i < $maxi$i++)  
  38. {  
  39. $strcut .= ord($string[$i]) > 127 ? $string[$i].$string[++$i] : $string[$i];  
  40. }  
  41. //开源代码phpfensi.com 
  42. $strcut = str_replace(array(&#39;&&#39;&#39;"&#39;, "&#39;", &#39;<&#39;, &#39;>&#39;), array(&#39;&&#39;, &#39;"&#39;, &#39;&#39;&#39;&#39;<&#39;&#39;>&#39;), $strcut);  
  43. return $strcut.$dot;  

方法二:

中文截取2,单字节截取模式,如果是request的内容,必须使用这个函数,代码如下:

  1. function cn_substrr($str,$slen,$startdd=0)  
  2. {  
  3. $str = cn_substr(strips教程lashes($str),$slen,$startdd);  
  4. return addslashes($str);  
  5. }  
  6. //中文截取2,单字节截取模式  
  7. function cn_substr($str,$slen,$startdd=0)  
  8. {  
  9. global $cfg_soft_lang;  
  10. if($cfg_soft_lang==&#39;utf-8&#39;)  
  11. {  
  12. return cn_substr_utf8($str,$slen,$startdd);  
  13. }  
  14. $restr = &#39;&#39;;  
  15. $c = &#39;&#39;;  
  16. $str_len = strlen($str);  
  17. if($str_len < $startdd+1)  
  18. {  
  19. return &#39;&#39;;  
  20. }  
  21. if($str_len < $startdd + $slen || $slen==0)  
  22. {  
  23. $slen = $str_len - $startdd;  
  24. }  
  25. $enddd = $startdd + $slen - 1;  
  26. for($i=0;$i<$str_len;$i++)  
  27. {  
  28. if($startdd==0)  
  29. {  
  30. $restr .= $c;  
  31. }  
  32. else if($i > $startdd)  
  33. {  
  34. $restr .= $c;  
  35. }  
  36. if(ord($str[$i])>0x80)  
  37. {  
  38. if($str_len>$i+1)  
  39. {  
  40. $c = $str[$i].$str[$i+1];  
  41. }  
  42. $i++;  
  43. }  
  44. else  
  45. {  
  46. $c = $str[$i];  
  47. }  
  48. if($i >= $enddd)  
  49. {  
  50. if(strlen($restr)+strlen($c)>$slen)  
  51. {  
  52. break;  
  53. }  
  54. else  
  55. {  
  56. $restr .= $c;  
  57. break;  
  58. }  
  59. }  
  60. }  
  61. return $restr;  
  62. }  
  63. //utf-8中文截取,单字节截取模式  
  64. function cn_substr_utf8($str$length$start=0)  
  65. {  
  66. if(strlen($str) < $start+1)  
  67. {  
  68. return &#39;&#39;;  
  69. }  
  70. preg_match_all("/./su"$str$ar);  
  71. $str = &#39;&#39;;  
  72. $tstr = &#39;&#39;;  
  73. //为了兼容mysql教程4.1以下版本,与数据库教程varchar一致,这里使用按字节截取  
  74. for($i=0; isset($ar[0][$i]); $i++)  
  75. {  
  76. if(strlen($tstr) < $start)  
  77. {  
  78. $tstr .= $ar[0][$i];  
  79. }  
  80. else  
  81. {  
  82. if(strlen($str) < $length + strlen($ar[0][$i]) )  
  83. {  
  84. $str .= $ar[0][$i];  
  85. }  
  86. else  
  87. {  
  88. break;  
  89. }  
  90. }  
  91. }  
  92. return $str;  
  93. }//开源代码phpfensi.com 

上面二款字符串截取函数有一个相同点,他就是全部支持中英文混体文本,也都是判断asc码值进行区别那个是汉字,那个是中文,以及是utf8还是gbk等.


推荐阅读
  • 本文介绍了在Windows Server 2003环境下,使用XAMPP Lite 1.7.1和DotProject 2.1.3时遇到的日历和甘特图中文乱码问题的解决方案。通过修改相关文件和配置,可以有效解决这些问题。 ... [详细]
  • 本文详细介绍了中央电视台电影频道的节目预告,并通过专业工具分析了其加载方式,确保用户能够获取最准确的电视节目信息。 ... [详细]
  • Composer Registry Manager:PHP的源切换管理工具
    本文介绍了一个用于Composer的源切换管理工具——Composer Registry Manager。该项目旨在简化Composer包源的管理和切换,避免与常见的CRM系统混淆,并提供了详细的安装和使用指南。 ... [详细]
  • PHP中去除换行符的多种方法及应用场景
    本文将详细介绍在PHP中去除换行符的各种方法,并结合实际应用场景进行说明。通过本文,您将了解如何根据不同操作系统的特点,选择最合适的换行符处理方式。 ... [详细]
  • 牛鞭效应是供应链管理中的一个重要概念,也是经济学中的一个术语。它描述了从零售商到供应商的需求信息在传递过程中逐渐放大的现象,导致供应链各环节的库存波动和不确定性增加。本文将详细探讨这一效应及其应对策略。 ... [详细]
  • 使用Dreamweaver创建用户注册表单的详细步骤
    本文将详细介绍如何使用Adobe Dreamweaver创建一个功能完整的用户注册表单。通过本教程,您将掌握从插入表单元素到设置属性的每一个步骤,帮助您快速上手并完成高质量的网页设计。 ... [详细]
  • 本文探讨了《魔兽世界》中红蓝两方阵营在备战阶段的策略与实现方法,通过代码展示了双方如何根据资源和兵种特性进行战士生产。 ... [详细]
  • 本文详细介绍了MicroATX(也称Mini ATX)和MATX主板规格,探讨了它们的结构特点、应用场景及对电脑系统成本和性能的影响。同时,文章还涵盖了相关操作系统的实用技巧,如蓝牙设备图标删除、磁盘管理等。 ... [详细]
  • 解决JAX-WS动态客户端工厂弃用问题并迁移到XFire
    在处理Java项目中的JAR包冲突时,我们遇到了JaxWsDynamicClientFactory被弃用的问题,并成功将其迁移到org.codehaus.xfire.client。本文详细介绍了这一过程及解决方案。 ... [详细]
  • 本文详细介绍了Git分布式版本控制系统中远程仓库的概念和操作方法。通过具体案例,帮助读者更好地理解和掌握如何高效管理代码库。 ... [详细]
  • 使用GDI的一些AIP函数我们可以轻易的绘制出简 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
  • 本文介绍了如何利用npm脚本和concurrently工具,实现本地开发环境中多个监听服务的同时启动,包括HTTP服务、自动刷新、Sass和ES6支持。 ... [详细]
  • 切比雪夫多项式
    本文主要介绍关于切比雪夫,多项式,矩阵的知识点,对【切比雪夫多项式】和【切比雪夫多项式零点公式】有兴趣的朋友可以看下由【voevie】投稿的技术文章,希望该技术和经验能帮到你解决你所遇的【数学】相关技 ... [详细]
  • 本题探讨如何通过最大流算法解决农场排水系统的设计问题。题目要求计算从水源点到汇合点的最大水流速率,使用经典的EK(Edmonds-Karp)和Dinic算法进行求解。 ... [详细]
author-avatar
桑语敬
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有