热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

php中英文混合文本截取字符串函数

下面要提供两款php中英文混合文本截取字符串函数,这两款字符串截取函数都是自于不同的cms一款是dede字符串截取函数,一款是phpcms的,现在拿来给各位使用.PHP代码如下:functionstr_cut($string,$leng...

下面要提供两款php中英文混合文本截取字符串函数,这两款字符串截取函数都是自于不同的cms一款是dede字符串截取函数,一款是phpcms的,现在拿来给各位使用.

PHP代码如下:

  1. function str_cut($string$length$dot = '...')  
  2. {  
  3. $strlen = strlen($string);  
  4. if($strlen <= $lengthreturn $string;  
  5. $string = str_replace(array(&#39; &#39;&#39;&&#39;&#39;"&#39;&#39;&#39;&#39;, &#39;&#39;, &#39;&#39;, &#39;&#39;, &#39;<&#39;, &#39;>&#39;, &#39;·&#39;, &#39;&#39;), array(&#39; &#39;, &#39;&&#39;, &#39;"&#39;, "&#39;", &#39;“&#39;&#39;”&#39;&#39;—&#39;&#39;<&#39;&#39;>&#39;&#39;·&#39;&#39;…&#39;), $string);  
  6. $strcut = &#39;&#39;;  
  7. if(strtolower(charset) == &#39;utf-8&#39;)  
  8. {  
  9. $n = $tn = $noc = 0;  
  10. while($n < $strlen)  
  11. {  
  12. $t = ord($string[$n]);  
  13. if($t == 9 || $t == 10 || (32 <= $t && $t <= 126)) {  
  14. $tn = 1; $n++; $noc++;  
  15. elseif(194 <= $t && $t <= 223) {  
  16. $tn = 2; $n += 2; $noc += 2;  
  17. elseif(224 <= $t && $t < 239) {  
  18. $tn = 3; $n += 3; $noc += 2;  
  19. elseif(240 <= $t && $t <= 247) {  
  20. $tn = 4; $n += 4; $noc += 2;  
  21. elseif(248 <= $t && $t <= 251) {  
  22. $tn = 5; $n += 5; $noc += 2;  
  23. elseif($t == 252 || $t == 253) {  
  24. $tn = 6; $n += 6; $noc += 2;  
  25. else {  
  26. $n++;  
  27. }  
  28. if($noc >= $lengthbreak;  
  29. }  
  30. if($noc > $length$n -= $tn;  
  31. $strcut = substr($string, 0, $n);  
  32. }  
  33. else  
  34. {  
  35. $dotlen = strlen($dot);  
  36. $maxi = $length - $dotlen - 1;  
  37. for($i = 0; $i < $maxi$i++)  
  38. {  
  39. $strcut .= ord($string[$i]) > 127 ? $string[$i].$string[++$i] : $string[$i];  
  40. }  
  41. //开源代码phpfensi.com 
  42. $strcut = str_replace(array(&#39;&&#39;&#39;"&#39;, "&#39;", &#39;<&#39;, &#39;>&#39;), array(&#39;&&#39;, &#39;"&#39;, &#39;&#39;&#39;&#39;<&#39;&#39;>&#39;), $strcut);  
  43. return $strcut.$dot;  

方法二:

中文截取2,单字节截取模式,如果是request的内容,必须使用这个函数,代码如下:

  1. function cn_substrr($str,$slen,$startdd=0)  
  2. {  
  3. $str = cn_substr(strips教程lashes($str),$slen,$startdd);  
  4. return addslashes($str);  
  5. }  
  6. //中文截取2,单字节截取模式  
  7. function cn_substr($str,$slen,$startdd=0)  
  8. {  
  9. global $cfg_soft_lang;  
  10. if($cfg_soft_lang==&#39;utf-8&#39;)  
  11. {  
  12. return cn_substr_utf8($str,$slen,$startdd);  
  13. }  
  14. $restr = &#39;&#39;;  
  15. $c = &#39;&#39;;  
  16. $str_len = strlen($str);  
  17. if($str_len < $startdd+1)  
  18. {  
  19. return &#39;&#39;;  
  20. }  
  21. if($str_len < $startdd + $slen || $slen==0)  
  22. {  
  23. $slen = $str_len - $startdd;  
  24. }  
  25. $enddd = $startdd + $slen - 1;  
  26. for($i=0;$i<$str_len;$i++)  
  27. {  
  28. if($startdd==0)  
  29. {  
  30. $restr .= $c;  
  31. }  
  32. else if($i > $startdd)  
  33. {  
  34. $restr .= $c;  
  35. }  
  36. if(ord($str[$i])>0x80)  
  37. {  
  38. if($str_len>$i+1)  
  39. {  
  40. $c = $str[$i].$str[$i+1];  
  41. }  
  42. $i++;  
  43. }  
  44. else  
  45. {  
  46. $c = $str[$i];  
  47. }  
  48. if($i >= $enddd)  
  49. {  
  50. if(strlen($restr)+strlen($c)>$slen)  
  51. {  
  52. break;  
  53. }  
  54. else  
  55. {  
  56. $restr .= $c;  
  57. break;  
  58. }  
  59. }  
  60. }  
  61. return $restr;  
  62. }  
  63. //utf-8中文截取,单字节截取模式  
  64. function cn_substr_utf8($str$length$start=0)  
  65. {  
  66. if(strlen($str) < $start+1)  
  67. {  
  68. return &#39;&#39;;  
  69. }  
  70. preg_match_all("/./su"$str$ar);  
  71. $str = &#39;&#39;;  
  72. $tstr = &#39;&#39;;  
  73. //为了兼容mysql教程4.1以下版本,与数据库教程varchar一致,这里使用按字节截取  
  74. for($i=0; isset($ar[0][$i]); $i++)  
  75. {  
  76. if(strlen($tstr) < $start)  
  77. {  
  78. $tstr .= $ar[0][$i];  
  79. }  
  80. else  
  81. {  
  82. if(strlen($str) < $length + strlen($ar[0][$i]) )  
  83. {  
  84. $str .= $ar[0][$i];  
  85. }  
  86. else  
  87. {  
  88. break;  
  89. }  
  90. }  
  91. }  
  92. return $str;  
  93. }//开源代码phpfensi.com 

上面二款字符串截取函数有一个相同点,他就是全部支持中英文混体文本,也都是判断asc码值进行区别那个是汉字,那个是中文,以及是utf8还是gbk等.


推荐阅读
  • 本文详细对比了HashMap和HashTable在多线程环境下的安全性、对null值的支持、性能表现以及方法同步等方面的特点,帮助开发者根据具体需求选择合适的数据结构。 ... [详细]
  • 本文详细介绍了如何使用Linux下的mysqlshow命令来查询MySQL数据库的相关信息,包括数据库、表以及字段的详情。通过本文的学习,读者可以掌握mysqlshow命令的基本语法及其常用选项。 ... [详细]
  • 本文详细介绍了企业内部的主要管理层级,包括董事会、首席执行官(CEO)及总裁、总经理等角色的定义与职责。 ... [详细]
  • 本文列举了构建和运行 Struts2 应用程序所需的核心 JAR 文件,包括文件上传、日志记录、模板引擎等关键组件。 ... [详细]
  • selenium通过JS语法操作页面元素
    做过web测试的小伙伴们都知道,web元素现在很多是JS写的,那么既然是JS写的,可以通过JS语言去操作页面,来帮助我们操作一些selenium不能覆盖的功能。问题来了我们能否通过 ... [详细]
  • 探讨‘驓’字在新华字典中的发音、笔画结构、常见组合及命名使用建议。 ... [详细]
  • 音乐对决:深入解析《节奏大师》的魅力与玩法
    由腾讯开发的音乐节奏游戏《节奏大师》凭借其独特的魅力吸引了大量玩家。本文将详细介绍这款游戏的操作方式及为何能吸引众多玩家。 ... [详细]
  • 本文介绍了如何通过安装和配置php_uploadprogress扩展来实现文件上传时的进度条显示功能。通过一个简单的示例,详细解释了从安装扩展到编写具体代码的全过程。 ... [详细]
  • HTML 表格与列表标签详解
    本文详细介绍了HTML中的表格标签和列表标签的使用方法,包括如何创建表格的不同部分(如标题、头部、主体和脚部),以及如何利用这些标签进行数据展示和布局设计。 ... [详细]
  • 苹果官方在线商店(中国)提供了关于MacBook Pro的详细信息。通过先进的工厂校准技术,新MacBook Pro能够精确地适应多种色彩空间标准,如sRGB、BT.601、BT.709及P3-ST.2084(HDR),确保用户获得最佳视觉效果。 ... [详细]
  • Windows环境下Oracle数据库迁移实践
    本文详细记录了一次在Windows操作系统下将Oracle数据库的控制文件、数据文件及在线日志文件迁移至外部存储的过程,旨在为后续的集群环境部署做好准备。 ... [详细]
  • 本文探讨了当通过Nginx访问网站时出现504 Gateway Timeout错误的解决方案,特别是当请求处理时间超过30秒时的情况。文章提供了调整PHP-FPM配置的具体步骤,以延长请求超时时间。 ... [详细]
  • 作为一名即将步入职场的应届毕业生,我在选择职业路径时面临两个选项:SAP的ABAP开发或大数据技术。对于SAP领域,我的目标是成为一名顾问。面对这两个方向,哪一个具有更好的发展前景,哪一个更容易上手?希望各位前辈能提供一些见解。 ... [详细]
  • 狮子数学:第六百零五章 阿贝尔定理(第九十九讲)
    本章节深入探讨了阿贝尔定理的核心内容及其在数学分析中的应用,通过具体的例子和详细的证明过程,帮助读者更好地理解和掌握这一重要理论。 ... [详细]
  • Adversarial Personalized Ranking for Recommendation
    目录概主要内容基础对抗扰动对抗训练细节代码HeX.,HeZ.,DuX.andChuaT.Adversarialpersonalizedrankingforrecommendatio ... [详细]
author-avatar
桑语敬
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有