热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

包含中文的字符串截取问题

今天说一个大家都遇到的问题,关于字符串截取的。主要说一下中文、英文混写的字符串怎么截取!

今天说一个大家都遇到的问题,关于字符串截取的。主要说一下中文、英文混写的字符串怎么截取!

首先,全英文以及和数字混合的字符串,我们都知道这个函数substr($string,int stsrt,int length),带有三个参数:$string是我们要截取的字符串,int start表示开始截取的位置,最后一个表示截取的长度。在这种情况下,用这个函数截取是OK的。

下面,就是中英混写的一类,搞不好就出现乱码的,令人头疼。之前在网上也看了许多自定义的函数,代码比较多,看起来很复杂,其实PHP自带的有一个扩展函数mb_substr(),用这个函数截取是不会出现乱码的。

用这个函数,必须注意开启mbstring扩展,在PHP配置文件中找到extension=php_mbstring.dll,把前面的分号去掉就是了。一般带有四个参数:

mb_substr($string,int start,int length,encoding),前三个和substr()的一样,最好一个参数是说明编码的,如果是ANSI类型的文件就是gbk了,utf-8就是utf-8。

例如:echo mb_substr('我是1个beautiful人','1','5','gbk');结果就是“是1个be”,注意:编码要对应,这时候一个汉字和一个字符都代表一个长度,位置从零开始。

如果非要弄自定义函数的话,可以参考smarty里面的一个函数,在/plugins目录下面,有个字符串截取的函数文件modifier.truncate.php,我们可以参考这个写,然后判断编码的形式,把对应的字母或者汉字以存储格式作为匹配条件重新放入一个数组中去,每一个元素对应一个字母或者一个汉字,这样就不会乱码了,然后用array_slice()函数把截取的字符串取出来,下面贴上代码:

UTF- 8的编码格式:"/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]| [\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/"

GBK的编码格式:"/[\x01-\x7f]|[\xa1-\xff][\xa1-\xff]/"


推荐阅读
  • 本文详细介绍了福昕软件公司开发的Foxit PDF SDK ActiveX控件(版本5.20),并提供了关于其在64位Windows 7系统和Visual Studio 2013环境下的使用方法。该控件文件名为FoxitPDFSDKActiveX520_Std_x64.ocx,适用于集成PDF功能到应用程序中。 ... [详细]
  • Appium + Java 自动化测试中处理页面空白区域点击问题
    在进行移动应用自动化测试时,有时会遇到某些页面没有返回按钮,只能通过点击空白区域返回的情况。本文将探讨如何在Appium + Java环境中有效解决此类问题,并提供详细的解决方案。 ... [详细]
  • 本题来自WC2014,题目编号为BZOJ3435、洛谷P3920和UOJ55。该问题描述了一棵不断生长的带权树及其节点上小精灵之间的友谊关系,要求实时计算每次新增节点后树上所有可能的朋友对数。 ... [详细]
  • 本文详细介绍了如何使用 PHP 接收并处理微信支付的回调结果,确保支付通知能够被正确接收和响应。 ... [详细]
  • 小编给大家分享一下如何移除URL中的index.php,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收 ... [详细]
  • 本文详细介绍了如何在PHP中删除数组中的指定元素、第一个元素和最后一个元素,并提供了具体的代码示例和相关函数的使用说明。 ... [详细]
  • 本文详细解析了汉字‘犐’的基本字义及其在古代文献中的应用,旨在为读者提供全面而深入的理解。 ... [详细]
  • 嵌入式开发环境搭建与文件传输指南
    本文详细介绍了如何为嵌入式应用开发搭建必要的软硬件环境,并提供了通过串口和网线两种方式将文件传输到开发板的具体步骤。适合Linux开发初学者参考。 ... [详细]
  • 解决TensorFlow CPU版本安装中的依赖问题
    本文记录了在安装CPU版本的TensorFlow过程中遇到的依赖问题及解决方案,特别是numpy版本不匹配和动态链接库(DLL)错误。通过详细的步骤说明和专业建议,帮助读者顺利安装并使用TensorFlow。 ... [详细]
  • 本文详细介绍了在XAMPP环境中如何修改Apache和MySQL的默认端口号,并确保WordPress能够正常访问。同时,提供了针对Go语言社区和Golang开发者的相关建议。 ... [详细]
  • 澄清对 IN 语句索引使用常见误解
    本文旨在纠正关于 MySQL 中 IN 语句是否使用索引的常见误解。许多人认为 IN 语句的索引使用与字符串长度有关,实际上,影响因素更为复杂,包括数据分布和 MySQL 版本等因素。 ... [详细]
  • PHP 实现多级树形结构:构建无限层级分类系统
    在众多管理系统中,如菜单、分类和部门等模块,通常需要处理层级结构。为了高效管理和展示这些层级数据,本文将介绍如何使用 PHP 实现多级树形结构,并提供代码示例以帮助开发者轻松实现无限分级。 ... [详细]
  • This article explains how to check if a given string consists solely of English characters, including letters and numbers. It provides a practical PHP function for this purpose. ... [详细]
  • 工作后体重逐渐增加,尽管尚未达到令人担忧的程度,但对于热爱运动的人来说,这一变化难以接受。经过长时间的考虑,我决定重新制定减重计划,以恢复最佳的身体状态。 ... [详细]
  • 本文探讨如何配置 Nginx 以将传入请求反向代理到运行在本地绑定端口上的 Docker 容器,并解决常见的路径重定向问题。 ... [详细]
author-avatar
mobiledu2502938577
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有