当前位置: 开发笔记 > 编程语言 > 正文

Lua中获取字符串长度整理

作者：随遇而安gqS1 | 来源：互联网 | 2023-09-12 11:13

在Lua中，获取字符串长度我们一般使用#str（不建议使用string.len(str)）！localstrabcl

在 Lua 中&＃xff0c;获取字符串长度我们一般使用 #str&＃xff08;不建议使用 string.len(str) &＃xff09;&＃xff01;

local str &＃61; "abc" local len &＃61; #str print(len) -- 3 str &＃61; "你们好" len &＃61; #str print(len) -- 9

这里就出现了一个问题&＃xff1a;为啥字符串 abc 的长度为 3&＃xff0c;而字符串 你们好 的长度却是 9 呢&＃xff1f;难道是哪里出问题了&＃xff1f;当然不是&＃xff01;

其实这是字符编码导致的&＃xff0c;在使用 UTF-8 字符编码的情况下&＃xff0c;一个中文字符一般占 3 个字节&＃xff0c;所以 3 个中文字符自然就是 9 个字节咯&＃xff01;

那么问题来了&＃xff0c;现在我需要不管是中文字符还是其他字符&＃xff0c;长度都为 1 该咋整呢&＃xff1f;

这里记录两种方案&＃xff1a;

方案一

-- 获取字符串的长度&＃xff08;任何单个字符长度都为1&＃xff09; function getStringLength(inputstr) if not inputstr or type(inputstr) ~&＃61; "string" or #inputstr <&＃61; 0 then return nil end local length &＃61; 0 -- 字符的个数 local i &＃61; 1 while true do local curByte &＃61; string.byte(inputstr, i) local byteCount &＃61; 1 if curByte > 239 then byteCount &＃61; 4 -- 4字节字符 elseif curByte > 223 then byteCount &＃61; 3 -- 汉字 elseif curByte > 128 then byteCount &＃61; 2 -- 双字节字符 else byteCount &＃61; 1 -- 单字节字符 end -- local char &＃61; string.sub(inputstr, i, i &＃43; byteCount - 1) -- print(char) -- 打印单个字符 i &＃61; i &＃43; byteCount length &＃61; length &＃43; 1 if i > #inputstr then break end end return length end local str &＃61; "I think,故我在&＃xff01;" local len &＃61; getStringLength(str) print(len) -- 12

方案二

-- 计算 UTF8 字符串的长度&＃xff0c;每一个中文算一个字符 function utf8len(input) local len &＃61; string.len(input) local left &＃61; len local cnt &＃61; 0 local arr &＃61; {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc} while left ~&＃61; 0 do local tmp &＃61; string.byte(input, -left) local i &＃61; #arr while arr[i] do if tmp >&＃61; arr[i] then left &＃61; left - i break end i &＃61; i - 1 end cnt &＃61; cnt &＃43; 1 end return cnt end local str &＃61; "I think,故我在&＃xff01;" local len &＃61; utf8len(str) print(len) -- 12

归根结底其实就是对 UTF-8 字符编码进行处理&＃xff01;

参考&＃xff1a;

关于字符编码的八个点

在Lua中计算含中文的字符串的长度

推荐阅读

utf-8
Java 基础数据类型及其存储大小与取值范围

本文介绍了 Java 中的八种基础数据类型，包括 byte、char、short、int、long、float、double 和 boolean，并详细说明了每种类型的存储大小和取值范围。 ... [详细]

蜡笔小新 2024-11-17 17:26:38
utf-8
mybatis 详解（七）一对一、一对多、多对多

mybatis详解（七）------一 ... [详细]

蜡笔小新 2024-11-17 10:03:06
buffer
DirectShow Filter 开发指南

本文总结了 DirectShow Filter 的开发经验，重点介绍了 Source Filter、In-Place Transform Filter 和 Render Filter 的实现方法。通过使用 DirectShow 提供的类，可以简化 Filter 的开发过程。 ... [详细]

蜡笔小新 2024-11-16 23:50:16
buffer
Lua IO操作详解

本文介绍了Lua中的IO操作，包括简单模式和完整模式下的文件处理方法，以及相关的系统调用。 ... [详细]

蜡笔小新 2024-11-15 20:45:08
utf-8
java rabbitmq topic_rabbitmq+topic+java

可参照github代码：https:github.comrabbitmqrabbitmq-tutorialsblobmasterjavaEmitLogTopic.ja ... [详细]

蜡笔小新 2024-11-15 18:14:04
text
Android Studio SQLite 数据库增删改查简单（代码参考）

一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ... [详细]

蜡笔小新 2024-11-14 11:01:49
text
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
utf-8
python并发打开网页_python并发_线程

关于进程的复习：#管道#数据的共享Managerdictlist#进程池#cpu个数1#retmap(func,iterable)#异步自带close和join#所有 ... [详细]

蜡笔小新 2024-11-17 13:24:48
text
Spring Boot + RabbitMQ 消息确认机制详解

本文详细介绍如何在 Spring Boot 项目中使用 RabbitMQ 的消息确认机制，包括消息发送确认和消息接收确认，帮助开发者解决在实际操作中可能遇到的问题。 ... [详细]

蜡笔小新 2024-11-16 20:54:38
include
探讨C语言代码的可重用性

本文将深入探讨C语言代码的可重用性，解释其重要性和实现方法。通过具体示例，我们将展示如何通过封装和模块化设计提高代码的可重用性。 ... [详细]

蜡笔小新 2024-11-16 19:59:45
include
开发笔记:1035 Password (20)

开发笔记:1035 Password (20) ... [详细]

蜡笔小新 2024-11-16 19:33:06
text
web页面报表js下载,web报表软件

web页面报表js下载,web报表软件 ... [详细]

蜡笔小新 2024-11-16 18:37:21
text
使用 Mui.js 获取复选框值的方法

本文介绍如何使用 Mui.js 框架来获取复选框的值，并通过数组进行处理和展示。 ... [详细]

蜡笔小新 2024-11-16 11:40:37
text
短视频app源码，Android开发底部滑出菜单

短视频app源码，Android开发底部滑出菜单首先依赖三方库implementationandroidx.appcompat:appcompat:1.2.0im ... [详细]

蜡笔小新 2024-11-15 15:35:01
text
使用Python爬取妙笔阁小说信息并保存为TXT和CSV格式

本文介绍了如何使用Python爬取妙笔阁小说网仙侠系列中所有小说的信息，并将其保存为TXT和CSV格式。主要内容包括如何构造请求头以避免被网站封禁，以及如何利用XPath解析HTML并提取所需信息。 ... [详细]

蜡笔小新 2024-11-14 19:54:58

随遇而安gqS1

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章