当前位置: 开发笔记 > 编程语言 > 正文

在Elixir中枚举一个字符串

作者：三封酒可_894 | 来源：互联网 | 2023-08-01 10:08

在Elixir中，如果我有一个字符串，例如José1Jose?2，我该如何枚举它？如果我尝试使用Enum或for

在 Elixir 中，如果我有一个字符串，例如"José1 Jose?2"，我该如何枚举它？如果我尝试使用Enum或for理解，我会收到以下错误：

** (Protocol.UndefinedError) 协议 Enumerable 未为 BitString 类型的“José1 Jose?2”实现

回答

Elixir 中的字符串是 UTF-8 编码的二进制文件。如果你想枚举一个二进制，它只是一个字节的集合，你需要指定如何。

String.graphemes/1- 这将为您提供一个字符串列表，其中每个字符串包含一个单独的 Unicode 字素。如果您想要每个“字符”，这可能最接近您的意思。

iex> String.graphemes("José1 Jose?2") ["J", "o", "s", "é", "1", " ", "J", "o", "s", "e?", "2"]

String.codepoints/1- 这将为您提供按 Unicode 代码点分解的字符串列表。请注意，Unicode 代码点不一定会转换为人类可读的字符。

iex> String.codepoints("José1 Jose?2") ["J", "o", "s", "é", "1", " ", "J", "o", "s", "e", "?", "2"]

你可以看到，第一和第二é 字形在Unicode代码点的不同方面代表。第一个是LATIN SMALL LETTER E WITH ACUTE (U+00E9)，而第二个被LATIN SMALL LETTER E (U+0065)后跟COMBINING ACUTE ACCENT (U+0301)。

这就是为什么您不能简单地枚举字符串的原因，因为在处理 Unicode 时，您必须指定您是否对字素、代码点或其他东西感兴趣。

String.to_charlist/1- 为您提供字符串的数字 Unicode 代码点列表。这可用于与使用此格式的 Erlang 库进行交互。

iex> String.to_charlist("José1 Jose?2") [74, 111, 115, 233, 49, 32, 74, 111, 115, 101, 769, 50]

:binary.bin_to_list/1 - 如果您只想枚举字节。

iex> :binary.bin_to_list("José1 Jose?2") [74, 111, 115, 195, 169, 49, 32, 74, 111, 115, 101, 204, 129, 50]

获得列表后，您可以使用推导式或Enum模块中的任何函数枚举它：

iex> for c <- String.graphemes("José1 Jose?2"), into: "", do: c <> c "JJoosséé11 JJoosse?e?22" iex> "José1 Jose?2" |> String.graphemes() |> Enum.join("|") "J|o|s|é|1| |J|o|s|e?|2"

也可以使用内涵与位串发电机列举字节和代码点（但不是字形）。

相当于:binary.bin_to_list/1：

iex> for <>, do: byte [74, 111, 115, 195, 169, 49, 32, 74, 111, 115, 101, 204, 129, 50]

等价于String.to_charlist/1，通过指定二进制文件的类型是utf8：

iex> for <>, do: cp [74, 111, 115, 233, 49, 32, 74, 111, 115, 101, 769, 50]

等效于String.codepoints/1，通过指定二进制文件的类型为utf8，并将生成的代码点转换回 UTF-8 二进制文件：

iex> for <>, do: <> ["J", "o", "s", "é", "1", " ", "J", "o", "s", "e", "?", "2"]

PS 要进一步阅读有关字符编码的信息，这篇 2003 年的博客文章非常棒：每个软件开发人员绝对、肯定必须了解 Unicode 和字符集的绝对最低要求（没有借口！）。

推荐阅读

bit
如何将TS文件转换为M3U8直播流：HLS与M3U8格式详解

在视频传输领域，MP4虽然常见，但在直播场景中直接使用MP4格式存在诸多问题。例如，MP4文件的头部信息（如ftyp、moov）较大，导致初始加载时间较长，影响用户体验。相比之下，HLS（HTTP Live Streaming）协议及其M3U8格式更具优势。HLS通过将视频切分成多个小片段，并生成一个M3U8播放列表文件，实现低延迟和高稳定性。本文详细介绍了如何将TS文件转换为M3U8直播流，包括技术原理和具体操作步骤，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 12:12:04
bit
深入理解ASCII、ANSI、GB2312、UNICODE及UTF-8、UTF-16编码

本文回顾了作者初次接触Unicode编码时的经历，并详细探讨了ASCII、ANSI、GB2312、UNICODE以及UTF-8和UTF-16编码的区别和应用场景。通过实例分析，帮助读者更好地理解和使用这些编码。 ... [详细]

蜡笔小新 2024-11-13 07:33:27
import
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
instance
WinMain 函数详解及示例

本文详细介绍了 WinMain 函数的参数及其用途，并提供了一个具体的示例代码来解析 WinMain 函数的实现。 ... [详细]

蜡笔小新 2024-11-13 12:49:31
instance
macOS 上 Visual Studio Code 的安装与配置指南

Visual Studio Code (VSCode) 是一款功能强大的源代码编辑器，支持多种编程语言，具备丰富的扩展生态。本文将详细介绍如何在 macOS 上安装、配置并使用 VSCode。 ... [详细]

蜡笔小新 2024-11-12 19:45:55
get
oracle c3p0 dword 60,web_day10 dbcp c3p0 dbutils

createdatabasemydbcharactersetutf8;alertdatabasemydbcharactersetutf8;1.自定义连接池为了不去经常创建连接和释放 ... [详细]

蜡笔小新 2024-11-12 19:26:15
import
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
replace
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
import
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
process
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11
replace
2022年7月20日：关键数据与市场动态分析

2022年7月20日，本文对当日的关键数据和市场动态进行了深入分析。主要内容包括：1. 关键数据的解读与趋势分析；2. 市场动态的变化及其对投资策略的影响；3. 相关经济指标的评估。通过这些分析，帮助读者更好地理解当前市场环境，为决策提供参考。 ... [详细]

蜡笔小新 2024-11-11 23:45:20
bit
MySQL Decimal 类型的最大值解析及其在数据处理中的应用艺术

在关系型数据库中，表的设计与SQL语句的编写对性能的影响至关重要，甚至可占到90%以上。本文将重点探讨MySQL中Decimal类型的最大值及其在数据处理中的应用技巧，通过实例分析和优化建议，帮助读者深入理解并掌握这一重要知识点。 ... [详细]

蜡笔小新 2024-11-11 19:36:19
get
开发日志：高效图片压缩与上传技术解析

开发日志：高效图片压缩与上传技术解析 ... [详细]

蜡笔小新 2024-11-11 19:33:51
get
2.2 组件间父子通信机制详解

2.2 组件间父子通信机制详解 ... [详细]

蜡笔小新 2024-11-11 14:58:09
replace
Python 字符串处理全解：常用操作与技巧汇总

本文全面解析了 Python 中字符串处理的常用操作与技巧。首先介绍了如何通过 `s.strip()`, `s.lstrip()` 和 `s.rstrip()` 方法去除字符串中的空格和特殊符号。接着，详细讲解了字符串复制的方法，包括使用 `sStr1 = sStr2` 进行简单的赋值复制。此外，还探讨了字符串连接、分割、替换等高级操作，并提供了丰富的示例代码，帮助读者深入理解和掌握这些实用技巧。 ... [详细]

蜡笔小新 2024-11-10 09:01:29

三封酒可_894

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章