作者:西瓜凉皮大夏天 | 来源:互联网 | 2023-08-19 19:28
原文地址:TheUnicodeBlog:AnnouncingTheUnicode®Standard,Version15.0Unicode标准版本15.0现已推出,包括核心规范、附件
Unicode 标准版本 15.0 现已推出,包括核心规范、附件和数据文件。此版本增加了 4,489 个字符,使总数达到 149,186 个字符。这些新增功能包括两个新脚本(共 161 个脚本)、20 个新表情符号字符和 4,193 个 CJK(中文、日文和韩文)表意文字。V15.0 中的新脚本和字符增加了对现代语言组的支持,包括:
- 纳格蒙达里,一种现代文字,用于书写蒙达里语,一种在印度使用的语言
- 印度用于书写孔卡尼语、阿瓦迪语和哈维亚卡语卡纳达语的卡纳达语角色
- 卡克托维克数字,由阿拉斯加卡克托维克的伊努皮亚克语使用者为因纽特语和尤皮克语的计数系统设计
在流行的符号添加中有20个新的表情符号,包括头发选择,马拉卡斯,水母,khanda和粉红色的心。有关新表情符号字符的完整列表,请参阅 Unicode 15.0 的表情符号添加和表情符号计数。有关 Unicode 标准对表情符号字符支持的详细说明,请参阅 UTS #51,Unicode表情符号。
其他符号和符号添加包括:\
- 巴哈伊信仰成员使用的九颗白星
- 天体的八个符号,由天文学家和占星家使用
- 另外29个埃及象形文字格式控件,这将使埃及古物学家能够更好地表示文本
对其他语言和学术工作的支持包括:\
- Kawi是一种在东南亚发现的历史文字,用于书写古爪哇语和其他语言
- 阿拉伯文字的三个附加字符,以支持土耳其使用的古兰经标记
- 在手写和印刷文件中发现的三个霍吉字符
- 十个梵文字符,用于表示铭文和手稿中发现的吉祥标志
- 马拉雅拉姆语音译中使用的六个拉丁字母
- 音标中使用的 63 个西里尔修饰字母
重要的图表字体更新包括:
- 一组用于埃及象形文字的更新字形,以及标准化的变体序列,以支持文本中发现的旋转字形
- 改进了加拿大原住民统一音节的字形,为 Carrier 和其他语言提供了更好的支持
- 新的 Wancho 字体,具有改进和简化的形状
对 CJK 块的更新增加了:
- 新的 CJK 统一表意文字扩展 H 块增加了4192 个表意文字
- CJK 统一表意文字扩展 C 块中的一个表意文字
Unicode 属性和规范决定了计算机和手机上文本的行为。以下六个 Unicode 标准附件和技术标准对 15.0 版进行了值得注意的更新:\
- UAX #9(Unicode 双向算法)修改了 UAX9-C2 中的注释,以强调使用更高级别协议来缓解潜在的源代码欺骗攻击。
- UAX #31,Unicode 标识符和模式语法,提供了有关默认标识符配置文件的更多指导,阐明了标识符中默认可忽略代码点的使用,并讨论了编程语言中Pattern_White_Space和双向排序问题之间的关系。
- UAX #38, Unicode Han Database, 添加了 kAlternateTostrokes 属性。kCihaiT 属性的类别已更改为字典索引,kKangXi 属性已扩展,并添加了第 3.0、3.10 和 4.5 节。
- UTS #39,Unicode 安全机制,将零宽度连接器 (ZWJ) 和零宽度非连接器 (ZWNJ) 字符从Identifier_Status = 允许Identifier_Status = 受限;因此,默认情况下,常规安全配置文件不再允许使用它们。
- UAX #45,U-Source表意文字,在其数据文件中记录了新的表意文字,“ExtH”被添加为新状态,现有CJK统一表意文字块的状态标识符得到改进,并添加了第2.5节。
- UTS #46,Unicode IDNA 兼容性处理,阐明了 ToASCII 中空标签的边缘情况,并添加了有关新的 IDNA 派生属性数据文件的文档。
关于Unicode标准
Unicode 标准为所有现代软件和信息技术协议中任何语言的文本数据的处理、存储和无缝数据交换提供了基础。它为世界上所有语言提供了统一的通用架构和编码,目前编码了超过140,000个字符。
Unicode 是现代标准(如 XML、Java、C#、欧马脚本、通用语言脚本、CORBA 3.0、WML 等)所要求的,并且是实现 ISO/IEC 10646 的官方方法。它是所有现代软件的基本组成部分。
有关 Unicode 标准的更多信息,请访问 https://home.unicode.org/。