Unicode 15.0 标准已发布,新增鹅、姜、驴、豌豆等 emoji

Unicode 标准 15.0 版现已推出,包括核心规范、附件和数据文件。这个版本增加了 4489 个字符,使总数达到 149186 个字符。这些新增内容包括两个新脚本,总共 161 个脚本。此外,该版本还有 20 个新的表情符号字符和 4193 个 CJK(中文、日文和韩文)表意文字。

15.0 版中的新脚本和字符增加了对现代语言组的支持,包括:

  • Nag Mundari,一种用于书写 Mundari 的现代文字,Mundari 是一种在印度使用的语言。
  • 一个卡纳达语字符,用于在印度书写 Konkani、Awadhi 和 Havyaka Kannada 。
  • 卡克托维克数字,由阿拉斯加卡克托维克的伊努皮亚克人设计,用于因纽特语和尤皮克语的计数系统

新增的 20 个新的表情符号(emoji),包括 鹅、长笛、折扇、姜、豌豆、粉色爱心、驴、水母等等。

有关新 emoji 字符的完整列表,请参阅 Unicode 15.0 的表情符号

Unicode 15.0 版本的其他符号和添加包括:

对语言和学术工作的支持包括:

  • Kawi,一种在东南亚发现的历史文字,用于书写古爪哇语和其他语言
  • 阿拉伯语脚本的三个附加字符以支持土耳其使用的古兰经标记
  • 在手写和印刷文件中发现三个 Khojki 字符
  • 十个梵文字符,用于表示铭文和手稿中的吉祥标志
  • 马拉雅拉姆语音译中使用的六个拉丁字母
  • 音标中使用的 63 个西里尔修饰字母

重要的图表字体更新包括:

  • 埃及象形文字的一组更新字形,以及标准化的变化序列以支持文本中的旋转字形
  • 改进了统一加拿大土著音节的字形,为运营商和其他语言提供更好的支持
  • 一种新的Wancho字体,具有改进和简化的形状

对 CJK (中日韩)块的更新添加:

  • 新的 CJK 统一表意文字扩展 H 块中的 4192 个表意文字
  • CJK 统一表意文字扩展 C 块中的一个表意文字

以下六个 Unicode 标准附件和技术标准在 15.0 版进行了更新(Unicode 属性和规范决定了文本在计算机和手机上的行为。):

  • UAX #9,Unicode 双向算法,修改了 UAX9-C2 中的注释,强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
  • UAX #31,Unicode 标识符和模式语法,为默认标识符的配置文件提供了更多指导,阐明了标识符中默认可忽略代码点的使用,并讨论了 Pattern_White_Space 和编程语言中的双向排序问题之间的关系。
  • UAX #38,Unicode Han 数据库,添加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别更改为字典索引,扩展 kKangXi 属性,并添加第 3.0、3.10 和 4.5 节。
  • UTS #39,Unicode 安全机制,将零宽度连接符 (ZWJ) 和零宽度非连接符 (ZWNJ) 字符从 Identifier_Status=Allowed 更改为 Identifier_Status=Restricted;因此,默认情况下,通用安全配置文件不再允许它们。
  • UAX #45,U-Source Ideographs,在其数据文件中记录了新的表意文字,添加了“ExtH”作为新状态,改进了现有 CJK 统一表意文字块的状态标识符,并添加了第 2.5 节。
  • UTS #46,Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况,并添加了有关新的 IDNA 派生属性数据文件的文档。

Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。

扫描二维码关注公众号,回复: 14514441 查看本文章

更多详情请查看发布公告

猜你喜欢

转载自www.oschina.net/news/210206/unicode-standard-version-15