合字研究——看看藏文里面一共有多少个字吧

还记得我C#使用StringInfo正确查找字符个数_C#,unicode_黄腾霄的博客-CSDN博客这篇博客么?

你们以为2个Unicode组成的emoji就是极限了么?

这篇文章会带你们体验下世界语言的博大之组合字。


组合字就是说对于某些精妙的语言,多个单独可渲染的文字,放在一起后就会渲染成一个文字。

其中最著名的就是我们的藏文。下图是wiki上的说明,大致意思就是一个藏文基字可以通过加加加好多个字,变成还是一个字。

在这里插入图片描述
(图片来自wiki)
比如我们可以看到下面两个藏文Unicode的渲染是这样的

在这里插入图片描述

在这里插入图片描述

但是他们合并起来之后就变成这样了

在这里插入图片描述

同样对于སྒྲོ字符,你看着是一个字符,实际上它有4个Unicode编码。

在这里插入图片描述

那么问题来了,C#使用StringInfo正确查找字符个数_C#,unicode_黄腾霄的博客-CSDN博客博客中提到的SringInfo能不能正确识别藏文的显示字符数呢?

在这里插入图片描述

成功!!所以再也不用担心自己编写文字软件时,找不对这些文字的光标位置了。


参考文献:

2019-11-10-使用StringInfo正确查找字符个数 - huangtengxiao

藏文 - 维基百科,自由的百科全书

C#使用StringInfo正确查找字符个数_C#,unicode_黄腾霄的博客-CSDN博客


本文会经常更新,请阅读个人博客原文: https://xinyuehtx.github.io/ ,以避免陈旧错误知识的误导,同时有更好的阅读体验。

知识共享许可协议 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名黄腾霄(包含链接: https://xinyuehtx.github.io/ ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系

发布了100 篇原创文章 · 获赞 2 · 访问量 3909

猜你喜欢

转载自blog.csdn.net/htxhtx123/article/details/104439512
今日推荐