这“⼀⼝”和那“一口”有什么不同,关于unicode一个小知识

虽然这“⼀⼝”和那“一口”大体是相似的,不过仔细一点儿看就会发现它们的字体并不相同(如果字体支持的不够的话,很有可能这“⼀⼝”还会显示不出来)。这里,如果把文字拷贝到代码中获取一下他们的unicode编码,就会发现,这“⼀⼝”对应的是\u2f00\u2f1d,而那“一口”对应的是\u4e00\u53e3

为什么这两口会有这样的差别呢,其实谨慎的说,这“⼀⼝”并不是汉字,而是汉字的部首,在unicode的标准中有一个专门的分类来标识部首,叫做“KANGXI RADICAL”。在这里看到“部首”不需要惊慌,打开家里的《新华字典》翻到部首检字表,那个部首的列表,就是我们这里说到的unicode的部首的列表,可能在总数上略微有些差别,但是大体的意思是没问题的。在unicode中,康熙部首(KANGXI RADICAL)总共有214个,编码范围是从U+2F00到U+2FD5,内容是根据《康熙字典》来定义的,具体可以参考维基百科的康熙字体词条。而我们一般所用的汉字,在unicode中是在主要是指CJK Unified Ideographs,主要的范围是从U+4E00到U+9FFF,当然还包括很多扩展范围,具体可以也可以看到维基百科的对应词条

以上就是这“⼀⼝”和那“一口”的区别,但是除了区别之外,这“⼀⼝”和那“一口”还是有联系的,这个联系就是unicode的正规化。unicode正规化根据每一个字的具体的含义,把一些相同字的不同变形都对应到了同一个字符上,这样就可以方便一些本来应该是同一个字的不同字符的比较。unicode正规化也会分为几种类型,分别是NFC,NFKC,NFD,NFKD,这些类型的命名中NF就是normal form的缩写,C(Canonical)表示是规范的,K(Compitable)表示兼容的,也就是一些相对通用但是并非标准的也可以涵盖,D(Decomposition)表示分解,比如㉂(U+3242)这个字符的NFKD就是"(自)",从一个字符变成了三个字符。那么现在就可以说回这“⼀⼝”和那“一口”了,如果把这“⼀⼝”转换成而来NFKC或者NFKD的形式,就会成为那“一口”。在一些汉字处理的操作中,因为这“⼀⼝”可能字体的支持没有那么好,把文章整体处理成那“一口”,也是一种保障体验的方法。

下面把全部的KANGXI RADICAL的unicode字符以及该字符所对应的不同的正规化的形式,都列在了下面的表格上

Radical Unicode NFC NFKC NFD NFKD
U+2F00 ⼀ (U+2F00) 一 (U+4E00) ⼀ (U+2F00) 一 (U+4E00)
U+2F01 ⼁ (U+2F01) 丨 (U+4E28) ⼁ (U+2F01) 丨 (U+4E28)
U+2F02 ⼂ (U+2F02) 丶 (U+4E36) ⼂ (U+2F02) 丶 (U+4E36)
U+2F03 ⼃ (U+2F03) 丿 (U+4E3F) ⼃ (U+2F03) 丿 (U+4E3F)
U+2F04 ⼄ (U+2F04) 乙 (U+4E59) ⼄ (U+2F04) 乙 (U+4E59)
U+2F05 ⼅ (U+2F05) 亅 (U+4E85) ⼅ (U+2F05) 亅 (U+4E85)
U+2F06 ⼆ (U+2F06) 二 (U+4E8C) ⼆ (U+2F06) 二 (U+4E8C)
U+2F07 ⼇ (U+2F07) 亠 (U+4EA0) ⼇ (U+2F07) 亠 (U+4EA0)
U+2F08 ⼈ (U+2F08) 人 (U+4EBA) ⼈ (U+2F08) 人 (U+4EBA)
U+2F09 ⼉ (U+2F09) 儿 (U+513F) ⼉ (U+2F09) 儿 (U+513F)
U+2F0A ⼊ (U+2F0A) 入 (U+5165) ⼊ (U+2F0A) 入 (U+5165)
U+2F0B ⼋ (U+2F0B) 八 (U+516B) ⼋ (U+2F0B) 八 (U+516B)
U+2F0C ⼌ (U+2F0C) 冂 (U+5182) ⼌ (U+2F0C) 冂 (U+5182)
U+2F0D ⼍ (U+2F0D) 冖 (U+5196) ⼍ (U+2F0D) 冖 (U+5196)
U+2F0E ⼎ (U+2F0E) 冫 (U+51AB) ⼎ (U+2F0E) 冫 (U+51AB)
U+2F0F ⼏ (U+2F0F) 几 (U+51E0) ⼏ (U+2F0F) 几 (U+51E0)
U+2F10 ⼐ (U+2F10) 凵 (U+51F5) ⼐ (U+2F10) 凵 (U+51F5)
U+2F11 ⼑ (U+2F11) 刀 (U+5200) ⼑ (U+2F11) 刀 (U+5200)
U+2F12 ⼒ (U+2F12) 力 (U+529B) ⼒ (U+2F12) 力 (U+529B)
U+2F13 ⼓ (U+2F13) 勹 (U+52F9) ⼓ (U+2F13) 勹 (U+52F9)
U+2F14 ⼔ (U+2F14) 匕 (U+5315) ⼔ (U+2F14) 匕 (U+5315)
U+2F15 ⼕ (U+2F15) 匚 (U+531A) ⼕ (U+2F15) 匚 (U+531A)
U+2F16 ⼖ (U+2F16) 匸 (U+5338) ⼖ (U+2F16) 匸 (U+5338)
U+2F17 ⼗ (U+2F17) 十 (U+5341) ⼗ (U+2F17) 十 (U+5341)
U+2F18 ⼘ (U+2F18) 卜 (U+535C) ⼘ (U+2F18) 卜 (U+535C)
U+2F19 ⼙ (U+2F19) 卩 (U+5369) ⼙ (U+2F19) 卩 (U+5369)
U+2F1A ⼚ (U+2F1A) 厂 (U+5382) ⼚ (U+2F1A) 厂 (U+5382)
U+2F1B ⼛ (U+2F1B) 厶 (U+53B6) ⼛ (U+2F1B) 厶 (U+53B6)
U+2F1C ⼜ (U+2F1C) 又 (U+53C8) ⼜ (U+2F1C) 又 (U+53C8)
U+2F1D ⼝ (U+2F1D) 口 (U+53E3) ⼝ (U+2F1D) 口 (U+53E3)
U+2F1E ⼞ (U+2F1E) 囗 (U+56D7) ⼞ (U+2F1E) 囗 (U+56D7)
U+2F1F ⼟ (U+2F1F) 土 (U+571F) ⼟ (U+2F1F) 土 (U+571F)
U+2F20 ⼠ (U+2F20) 士 (U+58EB) ⼠ (U+2F20) 士 (U+58EB)
U+2F21 ⼡ (U+2F21) 夂 (U+5902) ⼡ (U+2F21) 夂 (U+5902)
U+2F22 ⼢ (U+2F22) 夊 (U+590A) ⼢ (U+2F22) 夊 (U+590A)
U+2F23 ⼣ (U+2F23) 夕 (U+5915) ⼣ (U+2F23) 夕 (U+5915)
U+2F24 ⼤ (U+2F24) 大 (U+5927) ⼤ (U+2F24) 大 (U+5927)
U+2F25 ⼥ (U+2F25) 女 (U+5973) ⼥ (U+2F25) 女 (U+5973)
U+2F26 ⼦ (U+2F26) 子 (U+5B50) ⼦ (U+2F26) 子 (U+5B50)
U+2F27 ⼧ (U+2F27) 宀 (U+5B80) ⼧ (U+2F27) 宀 (U+5B80)
U+2F28 ⼨ (U+2F28) 寸 (U+5BF8) ⼨ (U+2F28) 寸 (U+5BF8)
U+2F29 ⼩ (U+2F29) 小 (U+5C0F) ⼩ (U+2F29) 小 (U+5C0F)
U+2F2A ⼪ (U+2F2A) 尢 (U+5C22) ⼪ (U+2F2A) 尢 (U+5C22)
U+2F2B ⼫ (U+2F2B) 尸 (U+5C38) ⼫ (U+2F2B) 尸 (U+5C38)
U+2F2C ⼬ (U+2F2C) 屮 (U+5C6E) ⼬ (U+2F2C) 屮 (U+5C6E)
U+2F2D ⼭ (U+2F2D) 山 (U+5C71) ⼭ (U+2F2D) 山 (U+5C71)
U+2F2E ⼮ (U+2F2E) 巛 (U+5DDB) ⼮ (U+2F2E) 巛 (U+5DDB)
U+2F2F ⼯ (U+2F2F) 工 (U+5DE5) ⼯ (U+2F2F) 工 (U+5DE5)
U+2F30 ⼰ (U+2F30) 己 (U+5DF1) ⼰ (U+2F30) 己 (U+5DF1)
U+2F31 ⼱ (U+2F31) 巾 (U+5DFE) ⼱ (U+2F31) 巾 (U+5DFE)
U+2F32 ⼲ (U+2F32) 干 (U+5E72) ⼲ (U+2F32) 干 (U+5E72)
U+2F33 ⼳ (U+2F33) 幺 (U+5E7A) ⼳ (U+2F33) 幺 (U+5E7A)
U+2F34 ⼴ (U+2F34) 广 (U+5E7F) ⼴ (U+2F34) 广 (U+5E7F)
U+2F35 ⼵ (U+2F35) 廴 (U+5EF4) ⼵ (U+2F35) 廴 (U+5EF4)
U+2F36 ⼶ (U+2F36) 廾 (U+5EFE) ⼶ (U+2F36) 廾 (U+5EFE)
U+2F37 ⼷ (U+2F37) 弋 (U+5F0B) ⼷ (U+2F37) 弋 (U+5F0B)
U+2F38 ⼸ (U+2F38) 弓 (U+5F13) ⼸ (U+2F38) 弓 (U+5F13)
U+2F39 ⼹ (U+2F39) 彐 (U+5F50) ⼹ (U+2F39) 彐 (U+5F50)
U+2F3A ⼺ (U+2F3A) 彡 (U+5F61) ⼺ (U+2F3A) 彡 (U+5F61)
U+2F3B ⼻ (U+2F3B) 彳 (U+5F73) ⼻ (U+2F3B) 彳 (U+5F73)
U+2F3C ⼼ (U+2F3C) 心 (U+5FC3) ⼼ (U+2F3C) 心 (U+5FC3)
U+2F3D ⼽ (U+2F3D) 戈 (U+6208) ⼽ (U+2F3D) 戈 (U+6208)
U+2F3E ⼾ (U+2F3E) 戶 (U+6236) ⼾ (U+2F3E) 戶 (U+6236)
⼿ U+2F3F ⼿ (U+2F3F) 手 (U+624B) ⼿ (U+2F3F) 手 (U+624B)
U+2F40 ⽀ (U+2F40) 支 (U+652F) ⽀ (U+2F40) 支 (U+652F)
U+2F41 ⽁ (U+2F41) 攴 (U+6534) ⽁ (U+2F41) 攴 (U+6534)
U+2F42 ⽂ (U+2F42) 文 (U+6587) ⽂ (U+2F42) 文 (U+6587)
U+2F43 ⽃ (U+2F43) 斗 (U+6597) ⽃ (U+2F43) 斗 (U+6597)
U+2F44 ⽄ (U+2F44) 斤 (U+65A4) ⽄ (U+2F44) 斤 (U+65A4)
U+2F45 ⽅ (U+2F45) 方 (U+65B9) ⽅ (U+2F45) 方 (U+65B9)
U+2F46 ⽆ (U+2F46) 无 (U+65E0) ⽆ (U+2F46) 无 (U+65E0)
U+2F47 ⽇ (U+2F47) 日 (U+65E5) ⽇ (U+2F47) 日 (U+65E5)
U+2F48 ⽈ (U+2F48) 曰 (U+66F0) ⽈ (U+2F48) 曰 (U+66F0)
U+2F49 ⽉ (U+2F49) 月 (U+6708) ⽉ (U+2F49) 月 (U+6708)
U+2F4A ⽊ (U+2F4A) 木 (U+6728) ⽊ (U+2F4A) 木 (U+6728)
U+2F4B ⽋ (U+2F4B) 欠 (U+6B20) ⽋ (U+2F4B) 欠 (U+6B20)
U+2F4C ⽌ (U+2F4C) 止 (U+6B62) ⽌ (U+2F4C) 止 (U+6B62)
U+2F4D ⽍ (U+2F4D) 歹 (U+6B79) ⽍ (U+2F4D) 歹 (U+6B79)
U+2F4E ⽎ (U+2F4E) 殳 (U+6BB3) ⽎ (U+2F4E) 殳 (U+6BB3)
U+2F4F ⽏ (U+2F4F) 毋 (U+6BCB) ⽏ (U+2F4F) 毋 (U+6BCB)
U+2F50 ⽐ (U+2F50) 比 (U+6BD4) ⽐ (U+2F50) 比 (U+6BD4)
U+2F51 ⽑ (U+2F51) 毛 (U+6BDB) ⽑ (U+2F51) 毛 (U+6BDB)
U+2F52 ⽒ (U+2F52) 氏 (U+6C0F) ⽒ (U+2F52) 氏 (U+6C0F)
U+2F53 ⽓ (U+2F53) 气 (U+6C14) ⽓ (U+2F53) 气 (U+6C14)
U+2F54 ⽔ (U+2F54) 水 (U+6C34) ⽔ (U+2F54) 水 (U+6C34)
U+2F55 ⽕ (U+2F55) 火 (U+706B) ⽕ (U+2F55) 火 (U+706B)
U+2F56 ⽖ (U+2F56) 爪 (U+722A) ⽖ (U+2F56) 爪 (U+722A)
U+2F57 ⽗ (U+2F57) 父 (U+7236) ⽗ (U+2F57) 父 (U+7236)
U+2F58 ⽘ (U+2F58) 爻 (U+723B) ⽘ (U+2F58) 爻 (U+723B)
U+2F59 ⽙ (U+2F59) 爿 (U+723F) ⽙ (U+2F59) 爿 (U+723F)
U+2F5A ⽚ (U+2F5A) 片 (U+7247) ⽚ (U+2F5A) 片 (U+7247)
U+2F5B ⽛ (U+2F5B) 牙 (U+7259) ⽛ (U+2F5B) 牙 (U+7259)
U+2F5C ⽜ (U+2F5C) 牛 (U+725B) ⽜ (U+2F5C) 牛 (U+725B)
U+2F5D ⽝ (U+2F5D) 犬 (U+72AC) ⽝ (U+2F5D) 犬 (U+72AC)
U+2F5E ⽞ (U+2F5E) 玄 (U+7384) ⽞ (U+2F5E) 玄 (U+7384)
U+2F5F ⽟ (U+2F5F) 玉 (U+7389) ⽟ (U+2F5F) 玉 (U+7389)
U+2F60 ⽠ (U+2F60) 瓜 (U+74DC) ⽠ (U+2F60) 瓜 (U+74DC)
U+2F61 ⽡ (U+2F61) 瓦 (U+74E6) ⽡ (U+2F61) 瓦 (U+74E6)
U+2F62 ⽢ (U+2F62) 甘 (U+7518) ⽢ (U+2F62) 甘 (U+7518)
U+2F63 ⽣ (U+2F63) 生 (U+751F) ⽣ (U+2F63) 生 (U+751F)
U+2F64 ⽤ (U+2F64) 用 (U+7528) ⽤ (U+2F64) 用 (U+7528)
U+2F65 ⽥ (U+2F65) 田 (U+7530) ⽥ (U+2F65) 田 (U+7530)
U+2F66 ⽦ (U+2F66) 疋 (U+758B) ⽦ (U+2F66) 疋 (U+758B)
U+2F67 ⽧ (U+2F67) 疒 (U+7592) ⽧ (U+2F67) 疒 (U+7592)
U+2F68 ⽨ (U+2F68) 癶 (U+7676) ⽨ (U+2F68) 癶 (U+7676)
U+2F69 ⽩ (U+2F69) 白 (U+767D) ⽩ (U+2F69) 白 (U+767D)
U+2F6A ⽪ (U+2F6A) 皮 (U+76AE) ⽪ (U+2F6A) 皮 (U+76AE)
U+2F6B ⽫ (U+2F6B) 皿 (U+76BF) ⽫ (U+2F6B) 皿 (U+76BF)
U+2F6C ⽬ (U+2F6C) 目 (U+76EE) ⽬ (U+2F6C) 目 (U+76EE)
U+2F6D ⽭ (U+2F6D) 矛 (U+77DB) ⽭ (U+2F6D) 矛 (U+77DB)
U+2F6E ⽮ (U+2F6E) 矢 (U+77E2) ⽮ (U+2F6E) 矢 (U+77E2)
U+2F6F ⽯ (U+2F6F) 石 (U+77F3) ⽯ (U+2F6F) 石 (U+77F3)
U+2F70 ⽰ (U+2F70) 示 (U+793A) ⽰ (U+2F70) 示 (U+793A)
U+2F71 ⽱ (U+2F71) 禸 (U+79B8) ⽱ (U+2F71) 禸 (U+79B8)
U+2F72 ⽲ (U+2F72) 禾 (U+79BE) ⽲ (U+2F72) 禾 (U+79BE)
U+2F73 ⽳ (U+2F73) 穴 (U+7A74) ⽳ (U+2F73) 穴 (U+7A74)
U+2F74 ⽴ (U+2F74) 立 (U+7ACB) ⽴ (U+2F74) 立 (U+7ACB)
U+2F75 ⽵ (U+2F75) 竹 (U+7AF9) ⽵ (U+2F75) 竹 (U+7AF9)
U+2F76 ⽶ (U+2F76) 米 (U+7C73) ⽶ (U+2F76) 米 (U+7C73)
U+2F77 ⽷ (U+2F77) 糸 (U+7CF8) ⽷ (U+2F77) 糸 (U+7CF8)
U+2F78 ⽸ (U+2F78) 缶 (U+7F36) ⽸ (U+2F78) 缶 (U+7F36)
U+2F79 ⽹ (U+2F79) 网 (U+7F51) ⽹ (U+2F79) 网 (U+7F51)
U+2F7A ⽺ (U+2F7A) 羊 (U+7F8A) ⽺ (U+2F7A) 羊 (U+7F8A)
U+2F7B ⽻ (U+2F7B) 羽 (U+7FBD) ⽻ (U+2F7B) 羽 (U+7FBD)
U+2F7C ⽼ (U+2F7C) 老 (U+8001) ⽼ (U+2F7C) 老 (U+8001)
U+2F7D ⽽ (U+2F7D) 而 (U+800C) ⽽ (U+2F7D) 而 (U+800C)
U+2F7E ⽾ (U+2F7E) 耒 (U+8012) ⽾ (U+2F7E) 耒 (U+8012)
⽿ U+2F7F ⽿ (U+2F7F) 耳 (U+8033) ⽿ (U+2F7F) 耳 (U+8033)
U+2F80 ⾀ (U+2F80) 聿 (U+807F) ⾀ (U+2F80) 聿 (U+807F)
U+2F81 ⾁ (U+2F81) 肉 (U+8089) ⾁ (U+2F81) 肉 (U+8089)
U+2F82 ⾂ (U+2F82) 臣 (U+81E3) ⾂ (U+2F82) 臣 (U+81E3)
U+2F83 ⾃ (U+2F83) 自 (U+81EA) ⾃ (U+2F83) 自 (U+81EA)
U+2F84 ⾄ (U+2F84) 至 (U+81F3) ⾄ (U+2F84) 至 (U+81F3)
U+2F85 ⾅ (U+2F85) 臼 (U+81FC) ⾅ (U+2F85) 臼 (U+81FC)
U+2F86 ⾆ (U+2F86) 舌 (U+820C) ⾆ (U+2F86) 舌 (U+820C)
U+2F87 ⾇ (U+2F87) 舛 (U+821B) ⾇ (U+2F87) 舛 (U+821B)
U+2F88 ⾈ (U+2F88) 舟 (U+821F) ⾈ (U+2F88) 舟 (U+821F)
U+2F89 ⾉ (U+2F89) 艮 (U+826E) ⾉ (U+2F89) 艮 (U+826E)
U+2F8A ⾊ (U+2F8A) 色 (U+8272) ⾊ (U+2F8A) 色 (U+8272)
U+2F8B ⾋ (U+2F8B) 艸 (U+8278) ⾋ (U+2F8B) 艸 (U+8278)
U+2F8C ⾌ (U+2F8C) 虍 (U+864D) ⾌ (U+2F8C) 虍 (U+864D)
U+2F8D ⾍ (U+2F8D) 虫 (U+866B) ⾍ (U+2F8D) 虫 (U+866B)
U+2F8E ⾎ (U+2F8E) 血 (U+8840) ⾎ (U+2F8E) 血 (U+8840)
U+2F8F ⾏ (U+2F8F) 行 (U+884C) ⾏ (U+2F8F) 行 (U+884C)
U+2F90 ⾐ (U+2F90) 衣 (U+8863) ⾐ (U+2F90) 衣 (U+8863)
U+2F91 ⾑ (U+2F91) 襾 (U+897E) ⾑ (U+2F91) 襾 (U+897E)
U+2F92 ⾒ (U+2F92) 見 (U+898B) ⾒ (U+2F92) 見 (U+898B)
U+2F93 ⾓ (U+2F93) 角 (U+89D2) ⾓ (U+2F93) 角 (U+89D2)
U+2F94 ⾔ (U+2F94) 言 (U+8A00) ⾔ (U+2F94) 言 (U+8A00)
U+2F95 ⾕ (U+2F95) 谷 (U+8C37) ⾕ (U+2F95) 谷 (U+8C37)
U+2F96 ⾖ (U+2F96) 豆 (U+8C46) ⾖ (U+2F96) 豆 (U+8C46)
U+2F97 ⾗ (U+2F97) 豕 (U+8C55) ⾗ (U+2F97) 豕 (U+8C55)
U+2F98 ⾘ (U+2F98) 豸 (U+8C78) ⾘ (U+2F98) 豸 (U+8C78)
U+2F99 ⾙ (U+2F99) 貝 (U+8C9D) ⾙ (U+2F99) 貝 (U+8C9D)
U+2F9A ⾚ (U+2F9A) 赤 (U+8D64) ⾚ (U+2F9A) 赤 (U+8D64)
U+2F9B ⾛ (U+2F9B) 走 (U+8D70) ⾛ (U+2F9B) 走 (U+8D70)
U+2F9C ⾜ (U+2F9C) 足 (U+8DB3) ⾜ (U+2F9C) 足 (U+8DB3)
U+2F9D ⾝ (U+2F9D) 身 (U+8EAB) ⾝ (U+2F9D) 身 (U+8EAB)
U+2F9E ⾞ (U+2F9E) 車 (U+8ECA) ⾞ (U+2F9E) 車 (U+8ECA)
U+2F9F ⾟ (U+2F9F) 辛 (U+8F9B) ⾟ (U+2F9F) 辛 (U+8F9B)
U+2FA0 ⾠ (U+2FA0) 辰 (U+8FB0) ⾠ (U+2FA0) 辰 (U+8FB0)
U+2FA1 ⾡ (U+2FA1) 辵 (U+8FB5) ⾡ (U+2FA1) 辵 (U+8FB5)
U+2FA2 ⾢ (U+2FA2) 邑 (U+9091) ⾢ (U+2FA2) 邑 (U+9091)
U+2FA3 ⾣ (U+2FA3) 酉 (U+9149) ⾣ (U+2FA3) 酉 (U+9149)
U+2FA4 ⾤ (U+2FA4) 釆 (U+91C6) ⾤ (U+2FA4) 釆 (U+91C6)
U+2FA5 ⾥ (U+2FA5) 里 (U+91CC) ⾥ (U+2FA5) 里 (U+91CC)
U+2FA6 ⾦ (U+2FA6) 金 (U+91D1) ⾦ (U+2FA6) 金 (U+91D1)
U+2FA7 ⾧ (U+2FA7) 長 (U+9577) ⾧ (U+2FA7) 長 (U+9577)
U+2FA8 ⾨ (U+2FA8) 門 (U+9580) ⾨ (U+2FA8) 門 (U+9580)
U+2FA9 ⾩ (U+2FA9) 阜 (U+961C) ⾩ (U+2FA9) 阜 (U+961C)
U+2FAA ⾪ (U+2FAA) 隶 (U+96B6) ⾪ (U+2FAA) 隶 (U+96B6)
U+2FAB ⾫ (U+2FAB) 隹 (U+96B9) ⾫ (U+2FAB) 隹 (U+96B9)
U+2FAC ⾬ (U+2FAC) 雨 (U+96E8) ⾬ (U+2FAC) 雨 (U+96E8)
U+2FAD ⾭ (U+2FAD) 靑 (U+9751) ⾭ (U+2FAD) 靑 (U+9751)
U+2FAE ⾮ (U+2FAE) 非 (U+975E) ⾮ (U+2FAE) 非 (U+975E)
U+2FAF ⾯ (U+2FAF) 面 (U+9762) ⾯ (U+2FAF) 面 (U+9762)
U+2FB0 ⾰ (U+2FB0) 革 (U+9769) ⾰ (U+2FB0) 革 (U+9769)
U+2FB1 ⾱ (U+2FB1) 韋 (U+97CB) ⾱ (U+2FB1) 韋 (U+97CB)
U+2FB2 ⾲ (U+2FB2) 韭 (U+97ED) ⾲ (U+2FB2) 韭 (U+97ED)
U+2FB3 ⾳ (U+2FB3) 音 (U+97F3) ⾳ (U+2FB3) 音 (U+97F3)
U+2FB4 ⾴ (U+2FB4) 頁 (U+9801) ⾴ (U+2FB4) 頁 (U+9801)
U+2FB5 ⾵ (U+2FB5) 風 (U+98A8) ⾵ (U+2FB5) 風 (U+98A8)
U+2FB6 ⾶ (U+2FB6) 飛 (U+98DB) ⾶ (U+2FB6) 飛 (U+98DB)
U+2FB7 ⾷ (U+2FB7) 食 (U+98DF) ⾷ (U+2FB7) 食 (U+98DF)
U+2FB8 ⾸ (U+2FB8) 首 (U+9996) ⾸ (U+2FB8) 首 (U+9996)
U+2FB9 ⾹ (U+2FB9) 香 (U+9999) ⾹ (U+2FB9) 香 (U+9999)
U+2FBA ⾺ (U+2FBA) 馬 (U+99AC) ⾺ (U+2FBA) 馬 (U+99AC)
U+2FBB ⾻ (U+2FBB) 骨 (U+9AA8) ⾻ (U+2FBB) 骨 (U+9AA8)
U+2FBC ⾼ (U+2FBC) 高 (U+9AD8) ⾼ (U+2FBC) 高 (U+9AD8)
U+2FBD ⾽ (U+2FBD) 髟 (U+9ADF) ⾽ (U+2FBD) 髟 (U+9ADF)
U+2FBE ⾾ (U+2FBE) 鬥 (U+9B25) ⾾ (U+2FBE) 鬥 (U+9B25)
⾿ U+2FBF ⾿ (U+2FBF) 鬯 (U+9B2F) ⾿ (U+2FBF) 鬯 (U+9B2F)
U+2FC0 ⿀ (U+2FC0) 鬲 (U+9B32) ⿀ (U+2FC0) 鬲 (U+9B32)
U+2FC1 ⿁ (U+2FC1) 鬼 (U+9B3C) ⿁ (U+2FC1) 鬼 (U+9B3C)
U+2FC2 ⿂ (U+2FC2) 魚 (U+9B5A) ⿂ (U+2FC2) 魚 (U+9B5A)
U+2FC3 ⿃ (U+2FC3) 鳥 (U+9CE5) ⿃ (U+2FC3) 鳥 (U+9CE5)
U+2FC4 ⿄ (U+2FC4) 鹵 (U+9E75) ⿄ (U+2FC4) 鹵 (U+9E75)
U+2FC5 ⿅ (U+2FC5) 鹿 (U+9E7F) ⿅ (U+2FC5) 鹿 (U+9E7F)
U+2FC6 ⿆ (U+2FC6) 麥 (U+9EA5) ⿆ (U+2FC6) 麥 (U+9EA5)
U+2FC7 ⿇ (U+2FC7) 麻 (U+9EBB) ⿇ (U+2FC7) 麻 (U+9EBB)
U+2FC8 ⿈ (U+2FC8) 黃 (U+9EC3) ⿈ (U+2FC8) 黃 (U+9EC3)
U+2FC9 ⿉ (U+2FC9) 黍 (U+9ECD) ⿉ (U+2FC9) 黍 (U+9ECD)
U+2FCA ⿊ (U+2FCA) 黑 (U+9ED1) ⿊ (U+2FCA) 黑 (U+9ED1)
U+2FCB ⿋ (U+2FCB) 黹 (U+9EF9) ⿋ (U+2FCB) 黹 (U+9EF9)
U+2FCC ⿌ (U+2FCC) 黽 (U+9EFD) ⿌ (U+2FCC) 黽 (U+9EFD)
U+2FCD ⿍ (U+2FCD) 鼎 (U+9F0E) ⿍ (U+2FCD) 鼎 (U+9F0E)
U+2FCE ⿎ (U+2FCE) 鼓 (U+9F13) ⿎ (U+2FCE) 鼓 (U+9F13)
U+2FCF ⿏ (U+2FCF) 鼠 (U+9F20) ⿏ (U+2FCF) 鼠 (U+9F20)
U+2FD0 ⿐ (U+2FD0) 鼻 (U+9F3B) ⿐ (U+2FD0) 鼻 (U+9F3B)
U+2FD1 ⿑ (U+2FD1) 齊 (U+9F4A) ⿑ (U+2FD1) 齊 (U+9F4A)
U+2FD2 ⿒ (U+2FD2) 齒 (U+9F52) ⿒ (U+2FD2) 齒 (U+9F52)
U+2FD3 ⿓ (U+2FD3) 龍 (U+9F8D) ⿓ (U+2FD3) 龍 (U+9F8D)
U+2FD4 ⿔ (U+2FD4) 龜 (U+9F9C) ⿔ (U+2FD4) 龜 (U+9F9C)
U+2FD5 ⿕ (U+2FD5) 龠 (U+9FA0) ⿕ (U+2FD5) 龠 (U+9FA0)

生成这个表格(.csv)的Python代码如下:

# -*- coding: utf-8 -*-
import csv
from unicodedata import normalize


def unicode_repr(ch):
    return 'U+%s' % hex(ord(ch))[-4:].upper()


def normalized_repr(form, ch):
    base = '%s (%s)'
    return base % (normalize(form, ch),
                   unicode_repr(normalize(form, ch))) 


def run(fileobj):
    writer = csv.writer(fileobj)
    writer.writerow(["Radical", "Unicode", "NFC", "NFKC", "NFD", "NFKD"])
    for x in range(ord('\u2f00'), ord('\u2fd6') + 1):
        ch = chr(x)
        row = [ch,
               unicode_repr(ch),
               normalized_repr('NFC', ch),
               normalized_repr('NFKC', ch),
               normalized_repr('NFD', ch),
               normalized_repr('NFKD', ch)]
        writer.writerow(row)

run(open('unicode_kangxi_radical.csv', 'w'))

猜你喜欢

转载自blog.csdn.net/gstianfu/article/details/84643320