UTF8とutf8mb4違い

I.はじめに

   MySQLの5.5.3は、ほとんどのバイト4は、互換性のある4バイトのユニコードになるように設計することを意味し、MB4のこのコードutf8mb4を追加した後。幸いutf8mb4のUTF8は、外側utf8mb4に変換を行う必要をコードしていないことに加えて、のスーパーセットです。もちろん、一般的には、スペースを節約するために、使用UTF8で十分です。

   第二に、コンテンツ記述

   これは、中国語の文字のほとんどを保存することがutf8では、なぜutf8mb4を使用しているためと言う?あなたは4バイト幅の文字が異常に挿入されますが発生した場合、元のMySQLのサポートUTF8文字は、3バイトの最大長をコードします。最大エネルギーをコードする3バイトのUnicode UTF-8文字はユニコード(BMP)で0xFFFFで、すなわち基本的な多平面です。これは、Unicodeの基本多言語テキスト面では、彼らは、MySQLに格納されたUTF8文字セットを使用することはできませんではない任意の文字です。絵文字式(絵文字は、IOSとAndroid携帯電話で一般的な、特別なUnicodeエンコーディングである)、そして多くは一般的に使用される漢字ではありません、ならびに任意の新しいUnicode文字など(UTF8の欠点)を含みます。

 

中国:1つの文字、2つのバイト

英語:文字、バイト

 

GBK:中国語サポート

ISO-8859-1:文字セットは、1バイト(中国語歪み)を格納することができます

おすすめ

転載: www.cnblogs.com/abo666/p/11529110.html