MySQL 照合順序 utf8mb4_0900_ai_ci

1. utf8mb4_0900_ai_ci とは何ですか?どのように理解すればよいでしょうか?

それは何ですか?

utf8mb4_0900_ai_cimysql8.0以降のデータベースのソートルール(照合)です。

どのように理解すればよいでしょうか?

  1. utf8mb4、この名前はおそらく多くの人に馴染みがあるでしょう。現在、️✈️♥️絵文字表現は広く使用されていますが、MySQL が登場する前の文字セットは utf8 (より正確な名前は utf8mb3 で、文字は保存に最大 3 バイトを使用します) であり、0x000 文字以内のエンコード値のみを保存できます。 0xFFFF と 0xFFFF。ただし、絵文字のコード値は0xFFFFを超えており、UTF-8の仕様上、格納に4バイト必要となります。このため、MySQL は utf8mb4 文字セットを提供します。データベーステーブルの文字セットがutf8mb4に設定されている場合、顔文字を含むテキストは正常に格納できます。
  2. 中央の 0900 は Unicode 9.0 仕様に対応します。 Unicode 仕様は常に更新されており、各更新には拡張と修正の両方が含まれていることを知っておく必要があります。たとえば、バージョン 6.0 では 222 の新しい中国語、日本語、韓国語の統一表意文字 (CJK 統一表意文字) が追加され、バージョン 7.0 ではロシアの通貨ルーブルの記号などが追加されました。
  3. 最後の 2 つの部分 _ai_ci は、ai が「ピッチを区別しない」アクセント非依存性を意味し、ci は「大文字と小文字を区別しない」大文字と小文字を区別しないことを意味します。

2. utf8mb4_0900_ai_ciそれを使用する利点とその理由は何ですか?

utf8mb4_0900_ai_ci は、より広範囲の文字の保存と処理をサポートする Unicode 文字セットの拡張機能です。
utf8mb4_0900_ai_ci を使用する利点と理由:

  1. より多くの文字をサポート: utf8mb4_0900_ai_ci 文字セットは、顔文字、特殊記号、珍しい文字など、より多くの Unicode 文字の保存と処理をサポートします。以前の文字セットよりも、多言語および複数文字のニーズをより包括的に満たすことができます。
  2. 絵文字のサポート: 現在のコミュニケーションでは絵文字が広く使用されているため、utf8mb4_0900_ai_ci 文字セットを使用すると、データベースで絵文字を正しく保存して処理できます。
  3. 照合順序:utf8mb4_0900_ai_ci照合順序は Unicode 標準に基づいており、より正確で一貫した並べ替え方法が提供されます。これは、テキストの並べ替えと比較が必要なアプリケーション、特に複数の言語が関係するシナリオにとって重要です。
  4. 互換性: utf8mb4_0900_ai_ci 文字セットは MySQL バージョン 8.0.0 で導入され、MySQL によって公式に推奨される文字セットです。これを使用すると、MySQL の最新バージョンとの互換性が保証され、MySQL が提供する最新の機能と改善点を活用できるようになります。

要約するとutf8mb4_0900_ai_ci、文字セットと照合順序は、複数の言語、顔文字、特殊文字を処理する必要があるアプリケーションに、より広範な文字サポートとより正確な並べ替えを提供します。 MySQL の最新バージョンとの互換性のために推奨される選択肢です。

3. 如何使用utf8mb4_0900_ai_ci

utf8mb4_0900_ai_ciMySQL で 文字セットと照合順序を使用

  1. データベースの作成時に文字セットと照合順序を指定します。
CREATE DATABASE your_database_name CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;

これにより、文字セットが 、照合順序が に設定された your_database_name という名前のデータベースが作成されます。 2. テーブルの作成時に文字セットと照合順序を指定します。 utf8mb4utf8mb4_0900_ai_ci

CREATE TABLE your_table_name (
  column1 datatype CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci,
  column2 datatype CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci,
  ...
);

テーブルを作成するときは、文字セットを格納する必要がある各列の文字セットと照合順序を指定しますutf8mb4datatype を適切なデータ型に置き換えます。
3. 既存のテーブルの文字セットと照合順序を変更します。

ALTER TABLE your_table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;

上記のステートメントを使用して、既存のテーブル your_table_name の文字セットと照合順序を utf8mb4 および utf8mb4_0900_ai_ci に変更します。

上記の操作を実行すると、データの損失や形式の変更が発生する可能性があることに注意してください。変更を加える前に、必ず重要なデータをバックアップしてください。

MySQL バージョン 8.0.0 以降では utf8mb4_0900_ai_ci 文字セットと照合順序を必ず使用してください。これより前のバージョンの MySQL ではサポートされていない可能性があります。

おすすめ

転載: blog.csdn.net/weixin_42483501/article/details/134437534