1.インデックス
1.1コンセプト
インデックスは、データテーブル内のすべてのレコードへのポインタを含む特別なファイルです。テーブル内の1つ以上の列にインデックスを作成し、インデックスのタイプを指定できます。各タイプのインデックスには、独自のデータ構造の実装があります。(具体的な詳細は、フォローアップデータベース原則コースで説明します)
1.2機能
- データベース内のテーブル、データ、およびインデックス間の関係は、棚にある本、本の内容、および本のカタログ間の関係に似ています。
- 索引の役割は、データをすばやく見つけて取得するために使用できる本のカタログの役割に似ています。
- インデックスは、データベースのパフォーマンスを向上させるのに非常に役立ちます。
1.3使用シナリオ
データベーステーブルの1つまたは複数の列にインデックスを作成することを検討するには、次の点を考慮する必要があります。
- データ量が多く、これらの列に対して条件付きクエリが実行されることがよくあります。
- データベーステーブルへの挿入操作とこれらの列への変更操作の頻度は低くなります。
- インデックスは追加のディスクスペースを占有します
上記の条件が満たされた場合は、クエリの効率を向上させるために、テーブル内のこれらのフィールドにインデックスを作成することを検討してください。
逆に、列が無条件に照会される場合、挿入および変更操作が頻繁に実行される場合、またはディスク容量が不足している場合、インデックスの作成は考慮されません。
1.4使用
主キー制約(PRIMARY KEY)、一意性制約(UNIQUE)、および外部キー制約(FOREIGN KEY)を作成すると、対応する列のインデックスが自動的に作成されます。
- インデックスを表示
show index from 表名;
ケース:学生テーブルの既存のインデックスを表示する
show index from student;
- インデックスを作成する
主キー、非一意制約、および非外部キーではないフィールドの場合、通常のインデックスを作成できます
create index 索引名 on 表名(字段名);
ケース:クラステーブルの名前フィールドのインデックスを作成します
create index idx_classes_name on classes(name);
- ドロップインデックス
drop index 索引名 on 表名;
ケース:クラステーブルの名前フィールドのインデックスを削除します
drop index idx_classes_name on classes;
1.5ケース
テストシートを準備します。
-- 创建用户表
DROP TABLE IF EXISTS test_user;
CREATE TABLE test_user (
id_number INT,
name VARCHAR(20) comment '姓名',
age INT comment '年龄',
create_time timestamp comment '创建日期'
);
テストデータを準備し、ユーザーデータをバッチで挿入します(操作には長い時間がかかり、約1時間以上かかります):
-- 构建一个8000000条记录的数据
-- 构建的海量表数据需要有差异性,所以使用存储过程来创建, 拷贝下面代码就可以了,暂时不用理解
-- 产生名字
drop function if exists rand_name;
delimiter $$
create function rand_name(n INT, l INT)
returns varchar(255)
begin
declare return_str varchar(255) default '';
declare i int default 0;
while i < n do
if i=0 then
set return_str = rand_string(l);
else
set return_str =concat(return_str,concat(' ', rand_string(l)));
end if;
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;
-- 产生随机字符串
drop function if exists rand_string;
delimiter $$
create function rand_string(n INT)
returns varchar(255)
begin
declare lower_str varchar(100) default
'abcdefghijklmnopqrstuvwxyz';
declare upper_str varchar(100) default
'ABCDEFJHIJKLMNOPQRSTUVWXYZ';
declare return_str varchar(255) default '';
declare i int default 0;
declare tmp int default 5+rand_num(n);
while i < tmp do
if i=0 then
set return_str
=concat(return_str,substring(upper_str,floor(1+rand()*26),1));
else
set return_str
=concat(return_str,substring(lower_str,floor(1+rand()*26),1));
end if;
set i = i + 1;
end while;
return return_str;
end $$
delimiter ;
-- 产生随机数字
drop function if exists rand_num;
delimiter $$
create function rand_num(n int)
returns int(5)
begin
declare i int default 0;
set i = floor(rand()*n);
return i;
end $$
delimiter ;
-- 向用户表批量添加数据
drop procedure if exists insert_user;
delimiter $$
create procedure insert_user(in start int(10),in max_num int(10))
begin
declare i int default 0;
set autocommit = 0;
repeat
set i = i + 1;
insert into test_user values ((start+i) ,rand_name(2,
5),rand_num(120),CURRENT_TIMESTAMP);
until i = max_num
end repeat;
commit;
end $$
delimiter ;
-- 执行存储过程,添加8000000条用户记录
call insert_user(1, 8000000);
id_numberが778899であるユーザーの情報を照会します。
-- 可以看到耗时4.93秒,这还是在本机一个人来操作,在实际项目中,如果放在公网中,假如同时有1000
个人并发查询,那很可能就死机。
select * from test_user where id_number=556677;
Explainを使用して、SQLの実行を表示できます。
explain select * from test_user where id_number=556677;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: test_user
type: ALL
possible_keys: NULL
key: NULL <== key为null表示没有用到索引
key_len: NULL
ref: NULL
rows: 6
Extra: Using where
1 row in set (0.00 sec)
クエリ速度を提供するには、id_numberフィールドにインデックスを作成します。
create index idx_test_user_id_number on test_user(id_number);
ID番号を変更して、実行時間を照会および比較します。
select * from test_user where id_number=776655;
Explainを使用して、SQLの実行を表示できます。
explain select * from test_user where id_number=776655;
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: test_user
type: ref
possible_keys: idx_test_user_id_number
key: idx_test_user_id_number <= key用到了idx_test_user_id_number
key_len: NULL
ref: const
rows: 1
Extra: Using where
1 row in set (0.00 sec)
インデックスに格納されるデータ構造は、主にB +ツリーとハッシュメソッドです。実装の原則については、データベースの原則の後半で説明します。
Bツリー:Bツリー
のデータは、リーフノードと非リーフノードの両方に保存されます。
B +ツリー:
2.事務
トランザクションが特定のデータを変更すると、別のトランザクションがデータを読み取ります。何らかの理由で、前のトランザクションが変更されたデータの変更を取り消し、変更されたデータが元の値に復元されようとしている場合、後のトランザクションはデータを読み取ります。ダーティデータの読み取りと呼ばれる、利用可能なデータと矛盾しています
2.1トランザクションを使用する理由
テストシートを準備します。
drop table if exists accout;
create table accout(
id int primary key auto_increment,
name varchar(20) comment '账户名称',
money decimal(11,2) comment '金额'
);
insert into accout(name, money) values
('阿里巴巴', 5000),
('四十大盗', 1000);
たとえば、40人の泥棒がAlibabaのアカウントから2,000元を盗んだ
-- 阿里巴巴账户减少2000
update accout set money=money-2000 where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000 where name = '四十大盗';
上記の最初のSQLセンテンスの実行時にネットワークエラーが発生した場合、またはデータベースがダウンした場合、Alibabaのアカウントは2000減少しますが、FortyThievesのアカウントには増加しません。
解決策:トランザクションを使用して制御し、上記の2つのSQLセンテンスが正常に実行されるか、すべての実行が失敗するようにします。
2.2トランザクションの概念
トランザクションとは、論理的な操作のグループを指し、この操作のグループを構成するユニットは、すべて成功するか、すべて失敗します。
さまざまな環境で、トランザクションが発生する可能性があります。データベースで対応するのは、データベーストランザクションです。
2.3使用
(1)トランザクションの開始:トランザクションの開始;
(2)複数のSQLステートメントの実行
(3)ロールバックまたはコミット:ロールバック/コミット;
説明:ロールバックはすべての失敗を意味し、コミットはすべての成功を意味します。
start transaction;
-- 阿里巴巴账户减少2000
update accout set money=money-2000 where name = '阿里巴巴';
-- 四十大盗账户增加2000
update accout set money=money+2000 where name = '四十大盗';
commit;
トランザクションの特性と設定については、フォローアップデータベースの原則のセクションでさらに説明します。
3.主要コンテンツの要約
索引:
(1)データの挿入と削除の頻度が高いテーブルの場合、索引は適用されません
(2)変更頻度の高い列の場合、この列は索引には適用されません
(3)照会頻度の高い1つまたは複数の列の場合、これらの列にインデックスを作成できます
取引:
start transaction;
...
rollback/commit;