まず、MySQLのデータ型

主に次の5つのカテゴリが含まれます。

整数型:BIT、BOOL、TINY INT、SMALL INT、MEDIUM INT、INT、BIG INT

浮動小数点型:FLOAT、DOUBLE、DECIMAL

文字列型:CHAR、VARCHAR、TINY TEXT、TEXT、MEDIUM TEXT、LONGTEXT、TINY BLOB、BLOB、MEDIUM BLOB、LONG BLOB

日付タイプ:Date、DateTime、TimeStamp、Time、Year

その他のデータタイプ:BINARY、VARBINARY、ENUM、SET、Geometry、Point、MultiPoint、LineString、MultiLineString、Polygon、GeometryCollectionなど。

 

1.整数

MySQLデータ型 意味(署名済み)
tinyint(m) 1バイト範囲(-128〜127)
smallint(m) 2バイトの範囲(-32768〜32767)
mediumint(m) 3バイトの範囲(-8388608〜8388607)
int(m) 4バイトの範囲(-2147483648〜2147483647)
bigint(m) 8バイトの範囲(+ -9.22 * 10の18乗)

unsignedを追加すると、最大値は2倍になります。たとえば、tinyint unsignedの値の範囲は(0〜256)です。

 in in(m)のmは、SELECTクエリの結果セットの表示幅を示し、実際の値の範囲には影響しません。表示幅には影響しません。また、このmの用途がわかりません。

 

2.浮動小数点型(floatおよびdouble)

MySQLデータ型 意味
float(m、d) 単精度浮動小数点型8ビット精度(4バイト)m合計数、d小数点以下の桁数
double(m、d) 倍精度浮動小数点型16ビット精度(8バイト)m合計数、d小数点

フィールドをフロート(6,3)として定義するように設定します。数値123.45678を挿入すると、実際のデータベースには123.457が格納されますが、合計数は実際の数値(6桁)の影響を受けます。整数部分は最大3桁です。12.123456を挿入すると12.1234が格納されます。12.12を挿入すると12.1200が格納されます。

 

3.固定小数点数

浮動小数点型はおおよその値をデータベースに格納し、固定小数点型は正確な値をデータベースに格納します。 

decimal(m、d)パラメータm <65は総数、d <30およびd <mは小数点以下の桁数です。

 

4.文字列(char、varchar、_text)

MySQLデータ型 意味
char(n) 固定長、最大255文字
varchar(n) 固定長、最大65535文字
小さなテキスト 可変長、最大255文字
テキスト 可変長、最大65535文字
ミディアムテキスト 可変長、最大2の24乗-1文字
長いテキスト 可変長、最大2の32乗の1文字

char和varchar:

1.char(n)格納されている文字数がn未満の場合、スペースが追加され、クエリ中にスペースが削除されます。したがって、char型に格納されている文字列の末尾にはスペースがなく、varcharはこれに限定されません。 

2. char(n)固定長、char(4)に格納される文字数に関係なく、4バイトを占有します。varcharは、格納される実際の文字数+ 1バイト(n <= 255)または2バイト(n> 255)、

したがって、varchar(4)、3文字の格納は4バイトを占有します。 


3. char型の文字列検索速度は、varchar型より高速です。
varcharとテキスト: 

1. varcharはnを指定できます。テキストは指定できません。内部ストレージvarcharは、保存されている実際の文字数+ 1バイト(n <= 255)または2バイト(n> 255)です。textは実際の文字数+ 2です。ことば

セクション。 

2.テキストタイプにデフォルト値を設定することはできません。 

3. Varcharは直接インデックスを作成でき、textは以前に何文字を指定するかをインデックスを作成します。varcharクエリの速度はテキストよりも速く、インデックスを作成する場合、テキストインデックスは機能していないようです。

 

5.バイナリデータ(_Blob)

1. _BLOBと_textは異なる方法で格納され、_TEXTはテキストで格納され、英語のストレージでは大文字と小文字が区別され、_Blobは大文字と小文字に関係なくバイナリで格納されます。

2. _BLOBに格納されたデータは、全体としてのみ読み取ることができます。 

3. _TEXTは文字セットを指定でき、_BLOは文字セットを指定する必要はありません。

 

6.日時タイプ

MySQLデータ型 意味
日付 日付 '2008-12-2'
時間 時間'12:25:36 '
日付時刻 日時 '2008-12-2 22:06:44'
タイムスタンプ 自動ストレージレコード変更時刻

フィールドをタイムスタンプとして定義した場合、他のフィールドが変更されると、このフィールドの時間データが自動的に更新されるため、このデータタイプのフィールドは、このレコードの最終変更時間を格納できます。

 

データ型属性

 

MySQLキーワード 意味
ヌル データ列にはNULL値を含めることができます
NULLではない データ列にNULL値を含めることはできません
デフォルト デフォルト値
プライマリーキー 主キー
自動増加 整数型に適した自動インクリメント
未署名 署名なし
キャラクターセット名 文字セットを指定する

 

次に、MYSQLデータ型の長さとスコープ

データ型とバイト長のリスト:

データ型 バイト長 範囲または使用法
ビット 1 符号なし[0,255]、符号付き[-128,127]、Tianyuan Blog備考:BITとBOOLの両方のブール型は1バイトを占有します
TinyInt 1 整数[0,255]
SmallInt 2 署名なし[0,65535]、署名済み[-32768,32767]
MediumInt 符号なし[0,2 ^ 24-1]、符号付き[-2 ^ 23,2 ^ 23-1]]
Int 4 符号なし[0,2 ^ 32-1]、符号付き[-2 ^ 31,2 ^ 31-1]
BigInt 8 符号なし[0,2 ^ 64-1]、符号付き[-2 ^ 63、2 ^ 63 -1]
フロート(M、D) 4 単精度浮動小数点数。Tianyuan Blogは、Dが精度であることを示しています。D<= 24の場合、これはデフォルトのFLOATです。D> 24の場合、自動的にDOUBLEタイプに変換されます。
ダブル(M、D) 8  倍精度浮動小数点。
10進数(M、D) M + 1またはM + 2 未打包的浮点数,用法类似于FLOAT和DOUBLE,天缘博客提醒您如果在ASP中使用到Decimal数据类型,直接从数据库读出来的Decimal可能需要先转换成Float或Double类型后再进行运算。
Date 3 以YYYY-MM-DD的格式显示,比如:2009-07-19
Date Time 8 以YYYY-MM-DD HH:MM:SS的格式显示,比如:2009-07-19 11:22:30
TimeStamp 4 以YYYY-MM-DD的格式显示,比如:2009-07-19
Time 3 以HH:MM:SS的格式显示。比如:11:22:30
Year 1 以YYYY的格式显示。比如:2009
Char(M) M 定长字符串。
VarChar(M) M 变长字符串,要求M<=255
Binary(M) M 类似Char的二进制存储,特点是插入定长不足补0
VarBinary(M) M 类似VarChar的变长二进制存储,特点是定长不补0
Tiny Text Max:255 大小写不敏感
Text Max:64K 大小写不敏感
Medium Text Max:16M 大小写不敏感
Long Text Max:4G 大小写不敏感
TinyBlob Max:255 大小写敏感
Blob Max:64K 大小写敏感
MediumBlob Max:16M 大小写敏感
LongBlob Max:4G 大小写敏感
Enum 1或2 最大可达65535个不同的枚举值
Set 可达8 最大可达64个不同的值
Geometry    
Point    
LineString    
Polygon    
MultiPoint    
MultiLineString    
MultiPolygon    
GeometryCollection    

三、使用建议

1、在指定数据类型的时候一般是采用从小原则,比如能用TINY INT的最好就不用INT,能用FLOAT类型的就不用DOUBLE类型,这样会对MYSQL在运行效率上提高很大,尤其是大数据量测试条件下。

2、不需要把数据表设计的太过复杂,功能模块上区分或许对于后期的维护更为方便,慎重出现大杂烩数据表

3、数据表和字段的起名字也是一门学问

4、设计数据表结构之前请先想象一下是你的房间,或许结果会更加合理、高效

5、数据库的最后设计结果一定是效率和可扩展性的折中,偏向任何一方都是欠妥的

 

选择数据类型的基本原则

前提:使用适合存储引擎。

选择原则:根据选定的存储引擎,确定如何选择合适的数据类型。

下面的选择方法按存储引擎分类:

  • MyISAM 数据存储引擎和数据列:MyISAM数据表,最好使用固定长度(CHAR)的数据列代替可变长度(VARCHAR)的数据列。
  • MEMORY存储引擎和数据列:MEMORY数据表目前都使用固定长度的数据行存储,因此无论使用CHAR或VARCHAR列都没有关系。两者都是作为CHAR类型处理的。
  • InnoDB 存储引擎和数据列:建议使用 VARCHAR类型。


对于InnoDB数据表,内部的行存储格式没有区分固定长度和可变长度列(所有数据行都使用指向数据列值的头指针),因此在本质上,使用固定长度的CHAR列不一定比使用可变长度VARCHAR列简单。因而,主要的性能因素是数据行使用的存储总量。由于CHAR平均占用的空间多于VARCHAR,因 此使用VARCHAR来最小化需要处理的数据行的存储总量和磁盘I/O是比较好的。

下面说一下固定长度数据列与可变长度的数据列。

char与varchar

CHAR和VARCHAR类型类似,但它们保存和检索的方式不同。它们的最大长度和是否尾部空格被保留等方面也不同。在存储或检索过程中不进行大小写转换。

下面的表显示了将各种字符串值保存到CHAR(4)和VARCHAR(4)列后的结果,说明了CHAR和VARCHAR之间的差别:

CHAR(4) 存储需求 VARCHAR(4) 存储需求
'' '    ' 4个字节 '' 1个字节
'ab' 'ab  ' 4个字节 'ab ' 3个字节
'abcd' 'abcd' 4个字节 'abcd' 5个字节
'abcdefgh' 'abcd' 4个字节 'abcd' 5个字节


请注意上表中最后一行的值只适用不使用严格模式时;如果MySQL运行在严格模式,超过列长度不的值保存,并且会出现错误。

从CHAR(4)和VARCHAR(4)列检索的值并不总是相同,因为检索时从CHAR列删除了尾部的空格。通过下面的例子说明该差别:
mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));
Query OK, 0 rows affected (0.02 sec)
 
mysql> INSERT INTO vc VALUES ('ab  ', 'ab  ');
Query OK, 1 row affected (0.00 sec)
 
mysql> SELECT CONCAT(v, '+'), CONCAT(c, '+') FROM vc;
+----------------+----------------+
| CONCAT(v, '+') | CONCAT(c, '+') |
+----------------+----------------+
| ab  +          | ab+            |
+----------------+----------------+
1 row in set (0.00 sec)

text和blob

 

在使用text和blob字段类型时要注意以下几点,以便更好的发挥数据库的性能。

①BLOB和TEXT值也会引起自己的一些问题,特别是执行了大量的删除或更新操作的时候。删除这种值会在数据表中留下很大的"空洞",以后填入这些"空洞"的记录可能长度不同,为了提高性能,建议定期使用 OPTIMIZE TABLE 功能对这类表进行碎片整理.

②使用合成的(synthetic)索引。合成的索引列在某些时候是有用的。一种办法是根据其它的列的内容建立一个散列值,并把这个值存储在单独的数据列中。接下来你就可以通过检索散列值找到数据行了。但是,我们要注意这种技术只能用于精确匹配的查询(散列值对于类似<或>=等范围搜索操作符 是没有用处的)。我们可以使用MD5()函数生成散列值,也可以使用SHA1()或CRC32(),或者使用自己的应用程序逻辑来计算散列值。请记住数值型散列值可以很高效率地存储。同样,如果散列算法生成的字符串带有尾部空格,就不要把它们存储在CHAR或VARCHAR列中,它们会受到尾部空格去除的影响。

合成的散列索引对于那些BLOB或TEXT数据列特别有用。用散列标识符值查找的速度比搜索BLOB列本身的速度快很多。

③在不必要的时候避免检索大型的BLOB或TEXT值。例如,SELECT *查询就不是很好的想法,除非你能够确定作为约束条件的WHERE子句只会找到所需要的数据行。否则,你可能毫无目的地在网络上传输大量的值。这也是 BLOB或TEXT标识符信息存储在合成的索引列中对我们有所帮助的例子。你可以搜索索引列,决定那些需要的数据行,然后从合格的数据行中检索BLOB或 TEXT值。

④把BLOB或TEXT列分离到单独的表中。在某些环境中,如果把这些数据列移动到第二张数据表中,可以让你把原数据表中 的数据列转换为固定长度的数据行格式,那么它就是有意义的。这会减少主表中的碎片,使你得到固定长度数据行的性能优势。它还使你在主数据表上运行 SELECT *查询的时候不会通过网络传输大量的BLOB或TEXT值。

浮点数与定点数

为了能够引起大家的重视,在介绍浮点数与定点数以前先让大家看一个例子:
mysql> CREATE TABLE test (c1 float(10,2),c2 decimal(10,2));
Query OK, 0 rows affected (0.29 sec)

mysql> insert into test values(131072.32,131072.32);
Query OK, 1 row affected (0.07 sec)

mysql> select * from test;
+-----------+-----------+
| c1        | c2        |
+-----------+-----------+
| 131072.31 | 131072.32 |
+-----------+-----------+
1 row in set (0.00 sec)

从上面的例子中我们看到c1列的值由131072.32变成了131072.31,这就是浮点数的不精确性造成的。

在mysql中float、double(或real)是浮点数,decimal(或numberic)是定点数。

浮点数相对于定点数的优点是在长度一定的情况下,浮点数能够表示更大的数据范围;它的缺点是会引起精度问题。在今后关于浮点数和定点数的应用中,大家要记住以下几点:

  1. 浮点数存在误差问题;
  2. 对货币等对精度敏感的数据,应该用定点数表示或存储;
  3. 编程中,如果用到浮点数,要特别注意误差问题,并尽量避免做浮点数比较;
  4. 要注意浮点数中一些特殊值的处理。