主要根据集群因子的大小来决定
集群因子(CLUSTERING_FACTOR)是对表的有序性的量度,通过一个索引扫描一张表时需要访问表的数据库的数量;
一个字段上有索引,但有时执行sql语句时看执行计划时不走索引,就有可能是集群因子过高导致的。
集群因子的计算方法:
T表的ID列,首先对ID列进行从小到大排序,得到序列(1,1,1,2,3,4,5,5,5..........);
初始化集群因子为0;
然后依次查看序列中所在的存储块,如果在同一个块,则集群因子不变,否则加1;
所以,极端情况下,集群因子为行数,理想情况下,约为块数;
可以看到,集群因子越接近块数,查询索引的一个值所需访问的块数就越少,索引也有效。
而当集群因子接近行数时,查询索引的一个值所需访问的块数就越多,甚至不弱全表扫描,即使SQL返回的行数为1%,可能也用不上索引。
从集群因子的算法来看,集群因子只与数据分布有关,如果集群因子过大,重建索引毫无作用,只有删除表的数据,重新按照索引列排序插入,改变数据分布;
如果集群因子接近于表中块的数量,则表示索引适当排序;如果集群因子接近于表中行的数量,则表示索引没有适当排序