Oracle B树索引和位图索引、索引的说明和目的、索引碎片问题

B树索引和位图索引

索引是数据库为了提高查询效率提供的一种冗余结构,保守计算数据库50%以上的调优可以通过调整索引来进行优化;

引用国内一位资深的ORACLE专家的话:"我其实只懂点(挨踢)知识,IT里面其实只懂点甲骨文,甲骨文里面其实只懂点数据库,数据库里面其实只懂点SQL,SQL里面其实只懂点索引"——"你才是真正的专家!"

根据个人的浅薄的经验,作为DBA的日常运维会越来越少,从数据库的每个版本的更新来看,数据库系统已经趋向越来越智能话,DBA能干的活也越来越少了,如果一个DBA只能做做日常的表空间扩容、数据库的备份恢复、启停、系统的更新,那么将是很危险的一件事。而调优自古以来就是一门很高深的学问,如果能把这个做好了,那么DBA能够创造的价值和在公司的作用中,将越来越显著;

说了这么多,应该引入主题了,如果要做好调优,先从索引入手吧。

后续的章节中将陆续更新索引的一些知识,第一章从索引的类别开始吧;

 

二  索引在结构上的类别可划分如下:B树索引、位图索引、散列索引、反转索引等

 

三  索引的介绍:

1、B树索引(BTREE

B数索引是我们日常工作最最常用的索引,大家平时在工作中说的"索引"默认都是B数索引;

索引其实很简单,也很容易理解,用一本书的目录来形容最为贴切了,B树索引的结构跟图书馆的目录也很像

B树索引的结构:

索引的顶层为根,它包括指向索引中下一层次的条目。下一层次为分支块,它又指向位于索引中下一层索引中下一层次的块,最底层的是叶节点,它包含指向表行的索引条目。叶块是双向关联的,这边与按键值升序或降序扫描索引;

 

索引叶条目的格式

一个索引条目包含以下组件:

条目头:存储列数和锁定信息

键列长度/值对:用于定义键中的列大小,后面跟随列值(此类长度/值对的数目就是索引中的最大列数)。

 

索引叶条目的特性

在非分区表的B 树索引中:

当多个行具有相同的键值时,如果不压缩索引,键值会出现重复

当某行包含的所有键列为NULL 时,该行没有对应的索引条目。因此,当WHERE 子句指定了NULL 时,将始终执行全表扫描

 

对索引执行DML 操作的效果

对表执行DML 操作时,Oracle 服务器会维护所有索引。下面说明对索引执行DML 命令产生的效果:

执行插入操作导致在相应块中插入索引条目。

删除一行只导致对索引条目进行逻辑删除。已删除行所占用的空间不可供后面新的叶条目使用。

更新键列导致对索引进行逻辑删除和插入。PCTFREE 设置对索引没有影响,但创建时除外。即使索引块的空间少于PCTFREE 指定的空间,也可以向索引块添加新条目。

该图更能体现索引的结构

 

2、位图索引

位图索引(bitmap index)是从Oracle7.3 版本开始引入的。目前Oracle 企业版和个人版都支持位图索引,但标准版不支持。

位图索引在平时的OLTP系统中比较少见,但是在OLAP系统中就会经常见到,号称数据仓库调优的三个利器之一;

位图索引(通过在以下特定情况下,位图索引比B 树索引更有优势:

表具有数百万行且键列的基数较低时(也就是列的不同值极少时)。例如,对于护照记录表中的性别和婚姻状况列,位图索引可能比B 树索引更可取。

经常使用包含OR 运算符的多个WHERE 条件组合进行查询时

键列上的活动为只读活动或少量更新活动时(OLAP系统的特点)

 

位图索引的结构

位图索引也可以按B 树形式进行组织,但是,叶节点会存储每个键值的位图,而不是行ID 列表。位图中每一位与一个可能的行ID 对应,如果设置了该位,则表示具有对应行ID 的行包含键值。

如图所示,位图索引的叶节点包含:

条目头,其中包含列数和锁定信息

由每个键列的长度/值对组成的键值(在幻灯片的示例中,关键字只由一列组成;第一个条目的键值为Blue)

开始ROWID,在本示例中它指定块号10、行号0 和文件号3

结束ROWID,在本示例中它指定块号12、行号8 和文件号3

由位字符串组成的位图段(如果对应行包含键值,则会设置位;如果对应行不包含键值,则不会设置位。Oracle 服务器使用已获专利的压缩技术存储位图段。)开始ROWID 是位图中的位图段指向的第一行的行ID,也就是说,位图的第一位对应于该行ID,位图的第二位对应于块中的下一行。结束ROWID 是一个指针,它指向由位图段覆盖的表中的最后一行。位图索引使用受限的行ID。

 

使用位图索引

B 树用于定位叶节点,这些节点包含指定键值的位图段。开始ROWID 和位图段用于定位包含键值的行。

对表中的键列进行更改后,也必须修改位图。这会导致相关的位图段被锁定。由于锁是在整个位图段上获得的,因此,在第一个事务处理结束之前,其它事务处理不能更新位图覆盖的行。

索引的说明和目的 

1.什么是索引
    索引是建立在表的一列或多个列上的辅助对象,目的是加快访问表中的数据;
  Oracle存储索引的数据结构是B*树,位图索引也是如此,只不过是叶子节点不同B*数索引;
  索引由根节点、分支节点和叶子节点组成,上级索引块包含下级索引块的索引数据,叶节点包含索引数据和确定行实际位置的rowid。
  使用索引的目的
  加快查询速度
  减少I/O操作
  消除磁盘排序
  何时使用索引
  查询返回的记录数
  排序表<40%
  非排序表 <7%
  表的碎片较多(频繁增加、删除)

  2.索引的种类
  非唯一索引(最常用)
  唯一索引
  位图索引
  局部有前缀分区索引
  局部无前缀分区索引
  全局有前缀分区索引
  散列分区索引
  基于函数的索引
  3.管理索引的准则
  
  在表中插入数据后创建索引
  在用SQL*Loader或import工具插入或装载数据后,建立索引比较有效;
    3.1索引正确的表和列
   经常检索排序大表中40%或非排序表7%的行,建议建索引;
  。为了改善多表关联,索引列用于联结;
  。列中的值相对比较唯一;
  。取值范围(大:B*树索引,小:位图索引);
  。Date型列一般适合基于函数的索引;
  。列中有许多空值,不适合建立索引
  
  3.2为性能而安排索引列
  
  。经常一起使用多个字段检索记录,组合索引比单索引更有效;
  。把最常用的列放在最前面,例:dx_groupid_serv_id(groupid,serv_id),在where条件中使用groupid或groupid,serv_id,查询将使用索引,若仅用到serv_id字段,则索引无效;
  3.3合并/拆分不必要的索引。
  
  3.4限制每个表索引的数量
  
  。一个表可以有几百个索引(你会这样做吗?),但是对于频繁插入和更新表,索引越多系统CPU,I/O负担就越重;
  。建议每张表不超过5个索引。
  
  3.5删除不再需要的索引
  
  。索引无效,集中表现在该使用基于函数的索引或位图索引,而使用了B*树索引;
  。应用中的查询不使用索引;
  。重建索引之前必须先删除索引,若用alter index … rebuild重建索引,则不必删除索引。
  
  3.6索引数据块空间使用
  。创建索引时指定表空间,特别是在建立主键时,应明确指定表空间;
  。合理设定pctfress,注意:不能给索引指定pctused;
  。估计索引的大小和合理地设置存储参数,默认为表空间大小,或initial与next设置成一样大。
  3.7考虑并行创建索引
  。对大表可以采用并行创建索引,在并行创建索引时,存储参数被每个查询服务器进程分别使用,例如:initial为1M,并行度为8,则创建索引期间至少要消耗8M空间;
  3.8考虑用nologging创建索引
  。对大表创建索引可以使用nologging来减少重做日志;
  。节省重做日志文件的空间;
  。缩短创建索引的时间;
  。改善了并行创建大索引时的性能。

4.怎样建立最佳索引
  
  明确地创建索引
  create index index_name on table_name(field_name)
  tablespace tablespace_name
  pctfree 5
  initrans 2
  maxtrans 255
  storage
  (
  minextents 1
  maxextents 16382
  pctincrease 0
  );
  
  创建基于函数的索引
  
  。常用与UPPER、LOWER、TO_CHAR(date)等函数分类上,例:
  create index idx_func on emp (UPPER(ename)) tablespace tablespace_name;
  
  创建位图索引
  
  。对基数较小,且基数相对稳定的列建立索引时,首先应该考虑位图索引,例:
  create bitmap index idx_bitm on class (classno) tablespace tablespace_name;
  
  明确地创建唯一索引
  
  。可以用create unique index语句来创建唯一索引,例:
  create unique index dept_unique_idx on dept(dept_no) tablespace idx_1;
  
  创建与约束相关的索引
  
  。可以用using index字句,为与unique和primary key约束相关的索引,例如:
  alter table table_name
  add constraint PK_primary_keyname primary key (field_name)
  using index tablespace tablespace_name;
  
  5.如何创建局部分区索引
  
  。基础表必须是分区表;
  。分区数量与基础表相同;
  。每个索引分区的子分区数量与相应的基础表分区相同;
  。基础表的子分区中的行的索引项,被存储在该索引的相应的子分区中,例如:
  Create Index TG_CDR04_SERV_ID_IDX On TG_CDR04(SERV_ID)
  Pctfree 5
  Tablespace TBS_AK01_IDX
  Storage (
  MaxExtents 32768
  PctIncrease 0
  FreeLists 1
  FreeList Groups 1
  )
  local
  /
  
  6如何创建范围分区的全局索引
  
  。基础表可以是全局表和分区表。
  create index idx_start_date on tg_cdr01(start_date)
  global partition by range(start_date)
  (partition p01_idx vlaues less than (‘0106’)
  partition p01_idx vlaues less than (‘0111’)
  …
  partition p01_idx vlaues less than (‘0401’ ))
  /
  重建现存的索引
  重建现存的索引的当前时刻不会影响查询;
  
  重建索引可以删除额外的数据块;
  提高索引查询效率;
  alter index idx_name rebuild nologging;
  
  对于分区索引:
  alter index idx_name rebuild partition partiton_name nologging;
  
  7.要删除索引的原因
  
  。不再需要的索引;
  。索引没有针对其相关的表所发布的查询提供所期望的性能改善;
  。应用没有用该索引来查询数据;
  。该索引无效,必须在重建之前删除该索引;
  。该索引已经变的太碎了,必须在重建之前删除该索引;
  。语句:drop index idx_name;drop index idx_name drop partition partition_name;
  
  8.建立索引的代价
  
  基础表维护时,系统要同时维护索引,不合理的索引将严重影响系统资源,主要表现在CPU和I/O上;
  
  插入、更新、删除数据产生大量db file sequential read锁等待;

一个表中有几百万条数据,对某个字段加了索引,但是查询时性能并没有什么提高,这主要可能是oracle的索引限制造成的。

oracle的索引有一些索引限制,在这些索引限制发生的情况下,即使已经加了索引,oracle还是会执行一次全表扫描,查询的性能不会比不加索引有所提高,反而可能由于数据库维护索引的系统开销造成性能更差。

下面是一些常见的索引限制问题。

9、使用不等于操作符(<>, !=)

下面这种情况,即使在列dept_id有一个索引,查询语句仍然执行一次全表扫描

select * from dept where staff_num <> 1000;

但是开发中的确需要这样的查询,难道没有解决问题的办法了吗?

有!

通过把用 or 语法替代不等号进行查询,就可以使用索引,以避免全表扫描:上面的语句改成下面这样的,就可以使用索引了。

select * from dept shere staff_num < 1000 or dept_id > 1000;

10、使用 is null 或 is not null

使用 is null 或is nuo null也会限制索引的使用,因为数据库并没有定义null值。如果被索引的列中有很多null,就不会使用这个索引(除非索引是一个位图索引,关于位图索引,会在以后的blog文章里做详细解释)。在sql语句中使用null会造成很多麻烦。

解决这个问题的办法就是:建表时把需要索引的列定义为非空(not null)

 11、使用函数

如果没有使用基于函数的索引,那么where子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。下面的查询就不会使用索引:

select * from staff where trunc(birthdate) = '01-MAY-82';

但是把函数应用在条件上,索引是可以生效的,把上面的语句改成下面的语句,就可以通过索引进行查找。

select * from staff where birthdate < (to_date('01-MAY-82') + 0.9999);

12、比较不匹配的数据类型

比较不匹配的数据类型也是难于发现的性能问题之一。下面的例子中,dept_id是一个varchar2型的字段,在这个字段上有索引,但是下面的语句会执行全表扫描。

select * from dept where dept_id = 900198;

这是因为oracle会自动把where子句转换成to_number(dept_id)=900198,就是3所说的情况,这样就限制了索引的使用。把SQL语句改为如下形式就可以使用索引

select * from dept where dept_id = '900198';

13、使用like子句

使用like子句查询时,数据需要把所有的记录都遍历来进行判断,索引不能发挥作用,这种情况也要尽量避免。

Like 的字符串中第一个字符如果是‘%’则用不到索引
Column1 like ‘aaa%’ 是可以的
Column1 like ‘%aaa%’用不到

14.使用in

尽管In写法要比exists简单一些,exists一般来说性能要比In要高的多
用In还是用Exists的时机
当in的集合比较小的时候,或者用Exists无法用到选择性高的索引的时候,用In要好,否则就要用Exists
例:select count(*) from person_info where xb in (select xb_id from dic_sex);
Select count(*) from n_acntbasic a where shbxdjm =:a and exists(select 1 from person_info where pid=a.pid and …);

Select * from person_info where zjhm=3101….;将会对person_info全表扫描
Select * from person_info where zjhm =‘3101…’才能用到索引

假定TEST表的dt字段是date类型的并且对dt建了索引。
如果要查‘20041010’一天的数据.下面的方法用不到索引
Select * from test where to_char(dt,’yyyymmdd’) =‘20041010’;
而select * from test where dt >=to_date(‘20041010’,’yyyymmdd’) and dt < to_date(‘20041010’,’yyyymmdd’) + 1 将会用到索引。

15.如果能不用到排序,则尽量避免排序。
用到排序的情况有
集合操作。Union ,minus ,intersect等,注:union all 是不排序的。
Order by
Group by
Distinct
In 有时候也会用到排序
确实要排序的时候也尽量要排序小数据量
,尽量让排序在内存中执行,有文章说,内存排序的速度是硬盘排序的1万倍。
--------------------------------------------------------------------------
一、索引的几种常用用法 
1、创建索引

create index <index_name> on <table_name>(<column_name>) [tablespace<tablespace_name>];
1
2、重置索引

alter index <index_name> rebuild;
1
3、删除索引

drop index <index_name>
1
实例:

create table test as
select rownum as id,
to_char(sysdate + rownum/24/3600,'yyyy-mm-dd hh24:mi:ss') as ttime,
trunc(dbms_random.value(0,100)) as random_id,
dbms_random.string('x',20) txt
from dual
connect by level<=20000000;
select count(id) from test;
select * from test where txt='2W8U82V49FKZYK0JQETF';
drop table  test;
1
2
3
4
5
6
7
8
9
10
二、索引的分类 
1、普通索引

create index index_text_txt on test(txt);
1
2、唯一索引 Oracle 自动在表的主键上创建唯一索引

create unique index <index_name> on <index_name>(<coiumn_name>);
1
3、位图索引 
作用范围及优点: 
1、位图索引适合创建在低级数列(重复的数值多,如性别)上 
2、减少响应时间 
3、节省空间占用

create bitmap index <index_name> on <table_name>(<column_name>)
1
4、组合索引 
作用范围及优点: 
1、组合索引是在表的多个列上创建的索引 
2、索引中的顺序是任意的 
3、如果SQL语言的WHERE子句中引用了组合索引的所有或大多数列,则可以提高检索速度

实例:
create index <index_name> on <table_name>(<column_name1><column_name2>)
1
2
5、基于函数索引

create index <index_name> on <table_name>(<function_name>(<column_name>));
1
6、反向键索引

create index <index_name> on <table_name>(column_name) reverse;
---------------------------------------------------------------------------------------
1、查看索引信息可以在 all_indexs 表中
2、查看索引信息及引用的列 all_ind_columns
3、查看函数索引信息  all_ind_expressions

4、oracle比较智能,有时候即使创建了索引也不会使用,比如说在数据量比较少的情况下,可能就不会用索引
5、当进行全表扫描的时候,不用索引效率会更好
6、查询可能会使用缓存,所以说如果发现执行速度变快了,不一定说明你的sql更优了,有可能是使用到了缓存而已
7、使用plsql中的“解释计划”功能可以比较执行计划的消耗,进而写出更优的sql

 

管理索引的原则
使用索引应该遵循以下一些基本的原则。
1.小表不需要建立索引。
2.对于大表而言,如果经常查询的记录数目少于表中总记录数目的15%时,可以创建索引。这个比例并不绝对,它与全表扫描速度成反比。
3.对于大部分列值不重复的列可建立索引。
4.对于基数大的列,适合建立B树索引,而对于基数小的列适合建立位图索引。
5.对于列中有许多空值,但经常查询所有的非空值记录的列,应该建立索引。
6.LONG和LONG RAW列不能创建索引。
7.经常进行连接查询的列上应该创建索引。
8.在使用CREATE INDEX语句创建查询时,将最常查询的列放在其他列前面。
9.维护索引需要开销,特别时对表进行插入和删除操作时,因此要限制表中索引的数量。对于主要用于读的表,则索引多就有好处,但是,一个表如果经常被更改,则索引应少点。
10.在表中插入数据后创建索引。如果在装载数据之前创建了索引,那么当插入每行时,Oracle都必须更改每个索引。


索引
索引是关系数据库中用于存放每一条记录的一种对象,主要目的是加快数据的读取速度和完整性检查。建立索引是一项技术性要求高的工作。一般在数据库设计阶段的与数据库结构一道考虑。应用系统的性能直接与索引的合理直接有关。下面给出建立索引的方法和要点。
§3.5.1 建立索引
1. CREATE INDEX命令语法:

 
CREATE INDEX
CREATE [unique] INDEX [user.]index
ON [user.]table (column [ASC | DESC] [,column
[ASC | DESC] ] ... )
[CLUSTER [scheam.]cluster]
[INITRANS n]
[MAXTRANS n]
[PCTFREE n]
[STORAGE storage]
[TABLESPACE tablespace]
[NO SORT]
Advanced

 
其中:
   schema ORACLE模式,缺省即为当前帐户
   index 索引名
   table 创建索引的基表名
   column 基表中的列名,一个索引最多有16列,long列、long raw
              列不能建索引列
   DESC、ASC 缺省为ASC即升序排序
   CLUSTER 指定一个聚簇(Hash cluster不能建索引)
   INITRANS、MAXTRANS 指定初始和最大事务入口数
   Tablespace 表空间名
   STORAGE 存储参数,同create table 中的storage.
   PCTFREE 索引数据块空闲空间的百分比(不能指定pctused)
   NOSORT 不(能)排序(存储时就已按升序,所以指出不再排序)

 
 
2.建立索引的目的:

 
建立索引的目的是:
l 提高对表的查询速度;
l 对表有关列的取值进行检查。

 
但是,对表进行insert,update,delete处理时,由于要表的存放位置记录到索引项中而会降低一些速度。
注意:一个基表不能建太多的索引;
      空值不能被索引
      只有唯一索引才真正提高速度,一般的索引只能提高30%左右。

 
   Create index ename_in on emp (ename,sal);

 
例1:商场的商品库表结构如下,我们为该表的商品代码建立一唯一索引,使得在前台POS收款时提高查询速度。
Create table good(good_id number(8) not null,/* 商品条码 */
                   Good_desc varchar2(40), /* 商品描述 */
                   Unit_cost number(10,2) /* 单价 */
                   Good_unit varchar2(6), /* 单位 */
                   Unit_pric number(10,2) /* 零售价 */
                   );

 
注:提高查询速度的方法还有在表上建立主键,主键与唯一索引的差别
在于唯一索引可以空,主键为非空,比如:

 
Create table good(good_id number(8) primary key,
                    Good_desc Varchar2(40),
                    Unit_cost number(10,2),
                    Good_unit char(6),
                    Unit_pric number(10,2)
                   );

 
§3.5.2 修改索引
对于较早的Oracle版本,修改索引的主要任务是修改已存在索引的存储参数适应增长的需要或者重新建立索引。而Oracle8I及以后的版本,可以对无用的空间进行合并。这些的工作主要是由管理员来完成。

 
简要语法结构如下,更详细的语法图见电子文档《Oracle8i Reference 》 中的 Alter index.

 
ALTER [UNIQUE] INDEX [user.]index
[INITRANS n]
[MAXTRANS n] 
REBUILD 
[STORAGE n]

 
其中:
REBUILD 是 根据原来的索引结构重新建立索引,实际是删除原来的索引后再重新建立。

 
提示:DBA经常用 REBUILD 来重建索引可以减少硬盘碎片和提高应用系统的性能。

 
例:
alter index pk_detno rebuild storage(initial 1m next 512k);

 
ALTER INDEX emp_ix REBUILD REVERSE;

 
 
Oracle8i 的新功能可以对索引的无用空间进行合并,它由下面命令完成:

 
ALTER INDEX . . . COALESCE;

 
例如:

 
ALTER INDEX ename_idx COALESCE;

 
§3.5.3 删除索引
当不需要时可以将索引删除以释放出硬盘空间。命令如下:

 
DROP INDEX [schema.]indexname

 
例如:

 
sql> drop index pk_dept;

 
注:当表结构被删除时,有其相关的所有索引也随之被删除。

 
§3.6 新索引类型
Oracle8i为了性能优化而提供新的创建新类型的索引。这些新索引在下面介绍:

 
§3.6.1 基于函数的索引
基于函数的索引就是存储预先计算好的函数或表达式值的索引。这些表达式可以是算术运算表达式、SQL或PL/SQL函数、C调用等。值得注意的是,一般用户要创建函数索引,必须具有GLOBAL QUERY REWRITE和CREATE ANY INDEX权限。否则不能创建函数索引,看下面例子:

 
例1:为EMP表的ename 列建立大写转换函数的索引idx :

 
CREATE INDEX idx ON emp ( UPPER(ename));

 
这样就可以在查询语句来使用:

 
SELECT * FROM EMP WHERE UPPER(ename) LIKE ‘JOH%’;

 
例2:为emp 的工资和奖金之和建立索引:
1) 查看emp 的表结构:
SQL> desc emp
 Name Null? Type
 ----------------------------------------- -------- ------------------
 EMPNO NOT NULL NUMBER(4)
 ENAME VARCHAR2(10)
 JOB VARCHAR2(9)
 MGR NUMBER(4)
 HIREDATE DATE
 SAL NUMBER(7,2)
 COMM NUMBER(7,2)
 DEPTNO NUMBER(2)

 
2)没有授权就创建函数索引的提示:

 
SQL> create index sal_comm on emp ( (sal+comm)*12, sal,comm)
 2 tablespace users storage(initial 64k next 64k pctincrease 0);
create index sal_comm on emp ( (sal+comm)*12, sal,comm)
                                          *
ERROR at line 1:
ORA-01031: insufficient privileges

 
3) 连接到DBA帐户并授权:

 
SQL> connect sys/sys@ora816
Connected.
SQL> grant GLOBAL QUERY REWRITE to scott;

 
Grant succeeded.

 
SQL> grant CREATE ANY INDEX to scott;

 
Grant succeeded.

 
 
4)在连接到scott帐户,创建基于函数的索引:

 
SQL> connect scott/tiger@ora816
Connected.
SQL> create index sal_comm on emp ( (sal+comm)*12, sal,comm)
 2 tablespace users storage(initial 64k next 64k pctincrease 0);

 
Index created.

 
1)在查询中使用函数索引:

 
SQL> select ename,sal,comm from emp where (sal+comm)*12 >5000;

 
ENAME SAL COMM
---------------------- ---------------- ----------------
ALLEN 1600 300
WARD 1250 500
MARTIN 1250 1400
TURNER 1500 0
    赵元杰 1234.5 54321

 
§3.6.2 反向键索引
反向键索引通过反向键保持索引的所有叶子键上的插入分布。有时,可用反向键索引来避免不平衡的索引。对于反向键索引可以进行下面操作:
l 通过在ALTER INDEX命令后加REBUILD NOREVERSE或REBUILD REVERSE子句来使索引边为反向键索引或普通索引;
l 采用范围扫描的查询不能使用反向键索引;
l 位图索引不能反向;
l 索引编排表不能反向。

 
例1:创建一个反向键索引:
CREATE INDEX i ON t (a,b,c) REVERSE;

 
例2:使一个索引变为反向键索引:
ALTER INDEX i REBUILD NOREVERSE;

 
 
§3.6.3 索引组织表
与普通的索引不一样,索引组织表(Index_Organized Table)是根据表来存储数据,即将索引和表存储在一起。这样的索引结构表(Index_organized table—IOT)的特点是:对表数据的改变,如插入一新行、删除某行都引起索引的更新。
索引组织表就象带一个或多个列所有的普通表一样,但索引组织表在B-树索引结构的叶节点上存储行数据。通过在索引结构中存储数据,索引组织表减少了总的存储量,此外,索引组织表也改善访问性能。
由于表中的行与B_树索引存放在一起,每个行都没有ROWID,而是用主键来标识。但是Oracle会“猜”这些行的位置并为每个行分配逻辑的ROWID。此外,你可以为这样的表建立第二个索引。

 
创建索引结构表也是用CREATE TABLE 命令加ORGANIZATION INDEX关键字来实现。但是,这样的表在创建完后,你还必须为该表建立一个主键。

 
例子:
CREATE TABLE IOT_EXPAMPLE
(
Pk_col1 number(4),
Pk_col2 varchar2(10),
Non_pk_col1 varchar2(40),
Non_pk_col2 date,
CONSTRAINT pk_iot PRIMARY KEY
                 ( pk_col1, pk_col2)
)
ORGANIZATION INDEX
TABLESPACE INDEX
STORAGE( INITIAL 1M NEXT 512K PCTINCREASE 0 );

 
 
 
索引组织表有些限制:
l 不能使用唯一约束;
l 必须具有一个主键;
l 不能建立簇;
l 不能包含LONG类型列;
l 不支持分布和复制。
提示:如果建立了索引组织表,则会在DBA_TABLES中的IOT_TYPE和IOT_NAME列上记录有索引组织表的信息。

 
例1.修改索引结构表 docindex 的索引段的INITRANS参数:

 
ALTER TABLE docindex INITRANS 4;

 
例2.下面语句加一个的溢出数据段到索引组织表 docindex中:

 
ALTER TABLE docindex ADD OVERFLOW;

 
例3.下面语句为索引组织表 docindex的溢出数据段修改INITRANS参数:

 
ALTER TABLE docindex OVERFLOW INITRANS 4;

 
 
 
============================================================================================================
适当的使用索引可以提高数据检索速度,可以给经常需要进行查询的字段创建索引

 
oracle的索引分为5种:唯一索引,组合索引,反向键索引,位图索引,基于函数的索引

 
创建索引的标准语法:

 
CREATE INDEX 索引名 ON 表名 (列名) 

 
     TABLESPACE 表空间名; 

 
创建唯一索引:

 
CREATE unique INDEX 索引名 ON 表名 (列名) 

 
     TABLESPACE 表空间名; 

 
创建组合索引:

 
CREATE INDEX 索引名 ON 表名 (列名1,列名2) 

 
     TABLESPACE 表空间名; 

 
创建反向键索引:

 
CREATE INDEX 索引名 ON 表名 (列名) reverse

 
     TABLESPACE 表空间名; 

 
 
 
查看文章    
oracle 查看索引类别以及查看索引字段被引用的字段方法2008年01月04日 星期五 13:20查看索引个数和类别

 
select * from user_indexes where table='表名' ;

 
查看索引被索引的字段

 
 
SQL>select * from user_ind_columns where index_name=upper('&index_name');

 
PS:

 
查看某表的约束条件

 
 
SQL>select constraint_name, constraint_type,search_condition, r_constraint_name 
from user_constraints where table_name = upper('&table_name'); 

 
SQL>select c.constraint_name,c.constraint_type,cc.column_name 
from user_constraints c,user_cons_columns cc 
where c.owner = upper('&table_owner') and c.table_name = upper('&table_name') 
and c.owner = cc.owner and c.constraint_name = cc.constraint_name 
order by cc.position;

 
查看视图的名称

 
 
SQL>select view_name from user_views;

索引碎片问题

索引分为B树索引和位图索引。我们主要研究B树索引,B树索引如下图(图片源自网络):

  索引是与表相关的一个可选结构,在逻辑上和物理上都独立于表数据,索引能优化查询,不能优化DML,oracle自动维护索引,频繁的DML操作反而会引起大量的索引维护。

  如果sql语句仅仅访问被索引的列,那么数据库只需从索引中读取数据,而不会读取表;如果该语句还要访问未被索引的列,那么数据库会使用rowid来查找表中的行,通常,为检索表数据,数据库以交换方式先读取索引块,然后读取对应的表。

  索引的目的是减少IO,

大表,返回的行数<5%
经常使用where子句查询的列
离散度高的列
更新键值代价低
逻辑AND、OR效率高
查看索引建在哪表哪列
select * from user_indexes;
select * from user_ind_columns;
索引的使用
唯一索引
create unique index empno_idx on emp(empno);
一般索引
create index empno_idx on emp(empno);
组合索引
create index job_deptno_idx on emp(job,deptno);
函数索引:查询时必须用到这个函数才会使用到。
create index fun_idx on emp(lower(ename));
。。。
索引问题
查看执行计划:set autotrace traceonly explain;

  索引碎片问题:由于基表做DML操作,导致索引表块的自动更改操作,尤其是基表的delete操作会引起index表的index_entries的逻辑删除,注意只有当一个索引块中的全部index_entry都被删除了,才会把这个索引块删除,索引对基表的delete、insert操作都会产生索引碎片问题。

  在oracle文档中并没有清晰的给出索引碎片的量化标准,oracle建议通过segment advisor(片段顾问)解决表和索引的碎片问题(后面的课程会提及),如果你想自行解决,可以通过查看 index_stats视图,当以下三种情形之一发生时,说明积累的碎片应该整理了(经验之谈)

height >= 4 (概述中图示索引树的高度是3)
pct_used < 50%
del_lf_rows/lf_row > 0.2
-------------------------------------------------------------------------------
Oracle解决索引碎片功能
我们开始时向一个空的带索引的表中插入大量数据后,是不会产生碎片问题的,但是,数据库经过很长一段时间的增删改查后,难免会出现碎片问题,影响数据库的性能,Oracle对于这一问题有自己的解决方案。

下面介绍解决这一问题的方案:

首先要对索引进行分析:analyze index ind_1 validate structure;  ind_1为你自己建立的索引

分析后查询几个主要的参数判断是否需要整理碎片:select name,HEIGHT,PCT_USED,DEL_LF_ROWS/LF_ROWS from index_stats;



这里主要通过几个标准来判断是否需要整理碎片:

1.HEIGHT>=4

2.PCT_USED<50%

3.DEL_ROWS/LF_ROWS>0.2

如果查询到的值符合以上三种情况的任意一种,就说明我们需要进行碎片整理工作了

碎片整理语句:alter index ind_1 rebuild [online] [tablespace name];

一般情况下都是要加上online参数的,不必加tablespace name。

以上就是对Oracle解决索引碎片功能的理解。

不是因为有了机遇才去争取,而是因为争取了才会遇到机遇
-------------------------------------------------------------------------------------
背景说明:

       今天查阅书籍时,偶然间发现“在对某个索引行执行删除操作时,只是为该行增加了一个删除标记,这个索引行并不会释放它的存储空间,Insert产生的新的索引行也不能被插入到该位置。索引列的修改过程其实是将对应的列值删除,然后再插入新的列值(与数据行本身的修改是不一致的,这也正是我们尽量不使用修改频繁的列来创建索引的原因)。所以,无论是插入、修改、删除,都需要消耗存储空间,增大B-Tree索引结构的深度,影响数据的查询速度。尤其是删除和修改,不仅造成了存储空间的浪费,而且增加了扫描索引块的数量”,这就是所谓的索引碎片问题,建议定期对经常使用的表执行检查和重建索引操作。

问题重现:

      经测试,收集统计信息等操作,无法释放索引删除块所占用的存储空间。

analyze table tkk29 compute statistics;

select t.index_name, t.distinct_keys, t.num_rows, t.sample_size, t.last_analyzed 
      , t.blevel, t.leaf_blocks, t.* 
from user_indexes t 
where t.table_name = upper('tkk29');

tkk2901

 

delete from tkk29 
where mod(trunc((sysdate-createddate) * 24 * 60), 2) = 0;

analyze table tkk29 compute statistics;

analyze index IDX_tkk29_PARTICIPANT validate structure;

select t.name, t.blocks, t.lf_rows, t.del_lf_rows, t.lf_rows - t.del_lf_rows as lf_rows_used 
       , to_char((t.del_lf_rows/t.lf_rows) * 100, '999.999') as ratio, t.* 
from index_stats t
----------------------------------------------------------------------------------

猜你喜欢

转载自blog.csdn.net/Leon_Jinhai_Sun/article/details/86407689