Oracle 数据库介绍


 
概要:

1、 ORACLE 实例——包括内存结构与后台进程
2、 ORACLE 数据库——物理操作系统文件的集合
3、 了解内存结构的组成
4、 了解后台进程的作用
5、 了解数据库的物理文件
6、 解释各种逻辑结构
 
一、ORACLE实例

1、ORACLE 数据库

一般来说,Oracle把一系列物理文件,如数据文件(Data file)、控制文件(Control file)、联机日志(Redo log file)、参数文件(Spfile or pfile)等物理结构及与之对应的逻辑结构,如表空间(Tablespace)、段(Segment)、块(Block)等组成的集合,称为数据库(Database)。

2、ORACLE 实例

于此对应,Oracle内存结构和后台进程被做成数据库的实例(Instance),一个实例最多只能安装(Mount)或打开(Open)在一个数据库上,负责数据库的相应操作并与用户交互。一般情况下,一个数据库对应一个实例,但是在特定的情况下,如OPS/RAC的情况下,一个数据库可以对应到多个实例。

3、Oracle内存结构

Oracle内存结构主要可以分共享内存区与非共享内存区,共享内存区主要由SGA(System Global Area)组成,非共享内存区主要由PGA(Program Global Area)组成。

4、系统全局区System Global Area(SGA) 

系统全局区(SGA, System Global Area)其实是一块巨大的共享内存区域,包含了Oracle的数据缓冲及众多的控制结构。他被看做是Oracle 数据库的一个大缓冲池,这里的数据可以被Oracle的各个进程共用,如果有互斥的操作,如锁定一个内存对象,则需要通过Latch与Enqueue来控制。

每个Oracle实例(instance)只能启动一个SGA,除非通过RAC等一些特殊的全局管理方式,否则不同的实例只能访问自己的SGA区域。

其大小可以通过如下语句查看:

SQL> select * from v$sga;
NAME VALUE
-------------------- ---------
Fixed Size 39816
Variable Size 259812784
Database Buffers 1.049E+09
Redo Buffers 327680
更详细的信息可以参考V$sgastat、V$buffer_pool


Fixed Size,包括了一些数据库与实例的控制信息、状态信息、字典信息等,启动的时候就固定在SGA中,而且不会改变。

Variable Size,包含了shared pool,large pool,java pool,streams pool,游标区和其他结构等。

Database buffers,有时候也叫Data buffer,它是数据库中数据块缓冲的地方,数据块在内存中就缓存在这里。所以,在OLTP环境中,Data buffer是SGA中最大的缓存区,是数据库性能高低的关键所在。

Redo buffers,它是为了加快日志写进程的速度而设立的缓存区,在一般的OLTP环境中,因为提交很频繁,所以一般不会很大。


SGA主要包括以下几个部分:

a、 共享池(Shared pool)

共享池是SGA中最关键的内存片段,特别是在性能和可伸缩性上。由初始化参数shared_pool_size决定其大小,一个太小的共享池会扼杀性能,使系统停止,太大的共享池也会有同样的效果,将会消耗大量的CPU来管理这个共享池。不正确的使用共享池只会带来灾难。

注意:在实际的高可用环境中,有很大的一部分故障就是因为共享池的原因而导致系统停顿甚至宕机的,如Latch争用、Ora-0431错误、Library cache争用与等待。

共享池又可以分为SQL语句缓冲区(Library Cache)、数据字典缓冲区(Data Dictionary Cache)及一些控制结构。而数据字典缓冲区与控制结构是用户无法直接控制的,所以,真正与用户有关的其实就是SQL语句缓冲区。

1)SQL语句缓冲(Library Cache)

当一个用户第一次提交一个SQL语句,Oracle会将这句SQL进行硬解析(Hard parse),这个过程
类似于程序编译,会耗费相对较多的时间,因为他要分析语句的语法与语义,获得最佳的执行计划(sql plan),并在内存中分配一定的空间来保存该语句与相对应的执行计划等信息。

Oracle会把他的分析结果给保存在Shared pool的Library Cache中。因为Oracle总是保存语句的执行信息,当数据库第二次或者多次执行该SQL时,Oracle自动跳过这个硬分析过程,变为软分析(Soft parse)或快速软分析(Fast soft parse),从而减少系统分析的时间,减少CPU与Latch的消耗。这也是为什么第一次运行的SQL 比第二次运行的SQL要慢一点的原因。

注意:Oracle中只有完全相同的语句,包括大小写、空格、换行都要求一样,才能重复使用
以前的分析结果与执行计划。







所以,如果大量的、频繁访问的SQL语句都不采用绑定变量,Oracle为了做SQL的硬分析,Share latch将变得严重争用与等待,同样也会耗费大量的CPU,直到机器的资源耗尽。另外,因为Oracle会从共享池中分配空间来保存刚做完硬分析的SQL语句,也将耗费大量的内存空间,而且,这些浪费的空间无法被重用。

对于编程者来说,要尽量提高语句的重用率,减少语句的分析时间,一个设计很差的应用程序可以毁掉整个数据库。

共享池采用LRU算法来决定共享池中的对象是否继续保存,因为其空间毕竟有限,不可能无限保存所有的信息。所以,假设一个语句已经被执行过了,如果长时间没有被使用,重新执行的时候,也可能面临重新分析,如果真的执行次数如此之少,就不是高可用环境要关心的啦。


下面举例说明parse的时间
SQL> select count(*) from scpass ;
COUNT(*)
----------
243
Elapsed: 00:00:00.08

这是在Share_pool 和Data buffer 都没有数据缓冲区的情况下所用的时间
SQL> alter system flush SHARED_POOL;
System altered.
清空Share_pool,保留Data buffer
SQL> select count(*) from scpass ;
COUNT(*)
----------
243
Elapsed: 00:00:00.02
SQL> select count(*) from scpass ;
COUNT(*)
----------
243
Elapsed: 00:00:00.00

从两句SQL 的时间差上可以看出该SQL 的Parse 时间约为00:00:00.02

对于保存在共享池中的SQL语句,可以从V$Sqltext、v$Sqlarea中查询到,对于编程者来说,要尽量提高语句的重用率,减少语句的分析时间。一个设计的差的应用程序可以毁掉整个数据库的Share pool,提高SQL语句的重用率必须先养成良好的变成习惯,尽量使用Bind变量。

2)数据字典缓冲区(Data Dictionary Cache)

显而易见,数据字典缓冲区是ORACLE特地为数据字典准备的一块缓冲池,供ORACLE内部使用,没有什么可以说的。

b、块缓冲区高速缓存(Database Buffer Cache)

Database buffers,有时候也叫Data buffer,它是数据库中数据块缓冲的地方,数据块在内存中就缓存在这里。所以,在OLTP环境中,Data buffer是SGA中最大的缓冲区,是数据库性能高低的关键所在。

数据缓存区(Data buffer)是Oracle中用于数据块缓冲的区域,数据库常规情况下读写(非直接读写)数据块,Undo块等,都会经过这个缓冲区,并适当地保存在缓冲区。如果下一次请求操作同样的块,则不需要从磁盘获得,大大提高了系统的响应速度。

数据缓冲区虽然不想共享池那样容易导致系统故障,但是,他却是影响OLTP系统性能的关键,因为他的Cache技术可以很大程度地避免磁盘寻道,直接从Data buffer中获得。所以,Oracle把从Data buffer获得数据块叫Cache hit,把从磁盘获得数据块叫Cache miss,他们的比率就是我们常说的Data buffer命中率。

但是在典型的OLAP环境中,大的Data buffer则不一定是必要的,因为OLAP的查询基本是要求从磁盘返回,而且以直接读写居多,直接读写是不经过数据缓冲区的,使得命中率失去意义。所以在OLAP环境中,需要考虑用更多的磁盘驱动器,OLAP的速度取决于硬盘的多少与系统的带宽。

这些缓冲是对应所有数据文件中的一些被使用到的数据块。让他们能够在内存中进行操作。在这个级别里没有系统文件,户数据文件,临时数据文件,回滚段文件之分。也就是任何文件的数据块都有可能被缓冲。数据库的任何修改都在该缓冲里完成,并由DBWR进程将修改后的数据写入磁盘。

这个缓冲区的块基本上在两个不同的列表中管理。一个是块的“脏”表(Dirty List),表示被用户修改过的数据块,采用检查点队列(checkpoint queue)来管理这些脏的数据块,必要的时候通过数据库写进程(DBWR)来写入这些脏块;另外一个队列是不脏的块的列表(Free List),一般的情况下,是使用最近最少使用(Least Recently Used,LRU)算法来管理。

块缓冲区高速缓存又可以细分为以下三个部分(Default pool,Keep pool,Recycle pool)。如果不是人为设置初始化参数(Init.ora),ORACLE将默认为Default pool。
由于操作系统寻址能力的限制,不通过特殊设置,在32位的系统上,块缓冲区高速缓存最大可以达到1.7G,在64位系统上,块缓冲区高速缓存最大可以达到10G。

c、重做日志缓冲区(Redo log buffer)

重做日志文件的缓冲区,对数据库的任何修改都按顺序被记录在该缓冲,然后由LGWR进程将它写入磁盘。
这些修改信息可能是DML语句,如(Insert,Update,Delete),或DDL语句,如(Create,Alter,Drop等)。
重做日志缓冲区的存在是因为内存到内存的操作比较内存到硬盘的速度快很多,所以重作日志缓冲区可以加快数据库的操作速度,但是考虑的数据库的一致性与可恢复性,数据在重做日志缓冲区中的滞留时间不会很长。所以重作日志缓冲区一般都很小,大于3M之后的重作日志缓冲区已经没有太大的实际意义。

d、Java程序缓冲区(Java Pool)

Java 的程序区,Oracle 8I 以后,Oracle 在内核中加入了对Java的支持。该程序缓冲区就是为Java 程序保留的。如果不用Java程序没有必要改变该缓冲区的默认大小。

e、大池(Large Pool)

大池的得名不是因为大,而是因为它用来分配大块的内存,处理比共享池更大的内存,在8.0开始引入。
下面对象使用大池:
·MTS——在SGA的Large Pool中分配UGA
·语句的并行查询(Parallel Executeion of Statements)——允许进程间消息缓冲区的分配,用来协调并行查询服务器
·备份(Backup)——用于RMAN磁盘I/O缓存

5、后台进程(Background process)

后台进程是Oracle的程序,用来管理数据库的读写,恢复和监视等工作。Server Process主要是通过他和user process进行联系和沟通,并由他和user process进行数据的交换。在Unix机器上,Oracle后台进程相对于操作系统进程,也就是说,一个Oracle后台进程将启动一个操作系统进程;在Windows机器上,Oracle后台进程相对于操作系统线程,打开任务管理器,我们只能看到一个ORACLE.EXE的进程,但是通过另外的工具,就可以看到包含在这里进程中的线程。

在Unix上可以通过如下方法查看后台进程:
ps –ef | grep ora_
# ps -ef | grep ora_ | grep XCLUAT
oracle 29431 1 0 Sep 02 ? 2:02 ora_dbwr_SID
oracle 29444 1 0 Sep 02 ? 0:03 ora_ckpt_SID
oracle 29448 1 0 Sep 02 ? 2:42 ora_smon_SID
oracle 29442 1 0 Sep 02 ? 3:25 ora_lgwr_SID
oracle 29427 1 0 Sep 02 ? 0:01 ora_pmon_SID





a、Oracle系统有 5 个基本进程他们是:

DBWR(数据文件写入进程)
LGWR(日志文件写入进程)
SMON(系统监护进程)
PMON(用户进程监护进程)
CKPT(检查点进程,同步数据文件, 日志文件,控制文件)

b、DBWR

将修改过的数据缓冲区的数据写入对应数据文件维护系统内的空缓冲区。
这里指出几个容易错误的概念:
·当一个更新提交后,DBWR把数据写到磁盘并返回给用户提交完成.
·DBWR会触发CKPT 后台进程
·DBWR不会触发LGWR 进程

上面的概念都是错误的.
DBWR是一个很底层的工作进程,他批量的把缓冲区的数据写入磁盘。和任何前台用户的进程几乎没有什么关系,也不受他们的控制。至于DBWR会不会触发LGWR和CKPT进程,我们将在下面几节里讨论。

DBWR工作的主要条件如下
·DBWR 超时
·系统中没有多的空缓冲区用来存放数据
·CKPT 进程触发DBWR 等

c、LGWR

将重做日志缓冲区的数据写入重做日志文件,LGWR是一个必须和前台用户进程通信的进程。
当数据被修改的时候,系统会产生一个重做日志并记录在重做日志缓冲区内。这个重做日志可以类似的认为是以下的一个结构:
SCN=000000001000
数据块ID
对象ID=0801
数据行=02
修改后的数据=0011
提交的时候,LGWR必须将被修改的数据的重做日志缓冲区内数据写入日志数据文件,然后再通知前台进程提交成功,并由前台进程通知用户。从这点可以看出LGWR承担了维护系统数据完整性的任务。

LGWR 工作的主要条件如下
·用户提交
·有1/3 重做日志缓冲区未被写入磁盘
·有大于1M 重做日志缓冲区未被写入磁盘
·超时
·DBWR需要写入的数据的SCN号大于LGWR 记录的SCN号,DBWR 触发LGWR写入

d、SMON

工作主要包含
·清除临时空间
·在系统启动时,完成系统实例恢复
·聚结空闲空间
·从不可用的文件中恢复事务的活动
·OPS中失败节点的实例恢复
·清除OBJ$表
·缩减回滚段
·使回滚段脱机

e、PMON

主要用于清除失效的用户进程,释放用户进程所用的资源。如PMON将回滚未提交的工作,释放锁,释放分配给失败进程的SGA资源。

f、CKPT

同步数据文件,日志文件和控制文件,由于DBWR/LGWR的工作原理,造成了数据文件,日志文件,控制文件的不一至,这就需要CKPT进程来同步。CKPT会更新数据文件/控制文件的头信息。
CKPT工作的主要条件如下
·在日志切换的时候
·数据库用immediate ,transaction , normal 选项shutdown 数据库的时候
·根据初始话文件LOG_CHECKPOINT_INTERVAL、LOG_CHECKPOINT_TIMEOUT、FAST_START_IO_TARGET 的设置的数值来确定
·用户触发

以下进程的启动需要手工配置
g、ARCH

当数据库以归档方式运行的时候,Oracle会启动ARCH进程,当重做日志文件被写满时,日志文件进行切换,旧的重做日志文件就被ARCH进程复制到一个/多个特定的目录/远程机器。这些被复制的重做日志文件被叫做归档日志文件。

h、RECO

负责解决分布事物中的故障。Oracle可以连接远程的多个数据库,当由于网络问题,有些事物处于悬而未决的状态。RECO进程试图建立与远程服务器的通信,当故障消除后,RECO进程自动解决所有悬而未决的会话。

i、服务进程Server Process

服务进程的分类
·专用服务进程(Dedicated Server Process)
一个服务进程对应一个用户进程
·共享服务进程(MultiTreaded Server Process)
一个服务进程对应多个用户进程,轮流为用户进程服务。
PGA & UGA
PGA = Process Global Area
UGA = User Global Area
他保存了用户的变量、权限、堆栈、排序空间等用户信息,对于专用服务器进程,UGA在PGA中分配。对于多线程进程,UGA在Large pool中分配。

j、用户进程User Process
在客户端,将用户的SQL 语句传递给服务进程

6、一个贯穿数据库全局的概念----系统改变号SCN(System Change Number)系统改变号,一个由系统内部维护的序列号。当系统需要更新的时候自动增加,他是系统中维持数据的一致性和顺序恢复的重要标志。
a. 查询语句不会使SCN增加,就算是同时发生的更新,数据库内部对应的SCN也是不同的。这样一来就保证了数据恢复时候的顺序。
b. 维持数据的一致性
 
二、ORACLE 数据库
 
ORACLE数据库的组成——物理操作系统文件的集合。主要包括以下几种。

1、控制文件(参数文件init.ora记录了控制文件的位置)

控制文件包括如下主要信息
·数据库的名字,检查点信息,数据库创建的时间戳
·所有的数据文件,联机日志文件,归档日志文件信息
·备份信息等
有了这些信息,Oracle就知道那些文件是数据文件,现在的重做日志文件是哪些,这些都是系统启动和运行的基本条件,所以他是Oracle运行的根本。如果没有控制文件系统是不可能启动的。控制文件是非常重要的,一般采用多个镜相复制来保护控制文件,或采用RAID来保护控制文件。控制文件的丢失,将使数据库的恢复变的很复杂。控制文件信息可以从V$Controlfile中查询获得
 
2、数据文件(数据文件的详细信息记载在控制文件中)

可以通过如下方式查看数据文件
SQL> select name from v$datafile;
NAME
---------------------------------------------
/u05/dbf/PROD/system_01.dbf
/u06/dbf/PROD/temp_01.dbf
/u04/dbf/PROD/users_01.dbf
/u09/dbf/PROD/rbs_01.dbf
/u06/dbf/PROD/applsys_indx_01.dbf
/u05/dbf/PROD/applsys_data_01.dbf

从以上可以看出,数据文件大致可以分为以下几类:

i. 系统数据文件(system_01.dbf)

存放系统表和数据字典,一般不放用户的数据,但是用户脚本,如过程,函数,包等却是保存在数据字典中的。
名词解释:数据字典
数据字典是一些系统表或视图,他存放系统的信息,他包括数据库版本,数据文件信息,表与索引等段信息,系统的运行状态等各种和系统有关的信息和用户脚本信息。数据库管理员可以通过对数据字典的查询,就可以了解到Oracle的运行状态。

ii. 回滚段文件(rbs_01.dbf)

如果数据库进行对数据的修改,那么就必须使用回滚段,回滚段是用来临时存放修改前的数据(Before Image)。
回滚段通常都放在一个单独的表空间上(回滚表空间),避免表空间碎片化,这个表空间包含的数据文件就是回滚数据文件。

iii. 临时数据文件(temp_01.dbf)

主要存放用户的排序等临时数据,与回滚段相似,临时段也容易引起表空间碎片化,而且没有办法在一个永久表空间上开辟临时段,所以就必须有一个临时表空间,它所包含的数据文件就是临时数据文件,主要用于不能在内存上进行的排序操作。
我们必须为用户指定一个临时表空间。

iv. 用户数据文件(/applsys_data_01.dbf ,applsys_indx_01.dbf)

存放用户数据,这里列举了两类常见的用户型数据,一般数据和索引数据,一般来说,如果条件许可的话,可以考虑放在不同的磁盘上。

3、重做日志文件(联机重做日志)

用户对数据库进行的任何操作都会记录在重做日志文件。在了解重做日志之前必须了解重做日志的两个概念,重做日志组和重做日志组成员(Member),一个数据库中至少要有两个日志组文件,一组写完后再写另一组,即轮流写。
每个日志组中至少有一个日志成员,一个日志组中的多个日志成员是镜相关系,有利于日志文件的保护,因为日志文件的损坏,特别是当前联机日志的损坏,对数据库的影响是巨大的。
联机日志组的交换过程叫做切换,需要特别注意的是,日志切换在一个优化效果不好的数据库中会引起临时的“挂起”。
挂起大致有两种情况:
·在归档情况下,需要归档的日志来不及归档,而联机日志又需要被重新利用
·检查点事件还没有完成(日志切换引起检查点),而联机日志需要被重新利用
解决这种问题的常用手段是:
i.增加日志组
ii.增大日志文件成员大小
通过v$log可以查看日志组,v$logfile可以查看具体的成员文件。

4、归档日志文件

Oracle可以运行在两种模式之中,归档模式和不归档模式。如果不用归档模式,当然,你就不会有归档日志,但是,你的系统将不会是一个实用系统,特别是不能用于生产系统,因为你可能会丢失数据。但是在归档模式中,为了保存用户的所有修改,在重做日志文件切换后和被覆盖之间系统将他们另外保存成一组连续的文件系列,该文件系列就是归档日志文件。
有人或许会说,归档日志文件占领我大量的硬盘空间,其实,具体想一想,你是愿意浪费一点磁盘空间来保护你的数据,还是愿意丢失你的数据呢?显而义见,我们需要保证我们的数据的安全性。其实,归档并不是一直占领你的磁盘空间,你可以把她备份到磁带上,或则删除上一次完整备份前的所有日志文件。

5、初始化参数文件

initSID.ora或init.ora文件,因为版本的不一样,其位置也可能会不一样。在8i中,通常位于$ORACLE_HOME/admin//Pfile下
初始化文件记载了许多数据库的启动参数,如内存,控制文件,进程数等,在数据库启动的时候加载(Nomount时加载),初始化文件记录了很多重要参数,对数据库的性能影响很大,如果不是很了解,不要轻易乱改写,否则会引起数据库性能下降。

6、其他文件

i . 密码文件
用于Oracle 的具有sysdba权限用户的认证.
ii. 日志文件
·报警日志文件(alert.log或alrt.ora)
记录数据库启动,关闭和一些重要的出错信息。数据库管理员应该经常检查这个文件,并对出现的问题作出即使的反应。
你可以通过以下SQL 找到他的路径select value from v$PARAMETER where name ="background_dump_dest";
·后台或用户跟踪文件
系统进程或用户进程出错前写入的信息,一般不可能读懂,可以通过ORACLE的TKPROF工具转化为可以读懂的格式。
对于系统进程产生的跟踪文件与报警日志文件的路径一样,用户跟踪文件的路径,
你可以通过以下SQL找到他的路径select value from v$PARAMETER where name ="user_dump_dest";
 
物理结构指物理文件的集合,如数据文件,联机日志、控制文件、参数文件等,而逻辑结构,则是对用户可视的逻辑对象,如表、索引,也都是逻辑对象的一种。





数据库可以包含多个表空间。

一个表空间(Tablespace)可以有多个数据文件(data file),可以存在多个段,但是一个段只能存在于一个单独的表空间。

一个段(Segment)可以分布在多个数据文件中,一个数据文件也可以存在多个段。

区间(Extent)不能跨越在多个数据文件上,一个数据文件可以包含多个区间。

一个段可以划分为多个区间。

任何一个区间都是由一系列连续的块(Block)组成的,所以一个区间包含多个数据块。


三、ORACLE逻辑结构

1、 表空间(Tablespace)

表空间是数据库中的基本逻辑结构,一系列数据文件的集合。一个表空间可以包含多个数据文件,但是一个数据文件只能属于一个表空间。

表空间是数据库中最大的逻辑存储结构,为数据库提供使用空间,其对应物理结构是数据文件,一个表空间可以包含多个数据文件,但是一个数据文件只能属于一个表空间。表空间所包含的数据文件的大小,也就决定了表空间的大小,所以,表空间也是逻辑结构连接到物理结构的一条纽带。

2、 段(Segment)

段是Oracle另外一个很重要的逻辑对象,一个段可以跨越在多个数据文件中,但是,一个段只能在一个表空间中。在一个段中,至少存在一个Extent,对于单独的Extent,必须是连续的空间,而且只能存在一个数据文件中。

段是对象在数据库中占用的空间,虽然段和数据库对象是一一对应的,但段是从数据库存储的角度来看的。一个段只能属于一个表空间,当然一个表空间可以有多个段。

表空间和数据文件是物理存储上的一对多的关系,表空间和段是逻辑存储上的一对多的关系,段不直接和数据文件发生关系。

每个段肯定都有data_object_id,因为一个段肯定属于一个表空间,所以根据data_object_id就能唯一确定该段所在的表空间,这个就是Rowid组成的基础知识。

一个段可以属于多个数据文件,关于段可以指定扩展到哪个数据文件上面。

段基本可以分为以下四种
·数据段(Data Segment)
·索引段(Index Segment)
·回滚段(Rollback Segment)
·临时段(Temporary Segment)

3、区间(Extent)

关于Extent的翻译有多种解释,有的译作扩展,有的译作盘区,我这里通常译为区间。在一个段中可以存在多个区间,区间是为数据一次性预留的一个较大的存储空间,直到那个区间被用满,数据库会继续申请一个新的预留存储空间,即新的区间,一直到段的最大区间数(Max Extent)或没有可用的磁盘空间可以申请。

在ORACLE8i以上版本,理论上一个段可以无穷个区间,但是多个区间对ORACLE却是有性能影响的,ORACLE建议把数据分布在尽量少的区间上,以减少ORACLE的管理与磁头的移动。

4、Oracle数据块(Block)

ORACLE最小的、最基本的存储单位,他是OS数据块的整数倍。ORACLE的操作都是以块为基本单位,一个区间可以包含多个块(如果区间大小不是块大小的整数倍,ORACLE实际也扩展到块的整数倍)。

数据块大小在建立数据库的时候指定,虽然在初始化文件中可见,但是不能修改。为了保证存取的速度,它是OS数据块的整数倍,Oracle的所有存储IO操作都是以块为基本单位的。

5、基本表空间介绍

a. 系统表空间

主要存放数据字典和内部系统表基表
查看数据数据字典的SQL
select * from dict
查看内部系统表的SQL
select * from v$fixed_view_definition
DBA对系统的系统表中的数据字典必须有一个很深刻的了解,他们必须准备一些基础的SQL语句,通过这些SQL可以立即了解系统的状况和数据库的状态,这些基本的SQL包括
系统的剩余空间
系统的SGA 
状态系统的等待
用户的权限
当前的用户锁
缓冲区的使用状况等
在成为DBA 的道路上我们不建议你过分的依赖于OEM/Quest 等优秀的数据库管理工具,因为他们不利于你对数据数据字典的理解,SQL语句可以完成几乎全部的数据库管理工作。
大量的读少量的写是该表空间的一个显著的特点。

b. 临时表空间.

临时表空间顾名思义是用来存放临时数据的,例如排序操作的临时空间,他的空间会在下次系统启动的时候全部被释放。

c. 回滚段表空间

i. 回滚段在系统中的作用
当数据库进行更新插入删除等操作的时候,新的数据被更新到原来的数据文件,而旧的数据(Before Image)就被放到回滚段中,
如果数据需要回滚,那么可以从回滚段将数据再复制到数据文件中。来完成数据的回滚。在系统恢复的时候,
回滚段可以用来回滚没有被commit 的数据,解决系统的一至性。
回滚段在什么情况下都是大量的写,一般是少量读,因此建议把回滚段单独出来放在一个单独的设备(如单独的磁盘或RAID),
以减少磁盘的IO争用。 
ii. 回滚段的工作方式
·一个回滚表空间可以被划分成多个回滚段.
·一个回滚段可以保存多个会话的数据.
·回滚段是一个圆形的数据模型
假设回滚段由4 个区间组成,他们的使用顺序就是区间1à区间2à区间3à区间4à区间1。
也就是说,区间是可以循环使用的,当区间4到区间1的时候,区间1里面的会话还没有结束,
区间4用完后就不能再用区间1,这时系统必须分配区间5,来继续为其他会话服务服务。
我们分析一个Update 语句的完成
①. 用户提交一个Update 语句
②. Server Process 检查内存缓冲.
如果没有该数据块的缓冲,则从磁盘读入
i. 如果没有内存的有效空间,DBWR被启动将未写入磁盘的脏缓冲写入磁盘
ii. 如果有有效空间,则读入
③. 在缓冲内更新数据
i. 申请一个回滚段入口,将旧数据写如回滚段
ii. 加锁并更新数据
iii. 并在同时将修改记录在Redo log buffer中
④. 用户提交一个Commit 语句
i. SCN增加
ii. 将Redo log buffer 写入Redo log file
iii. 返回用户Commit 完成
 
四、ORACLE核心初探
 
1、LRU 算法和数据缓冲区
我们知道Oracle 数据库的文件大小远远大于Oracle 的所拥有的内存区域SGA,LRU就是一种尽可能将常用的数据保留在内存的算法。
当数据库需要一个数据缓冲区,他会从数据库缓冲区的LRU队列的尾部找一个空闲的缓冲,将一个数据块读入,然后数据库会把这个缓冲区放到LRU 队列的中部,如果该缓冲被其他程序用到的话,那么他会往队列的头上移动,如果这个缓冲没有被其他程序用到,并且没有被修改过,那么他会慢慢的移动到LRU 队列的尾部,最终被认为是空缓冲区被其他数据块所覆盖。一旦这个缓冲区被修改过DBWR把他从LRU队列中移出,放到LRUW 队列(也叫赃缓冲区)中,等待DBWR把他们批量写入数据文件,然后再把他们的缓冲区连接到LRU队列的尾部,周而复始的工作。
理解HASH算法,为了提高速度Oracle在设计中采用了大量的HASH算法,这里我们讲一下HASH算法的理论知识,在以后的阅读中会对Oracle有更好的理解。HASH是一种以空间换取时间的做法。假如我有100万条数据,以队列的方式存储,如果我要从里面找一条数据,那么我要从头开始找,我所需要的空间是100万个存储单元,如果我用HASH的方法来存储,我把存储空间划分为1000*2000的数组,把100万个数据分别按照如下规则添入该数组:

1. 定义一个函数,使得每条数据对应一个0-999的值
2. 把该行记录存储在以函数返回值为下标的数组里
3. 我们称该函数为hash 函数f(row). hash 函数的返回值为hash 值.数组为
hash 数组HashArray[n][m].
即有下列公式
find a unused buffer in HashArray[f(row)][?]
HashArray[f(row)][?] = row;
这样,当我们需要一个行时候我们只需简单的计算该行的hash值,然后到下标为hash值的hash数组里找就可以了。
即使用最简单的方法也可以很快的找到
For (I=1;I<=2000; I ++)
If (HashArray[f(row)][I.] == row ) return;
Next
当然HASH算法还是很复杂的,这里只是一个最最简单的例子。如果大家有兴趣可以看看有关数据结构的资料,这里就不具体展开了。
 
2、LATCH(Oracle内部锁)
有许多人问我Latch和Lock 的区别,其实很简单,Latch是Oracle内部的Lock,他负责更为细小的内部读写,
比如Oracle要把用户更新的数据写入缓冲区,这时候Oracle就会在该缓冲区上加上latch,用来防止DBWR把他写出到磁盘,
因为如果没有这个Latch,DBWR会把一半新一半老没有用的数据写到磁盘上。
 
五、常见问题
 
1、实例和SID的关系是什么?

经常有人问SID 是什么?在Oracle 系统中SID 是一个经常出现的变量,如环境变量ORACLE_SID, 初始化文件initSID.ora,
那究竟什么是SID 呢?其实SID 就是Oracle 实例的标识,不同的SID 对应不同的内存缓冲(SGA)和不同的后台进程。
这样一来我们就可以得当在一台物理的服务器上可以有多个SID 的数据库实例。

2、Oracle数据库和实例的关系是什么?

数据库是由物理文件和存取数据文件的实例组成,当存取数据文件的实例是一个的时候,数据库被称做单节点数据库。
这是我们看到的最多的数据库形式。当然还有一种多节点数据库,就是一个以上的实例共同访问一个数据库(或者说共同访问一组数据文件), 更好的提供稳定性和并行处理能力。这在8i中被称为OPS(Oracle Parallel Server ),在Oracle9i 中被称为RAC(real application cluster)。在这种数据库中。两个/多个实例分别在不同服务器上,所有Oracle 数据文件在共享的磁盘阵列上,多个服务器上的实例可以同时工作,他们通过一个内部的网络进行通信。
如果一台服务器不能提供服务的话,另一台会接管它的工作,特别是在关键的业务有很大的潜力。

3、在运行的数据库中数据文件中是不是可能存在没有被提交的数据?

这是可能存在的,因为用户数据文件的数据是由DBWR写入的,DBWR是一个很底层的后台进程,不负责与用户交互。
用户的交互是由LGWR完成的。

4、在问题3中,如果存在没有写入的数据,那么机器突然断电,数据完整性会不会损坏?

不会的,因为数据库的完整性是LGWR来保证的,而且ORACLE保证了DBWR写入数据文件的任何修改已经被记录在重做日志文件中。
当系统再次启动的时候,通过读取重做日志文件就可以知道那些数据没有被提交。这时候ORACLE 会自动回滚那些数据。
所以说联机日志的损坏,特别是当前联机日志的损坏,对数据库的影响是巨大的,可能会导致数据库的不完整。

5、数据文件损坏会丢失数据吗?

可以这么说,如果你有备份和归档,就不会。因为所有对数据修改的记录都在重做日志中有记录,所以不会丢失数据,
你只要恢复以前的备份再用归档日志文件恢复和当前的在线重做日志就可以恢复所有数据。

6、在线重做日志损坏会丢失数据吗?

以上说了,在线日志对数据库的损坏是极大的,所以不仅可能丢失数据,还可能引起数据库的不同步。
在重做日志中的所有commit的记录都会丢失,这也是Oracle 为什么要对在线重做日志文件做镜像的原因。任何的数据丢失都是不允许的。

7、我在事务能不能指定不写回滚段?

不可以的,写回滚段是ORACLE保证一致性读和事务一致性的根本。回滚段是高写入段,建议把它放到单独的设备上来。
对于DDL语句,如DROP,TRUNCATE却可以不写回滚段(没有UNDO信息),所以对于整个表的删除,如果数据量比较大,建议用Truncate Table的方法。
不写联机日志也是不可能的,但可以在某些特定操作中,可以写很少的联机日志,如以NOLOGGING的方式通过Create table tablename as select创建表,或以Append的方式Insert数据到表,或直接载入等操作。
 
六、小结
 
这里,我们了解了实例和数据库的关系,一个数据库可以有多个实例,但是一个实例却不可能对应多个数据库,在一般的情况下,我们都是用的单节点数据库,即一个实例仅仅对应一个数据库。
我们了解了ORACLE实例的组成,包括内存和后台进程,进一步解释了SGA的组成与SGA的作用,并分析了语句重用的好处。
在后台进程中,重要的阐述了DBWR与LGWR,其中DBWR是一个底层的由ORACLE控制的后台进程,而LGWR负责与用户交互.
在ORACLE数据库中,我们重要阐述了数据库的物理与逻辑结构,在物理结构中,需要注意四类以下文件:控制文件,联机日志,数据文件与参数文件。在逻辑结构中,需要清楚每个逻辑结构的关系,从大到小的顺序为:表空间à段à区间à块。
最后,简单的描叙了两个ORACLE的核心内容,LRU算法与LATCH,并初步阐述了HASH算法的相关内容。有关ORACLE更多的核心内容,可以参考相关资料。






猜你喜欢

转载自maosheng.iteye.com/blog/1810155