数据库《TianleSoftware Oracle 学习手册》看看有哪些你不知道的

一、 Oracle 基础知识

1.1 Oracle OLAP 与 OLTP 介绍
数据处理大致可以分成两大类:联机事务处理 OLTP(on-line transaction
processing)、联机分析处理 OLAP(On-Line Analytical Processing)。
(1)OLTP 是传统的关系型数据库的主要应用,主要是基本的、日常的事务处
理,例如银行交易。OLTP 系统强调数据库内存效率,强调内存各种指标的命令
率,强调绑定变量,强调并发操作;
(2)OLAP 是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,
并且提供直观易懂的查询结果。OLAP 系统则强调数据分析,强调 SQL 执行市
场,强调磁盘 I/O,强调分区等。
OLTP 与 OLAP 之间的比较:
在这里插入图片描述
1.1.1 什么是 OLTP
OLTP,也叫联机事务处理(Online Transaction Processing),表示事务性非常
高的系统,一般都是高可用的在线系统,以小的事务以及小的查询为主,评估其
系统的时候,一般看其每秒执行的 Transaction 以及 Execute SQL 的数量。在这样
的系统中,单个数据库每秒处理的 Transaction 往往超过几百个,或者是几千个,
Select 语句的执行量每秒几千甚至几万个。典型的 OLTP 系统有电子商务系统、
银行、证券等,如美国 eBay 的业务数据库,就是很典型的 OLTP 数据库。
OLTP 系统最容易出现瓶颈的地方就是 CPU 与磁盘子系统。
(1)CPU 出现瓶颈常表现在逻辑读总量与计算性函数或者是过程上,逻辑
读总量等于单个语句的逻辑读乘以执行次数,如果单个语句执行速度虽然很快,
但是执行次数非常多,那么,也可能会导致很大的逻辑读总量。设计的方法与优
化的方法就是减少单个语句的逻辑读,或者是减少它们的执行次数。另外,一些
计算型的函数,如自定义函数、decode 等的频繁使用,也会消耗大量的 CPU 时
间,造成系统的负载升高,正确的设计方法或者是优化方法,需要尽量避免计算
过程,如保存计算结果到统计表就是一个好的方法。
(2)磁盘子系统在 OLTP 环境中,它的承载能力一般取决于它的 IOPS 处理能力. 因为在 OLTP 环境中,磁盘物理读一般都是 db file sequential read,也就是
单块读,但是这个读的次数非常频繁。如果频繁到磁盘子系统都不能承载其 IOPS
的时候,就会出现大的性能问题。
OLTP 比较常用的设计与优化方式为 Cache 技术与 B-tree 索引技术,Cache
决定了很多语句不需要从磁盘子系统获得数据,所以,Web cache 与 Oracle data
buffer 对 OLTP 系统是很重要的。另外,在索引使用方面,语句越简单越好,这
样执行计划也稳定,而且一定要使用绑定变量,减少语句解析,尽量减少表关联,
尽量减少分布式事务,基本不使用分区技术、MV 技术、并行技术及位图索引。
因为并发量很高,批量更新时要分批快速提交,以避免阻塞的发生。
OLTP 系统是一个数据块变化非常频繁,SQL 语句提交非常频繁的系统。对
于数据块来说,应尽可能让数据块保存在内存当中,对于 SQL 来说,尽可能使
用变量绑定技术来达到 SQL 重用,减少物理 I/O 和重复的 SQL 解析,从而极
大的改善数据库的性能。
这里影响性能除了绑定变量,还有可能是热快(hot block)。 当一个块被多
个用户同时读取时,Oracle 为了维护数据的一致性,需要使用 Latch 来串行化用
户的操作。当一个用户获得了 latch 后,其他用户就只能等待,获取这个数据块
的用户越多,等待就越明显。 这就是热快的问题。 这种热快可能是数据块,也
可能是回滚端块。 对于数据块来讲,通常是数据库的数据分布不均匀导致,如
果是索引的数据块,可以考虑创建反向所以来达到重新分布数据的目的,对于回
滚段数据块,可以适当多增加几个回滚段来避免这种争用。
1.1.2 什么是 OLAP
OLAP,也叫联机分析处理(Online Analytical Processing)系统,有的时候也
叫 DSS 决策支持系统,就是我们说的数据仓库。在这样的系统中,语句的执行
量不是考核标准,因为一条语句的执行时间可能会非常长,读取的数据也非常多。
所以,在这样的系统中,考核的标准往往是磁盘子系统的吞吐量(带宽),如能
达到多少 MB/s 的流量。
磁盘子系统的吞吐量则往往取决于磁盘的个数,这个时候,Cache 基本是没
有效果的,数据库的读写类型基本上是 db file scattered read 与 direct path
read/write。应尽量采用个数比较多的磁盘以及比较大的带宽,如 4Gb 的光纤接
口。
1.1.3 在 OLAP 系统中,常使用分区技术、并行技术
分区技术在 OLAP 系统中的重要性主要体现在数据库管理上,比如数据库加
载,可以通过分区交换的方式实现,备份可以通过备份分区表空间实现,删除数
据可以通过分区进行删除,至于分区在性能上的影响,它可以使得一些大表的扫
描变得很快(只扫描单个分区)。另外,如果分区结合并行的话,也可以使得整
个表的扫描会变得很快。总之,分区主要的功能是管理上的方便性,它并不能绝对保证查询性能的提高,有时候分区会带来性能上的提高,有时候会降低。
并行技术除了与分区技术结合外,在 Oracle 10g 中,与 RAC 结合实现多节
点的同时扫描,效果也非常不错,可把一个任务,如 select 的全表扫描,平均地
分派到多个 RAC 的节点上去。
在 OLAP 系统中,不需要使用绑定(BIND)变量,因为整个系统的执行量
很小,分析时间对于执行时间来说,可以忽略,而且可避免出现错误的执行计划。
但是 OLAP 中可以大量使用位图索引,物化视图,对于大的事务,尽量寻求速
度上的优化,没有必要像 OLTP 要求快速提交,甚至要刻意减慢执行的速度。
绑定变量真正的用途是在 OLTP 系统中,这个系统通常有这样的特点,用户
并发数很大,用户的请求十分密集,并且这些请求的 SQL 大多数是可以重复使
用的。
对于 OLAP 系统来说,绝大多数时候数据库上运行着的是报表作业,执行基
本上是聚合类的 SQL 操作,比如 group by,这时候,把优化器模式设置为 all_rows
是恰当的。 而对于一些分页操作比较多的网站类数据库,设置为 first_rows 会更
好一些。 但有时候对于 OLAP 系统,我们又有分页的情况下,我们可以考虑在
每条 SQL 中用 hint。 如:
Select /*+first_rows(10) / a. from table a;
1.1.4 分开设计与优化
在设计上要特别注意,如在高可用的 OLTP 环境中,不要盲目地把 OLAP 的
技术拿过来用。
如分区技术,假设不是大范围地使用分区关键字,而采用其它的字段作为
where 条件,那么,如果是本地索引,将不得不扫描多个索引,而性能变得更为
低下。如果是全局索引,又失去分区的意义。
并行技术也是如此,一般在完成大型任务时才使用,如在实际生活中,翻译
一本书,可以先安排多个人,每个人翻译不同的章节,这样可以提高翻译速度。
如果只是翻译一页书,也去分配不同的人翻译不同的行,再组合起来,就没必要
了,因为在分配工作的时间里,一个人或许早就翻译完了。
位图索引也是一样,如果用在 OLTP 环境中,很容易造成阻塞与死锁。但是,
在 OLAP 环境中,可能会因为其特有的特性,提高 OLAP 的查询速度。MV 也是
基本一样,包括触发器等,在 DML 频繁的 OLTP 系统上,很容易成为瓶颈,甚
至是 Library Cache 等待,而在 OLAP 环境上,则可能会因为使用恰当而提高查
询速度。
对于 OLAP 系统,在内存上可优化的余地很小,增加 CPU 处理速度和磁盘
I/O 速度是最直接的提高数据库性能的方法,当然这也意味着系统成本的增加。
比如我们要对几亿条或者几十亿条数据进行聚合处理,这种海量的数据,全
部放在内存中操作是很难的,同时也没有必要,因为这些数据快很少重用,缓存
起来也没有实际意义,而且还会造成物理 I/O 相当大。 所以这种系统的瓶颈往
往是磁盘 I/O 上面的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
以上内容太多,小编就不一一详细介绍了,希望大家能够仔细品读这篇优质作品,得之,幸之,会让自己提升一个台阶的。
如果大家需要这篇【Java EE 互联网轻量级框架整合开发】技术文档的话,就可以转发此文关注小编,私信小编“学习”得到获取方式吧

发布了41 篇原创文章 · 获赞 1 · 访问量 2855

猜你喜欢

转载自blog.csdn.net/Ppikaqiu/article/details/103413537