计算机三级知识点总结

2019年根据自己做的题，总结出的易错知识点。
第一套

外模式/模式映像保证了数据与程序的逻辑独立性。模式/内模式映像提供了物理独立性
数据库系统的三级模式结构是由外模式、模式和内模式三级构成。模式也称逻辑模式，是数据库中全体数据的逻辑结构和特征描述，是所有用户的公共数据视图，它是数据库系统的中间层。外模式是数据库用户能够看见和使用的局部数据的逻辑结构和特征描述，是数据库用户的数据视图。内模式是数据物理结构和存储方式的描述，是数据在数据库内部的表示方式。为了能够在系统内部实现这3个抽象层次的联系和转换，数据库管理系统在这三级模式之间提供了两层映像：外模式/模式映像、模式/内模式映像。这两层映像分别保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。
关系模式描述关系的静态结构，它是静态、稳定的，而关系是动态、随用户对数据库的操作而变化的。注意区分关系模式和关系的区别
UML（结构图（静态建模）和行为图（动态建模））设计范畴，所有活动有关判断的部分要用菱形表示。
补充：
业务流程：活动图，起始点为不带圈黑点，有且只有一个;结束点为带圈黑点，可以有多个。
系统需求：用例图，系统：长方框表示，系统名写在方框上或者方框里;
角色：人或者其他实体，角色之间的通用化关系用带空心三角形的直线表示
用例：一个完整的功能，所有动作的集合。
系统结构：1.类图：属性，操作，关系
2.顺序图（浏览顺序是从上到下）：对象间的通信用对象生命线间的水平消息表示，消息的箭头说明消息的类型如同步，异步或简单。
通信图：顺序图和通信图都描述的是交互，顺序图强调的是时间，而通信图强调的是空间。
微观设计：1.对象图：某一特定的时间点上，系统存在的所有对象的一个快照
2.状态机图：描述有关事件或者对象的状态转移
3.时间图：一张时间图最少有一张状态图，时间图作为状态图的辅助说明。
宏观设计：1.包图：表达不同的包，命名空间或者不同的项目彼此间的关系。包：盘符;
命名空间：文件夹;子系统：源代码。低耦合，高内聚。
2.交互概述图：把不同类型的图联系起来，控制活动图为基础，主要元素与活动图完全一样，唯一不同的是交互框，用来取代活动图中的活动框。
3.复合结构图：主要元素是部件，描述外部系统关系。
系统实现：1.组件图：表示系统的静态实现图，展现了一组组件之间的组织和依赖，用于对源代码的发布，物理数据库等的系统建模。
2.部署图：描述系统中硬件和软件的物理配置情况和系统体系结构。
复制数据库文件的方法。复制数据库的方法有：①使用复制数据库向导在服务器之间复制或移动数据库。②还原数据库备份，若要复制整个数据库，可以使用BACKUP和RESTORE Transact-SQL语句。通常，还原数据库的完整备份用于因各种原因将数据库从一台计算机复制到其他计算机。
UNIQUE是对创建的表的属性约束条件，与位置无关。
唯一性约束与主键约束：主键约束不能为空，唯一性则可以，相同的就是都不允许重复。
用户定义的完整性可以用CHECK短语指定列值应满足的条件，也可以用触发器约束，通过服务器自动激活相应的触发器，对数据进行完整性控制。所以触发器或CHECK约束都可以实现。但DEFAULT约束不能实现用户自定义的完整性，只能表示实体或参照完整性。
触发器的应用场合：
完成比check更复杂的约束
保证数据库性能而维护的非规范化的数据
实现复杂的商业规则
评估修改前后的表状态，并根据其差异采取对策
db_datawriter角色可以对表中的数据执行插入、删除和更新操作。U1用户属于此角色中的成员，其继承了db_datewriter角色的插入、删除和更新操作权限。
注意区分数据监控分析和数据库备份
SQL Server中的角色与权限管理：
服务器角色：
bulkadmin:可以运行BULK INSERT语句，为执行大容量插入到数据库的域账号设计
dbcreator:可以创建，更改，删除和还原任何数据库，不仅适用于助理DBA，也适用于开发人员
diskadmin:用于管理磁盘文件，比如镜像数据和添加备份设备，适合助理DBA
processadmin:多进程处理，这个角色可以结束进程。
public:两大特点：第一，初始状态时没有权限。第二，所有数据库用户都是它的成员
securityadmin:这个角色将管理登录名和属性，可以授权，拒绝和撤销服务器/数据库级权限，可以重置登录名和密码。
serveradmin:更改服务器范围的配置选项和关闭服务器
setupadmin:为需要管理连接服务器和控制启动的存储过程的用户而设计
sysadmin:在SQL Server中可以执行任何操作
数据库角色：
1.db_accessadmin:可以在数据库中添加和删除数据库用户, 组及角色
2.db_backupoperator:可以备份数据库
3.db_datareader 可以读取任何表中的数据
4.db_datawriter 可以添加、更改或删除所有表中的数据
5.db_ddladmin 可以添加、更改或删除数据库对象(即可以执行任何DDL语句)
6.db_denydatareader 不能读取任何表中的数据,但仍然可以通过存储过程来查看
7.db_denydatawriter 不能更改任何表中的数据,但仍然可以通过存储过程来修改
8.db_owner 执行任何操作
9.db_securityadmin 可以更改数据中的权限和角色
10.public:每个数据库用户都属于public角色.未对用户授权之前,该用户将被授予public角色的权限.该角色不能被删除
文件备份主要是对数据库中数据文件的备份，不对日志文件备份，因此在备份完成之后必须再对日志进行备份。
系统故障是指造成系统停止运转的任何事件，使得系统要重新启动。注意区分系统故障，介质故障（物理设备的损坏），人为的攻击破坏
分布式数据库相关：
在分布式数据库查询中，导致数据传输通信代价大的主要原因是各个站点分片间的连接和并操作
分布式数据库中的分布透明性包括分片透明性、位置透明性、局部数据模型透明性，其中分片透明性是最高层次的透明性。
分布式数据库的目标是本地自治、非集中式管理、高可用性、位置独立性、数据分片独立性等
分布式数据库的事务管理包括恢复控制和并发控制，恢复控制一般采用的策略是基于两阶段提交协议
分布式数据库：数据分片和数据分配（先数据分片，再数据分配）
数据分布策略：
分布式数据库中数据分布策略可以从数据分片和数据分配两个角度来考虑，一般先进行数据分片，再进行数据分配。
分片：
数据的水平分片是在关系中从行（元组）的角度依据一定条件划分为不同的片断，关系中的每一行必须至少属于一个片断，以便在需要时可以重构关系。
水平分片：行（元组）角度，每行至少属于一个片段，重构关系
垂直分片：列（属性）角度，片段包含主码属性，通过连接方法恢复关系
导出分片：依据其他关系属性的条件
分配：
集中式：数据片段安排在一个场地，数据集中，负载重可靠性差。
分割式：一份全局数据，分片段，每个放置不同位置，对局部数据控制灵活，但对全局数据的存储效率低
全复制式：全局数据有多个副本，每个场地都有一个完整的副本。可靠高，速度快，数据冗余大，同步维护复杂。
混合式：全局数据被分成若干个数据子集，每个子集安排一个或者多个场地，但是每个场地未必保存所有数据。灵活性大，效率较高。
数据挖掘，分类算法，分类器，聚类算法
数据仓库是为了构建新的分析处理环境而出现的一种数据存储和组织的新技术
数据仓库有若干基本特征，包括不可更新性和随时间变化性。所谓不可更新性就是用户在提取仓库中的数据进行分析时并不会同时对数据仓库中的数据进行更新操作，而随时间变化性是数据仓库每隔一段时间进行数据的更新和处理。

第二套

系统的实现和部署阶段：编写相关脚本完成数据库结构;将用户原有数据按照新的数据结构导入到新的系统中;会进行应用系统编码和编码测试，可以使用白盒或者黑盒测试。
存储管理器：负责检查用户是否具有数据访问权限；为了提高数据访问效率，存储管理器会将部分内存用于数据缓冲，同时使用一定的算法对内存缓冲区中的数据块进行置换；以事务方式管理用户对数据的访问，以确保数据库并发访问的正确性。
查询处理器：为编译好的查询语句生成执行计划，并根据执行计划访问相关数据。
函数依赖研究一个关系中属性之间的依赖关系
三级模式结构提供了数据独立性，即当数据的逻辑结构和存储结构发生变化时，应用程序不受影响。
有符号Bigint从-263到263-1的整型数据，存储大小为8个字节；有符号int是从-231到231-1的整型数据，存储大小为4个字节；有符号Smallint是从-215到215-1的整型数据，无符号smallint从0到216-1，存储大小为2个字节；Tinyint从0到255的整型数据，存储大小为 1 字节。
前型触发器：INSTEAD OF;后型触发器：FOR或者AFTER
当用CHECK进行约束条件限制时，若其只涉及对某一列的约束则可以放在该列后面，如果是约束条件中涉及两列或两列以上，则为对整个数据表的约束，放在表的最后面。
当用户的权限与其所在的角色的权限发生冲突时，以角色的权限为标准。
视图在sql语句相同的情况下不能够提高效率
当事务T对某个数据加上排它锁时，T可以对该数据进行读和写，其他任何事务都不能再对该数据加任何类型的锁，直到T释放该锁才行；当事务T对某个数据加上共享锁，则T只能对该数据进行读操作，不能修改数据，且其它事务也可以对该数据加共享锁但不能加排它锁。只有等到该数据没有被其他任何事务访问时才能加排它锁。
照片存储到数据库后，多个用户同时对照片的访问受到了很大的限制，所以，同一时间的高并发访问对数据库的要求极高
主索引是根据数据对象的主键建立的索引，它们决定了被索引记录的位置，而辅助索引没有这样的限制，可以用于任何索引目的并且可以查找多个数据文件存放的位置。而位图索引一般在范围查询时使用。
在进行数据恢复时，首先恢复完全备份，其次恢复差异备份，最后恢复日志备份。备份日志时使用Norecovery用来备份尾日志，这样备份日志的时候数据库处于恢复状态，别的进程就不能再访问数据库，日志就不会再增加，因此在还原的时候就可以正常恢复。还原备份的时候如果想同时还原之后的日志，必须加上Norecovery才可以还原，如果有多个日志备份，除了最后一个日志备份外，还原其他日志也必须加上Norecovery。
master数据库是SQL Server系统里面最重要的数据库，因为它包含了系统中的有关数据库的所有信息。对master数据库只能进行完全数据库备份操作，SQL Server不支持在master数据库上进行差异备份、事务日志备份以及文件备份
并行数据库系统的主要目的是通过高速通信介质连接多个可独立处理的单元以并行执行的方式完成对数据库系统的互联查询、内部查询及各种内部操作。分布式数据库系统的主要目的才是实现场地自治和数据全局透明共享。
将总表按分店号与时间划分成不同的子表，属于多维划分
UML图形中组件图的用途是显示系统中的软件对其他软件组件（例如，库函数）的依赖关系，它可以在一个非常高的层次上显示，从而仅显示粗粒度的组件，也可以在组件包层次上显示。
自连接是SQL语句中经常要用的连接方式，使用自连接可以将自身表的一个镜像当作另一张表来对待，从而能够得到一些特殊的数据。简而言之，自连接的本意就是将一张表看成多张表来做连接。
IDENTITY：建立标识列
索引建立的代码
现希望U1在该数据库服务器上具有系统管理员权限，EXEC sp_addsrvrolemember ′U1′, ‘sysadmin’
三级加锁协议也称为三级封锁协议,它保证正确地调度事务的并发操作,是事务对数据库对象加锁、解锁必须遵守的一种规则。在运用X锁和S锁对数据对象加锁时，还需要约定一些规则，例如何时申请X锁或S锁、持锁时间、何时释放等。
对于故障发生前已提交的事务（既有BEGIN Transaction，又有commit）做redo操作，对于故障发生时尚未完成的事务（只有BEGIN Transaction，而没有commit或rollback）做undo操作。

第三套

模式/内模式保证了数据库中数据与应用程序间的物理独立性，而外模式/模式保证了数据与应用程序间的逻辑独立性。
视图是从一个或几个基本表（或视图）中导出的虚表，数据库中只存放了视图的定义，不存放视图对应的数据。它是原始数据库数据的一种变换，是查看表中数据的另外一种方式。可以将视图看成是一个移动的窗口，通过它可以看到感兴趣的数据。视图是从一个或多个实际表中获得的，这些表的数据存放在数据库中。那些用于产生视图的表叫做该视图的基表。一个视图也可以从另一个视图中产生。视图的特点体现在三个方面：①简单性，看到的就是需要的。视图不仅可以简化用户对数据的理解，也可以简化对它们的操作。那些被经常使用的查询可以被定义为视图，从而使得用户不必为以后的操作每次指定全部的条件；②安全性，通过视图用户只能查询和修改他们所能见到的数据。数据库中的其它数据则既看不见也取不到；③逻辑数据独立性，视图可帮助用户屏蔽真实表结构变化带来的影响；根据视图的特点可以达到以下的几点作用：①简化数据查询语句；②使用户从多角度看待同一数据；③提高数据安全性；④提供了一定程度的逻辑独立性。
建立数据仓库不是简单的把企业的各种应用集中在一起，而是利用企业信息系统生成的数据，以面向主题、集成的方式合理组织数据，解决数据分析应（非易失的且随时间变化的）
将关系模式转换为具体DBMS平台支持的关系表是数据库物理设计阶段的工作。设计视图和关系模式的完整性约束是数据逻辑设计阶（设计和优化关系模式）段的工作。
数据库应用系统的需求包括：数据需求分析，数据处理需求分析，业务需求分析及其在性能、存储、安全、备份和恢复等方面的要求。
数据需求分析的主要工作是从用户视图出发，分析与辨识应用领域所管理的各类数据项和数据结构，形成数据字典的主要内容。
需求分析阶段，系统需求分析员与用户充分沟通，并形成文档化的需求描述。
通过需求分析过程，需要系统的描述整个应用系统的功能特征、性能特征和约束，并形成需求规范说明文档。
数据操作响应时间、系统吞吐量和最大并发用户数都是性能需求分析的重要指
ORDER BY 语句用于对结果集进行排序：①ORDER BY 语句用于根据指定的列对结果集进行排序；②ORDER BY 语句默认按照升序对记录进行排序。ORDER BY可以对多个列进行排序，此时的排序是嵌套的；ORDER BY语句只能作为其他子句之后的最后一个子句出现；视图中也可以使用ORDER BY语句；子查询语句中是不能使用ORDER BY子句的（因为order by只能对最终结果进行排序）。
在保证数据库一致性的前提下，将频繁操作的多个可以分割的处理过程放在多个存储过程中，这样可以大大提高系统的响应速度。使用游标会占用较多的系统资源，尤其对于大规模并发量的情况下，很容易使得系统资源耗尽而崩溃，而使用临时表能够加速查询。相关子查询的不可以加速查询。
聚合关系强调是“整体”包含“部分”，但是“部分”可以脱离“整体”而单独存在。比如上图中汽车包含了发动机，而发动机脱离了汽车也能单独存在。UML中聚合关系用带空心菱形和箭头的直线表示
组合关系与聚合关系见得最大不同在于：这里的“部分”脱离了“整体”便不复存在。在UML类图中，组合关系用一个带实心菱形和箭头的直线表示。
Driver的drive方法只有传入了一个Car对象才能发挥作用，因此我们说Driver类依赖于Car类。在UML类图中，依赖关系用一条带有箭头的虚线表示。
继承关系对应的是extend关键字，在UML类图中用带空心三角形的直线表示，如下图所示中，Student类与Teacher类继承了Person类。

这种关系对应implement关键字，在UML类图中用带空心三角形的虚线表示。如下图中，Car类与Ship类都实现了Vehicle接口。
分割表增加了维护数据完整性的代价。分割表分为水平分割表和垂直分割表两种。水平分割表：一种是当多个过程频繁访问数据表的不同行时，水平分割表，并消除新表中的冗余数据列；另一种是当主要过程要重复访问部分行时，最好将被重复访问的这些行单独形成子集表（冗余储存），这在不考虑磁盘空间开销时显得十分重要，但在分割表以后，增加了维护难度，要用触发器立即更新、或用存储过程及应用代码批量更新，这也会增加额外的磁盘I/O开销。垂直分割表（不破坏第三范式）：一种是当多个过程频繁访问表的不同列时，可将表垂直分成几个表，减少磁盘I/O（每行的数据列少，每页存的数据行就多，相应占用的页就少），更新时不必考虑锁，没有冗余数据。缺点是在插入或删除数据时要考虑数据的完整性，用存储过程维护。另一种是当主要过程反复访问部分列时，最好将这部分被频繁访问的列数据单独存为一个子集表（冗余储存），这在不考虑磁盘空间开销时显得十分重要，但因此增加了重叠列的维护难度，要用触发器立即更新、或用存储过程及应用代码批量更新，这也会增加额外的磁盘I/O开销。垂直分割表可以达到最大化利用Cache的目的。水平分割后，查询数据需要使用UNION操作。垂直分割后，查询数据需要JOIN操作
结构图是指以模块的调用关系为线索，用自上而下的连线表示调用关系并注明参数传递的方向和内容，从宏观上反映模块层次结构的图形。其中结构图包括用例图、类图、组件图、对象图和部署图。
常见的数据挖掘任务包括分类、估计、预测、相关性分组或关联规则、聚类和描述、可视化以及复杂数据类型挖掘(Text、 Web、图形图像、视频和音频等)等。分类分析首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分类模型，对于没有分类的数据进行分类。该需求要求根据购书记录将用户映射到倾向于喜欢某种书的顾客特性中，而分类挖掘模型能把数据库中的数据项映射到给定类别的某一个中。
关系表在逻辑上由一系列元组组成，元组由多个属性组成。每个元组可以用数据库磁盘文件中的一个逻辑记录来存储，记录包括多个域。元组的每个属性对应于文件记录中的一个域。
相当于一个元组用一个逻辑记录，一个属性用一个域
C/S 架构是一种典型的两层架构，其全称是Client/Server，即客户端/服务器端架构。其客户端包含一个或多个在用户的电脑上运行的程序。而服务器端有两种，一种是数据库服务器端，客户端通过数据库连接访问服务器端的数据，另一种是Socket服务器端，服务器端的程序通过Socket与客户端的程序通信。C/S 架构也可以看做是胖客户端架构，因为客户端需要实现绝大多数的业务逻辑和界面展示。C/S的客户端一般需要单独开发。在这种架构中，作为客户端的部分需要承受很大的压力，因为显示逻辑和事务处理都包含其中，需要通过与数据库的交互（通常是SQL或存储过程的实现）来达到持久化数据，以此满足实际项目的需要。

B/S架构的全称为Browser/Server，即浏览器/服务器结构。Browser指的是Web浏览器，极少数事务逻辑在前端实现，但主要事务逻辑在服务器端实现。Browser客户端、WebApp服务器端和DB数据库服务端构成所谓的三层架构。B/S架构的系统无须特别安装，有Web浏览器即可。B/S架构中，显示逻辑交给了Web浏览器，事务处理逻辑则放在了WebApp上，这样就避免了庞大的胖客户端，减少了客户端的压力，因为客户端包含的逻辑很少，因此也被称为瘦客户端。B/S架构中，客户端只需安装WEB浏览器即可，且应用业务规则一般是WEB服务器端实现的。
15. RecordSet 对象用于操作来自提供者的数据。使用 ADO 时，通过 RecordSet 对象可对几乎所有数据进行操作，所有 RecordSet 对象均使用记录（行）和字段（列）进行构造。RecordSet的常用方法为：①AddNew，创建一条新记录；②Cancel，撤销一次执行；③Close，关闭一个 RecordSet；④Delete，删除一条记录或一组记录；⑤MoveNext，把记录指针移动到下一条记录。RecordSet对象的AddNew方法的功能是在对应的数据库表中增加一条新记录。
16. 在SQL Server 2008中，只有创建某个临时表的连接中才能查询当前临时表的数据，并当U1创建的该表的连接还未断开时，才能访问这个表的数据。
17. 稀疏索引是指如果只是一部分查找码的值有对应的索引记录，则该索引为稀疏索引；稠密索引是指如果数据文件中的每一个查找码值在索引文件中都对应一个索引记录，则该索引为稠密索引。对于数据文件和它的一个特定的索引文件，如果数据文件中的数据记录的排列顺序与索引文件中索引项的排列顺序相一致，或者说，索引文件按照其查找码指定的顺序与数据文件中数据记录的排列顺序相一致，则该索引文件称为聚集索引，否则为非聚集索引
18. 两段锁协议是指所有事务必须分两个阶段对数据项加锁和解锁：①在对任何数据进行读、写操作之前，要申请并获得对该数据的封锁；②在释放一个封锁之后，事务不再申请和获得其它任何封锁。可以证明，若并发执行的所有事务均遵守两段锁协议，则对这些事务的任何并发调度策略都是可串行化的。

另外要注意两段锁协议和防止死锁的一次封锁法的异同之处。一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁，否则就不能继续执行，因此一次封锁法遵守两段锁协议。但两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁，因此遵守两段锁协议的事务可能发生死锁。
加锁阶段事务可以申请获得任何数据项上的任何类型的锁，但是不允许释放任何锁。
在解锁阶段，事务可以释放在任何数据项上任何类型的锁，但是不能再申请任何锁
每个事务开始执行后就进入了加锁阶段
19. 数据仓库不是用做日常查询，也不是汇总和统计，而主要用于提取数据中的潜在信息和知识
OLAP仍使用DBMS存取数据
20. 分布式数据库系统按不同层次提供的分布透明性有：分片透明性、位置透明性、局部数据模型透明性。其中分片透明性是分布式数据库中最高层次的分布透明性，位于全局概念模型和分片模型之间。用户编写程序只须对全局关系进行操作，不必考虑数据的分片及存储场地。当分片模式改变时，只须改变全局概念到分片模式的映象，而不会影响全局概念模式和应用程序，即实现了分片透明性。
21. 操作型数据对性能要求较高、无冗余。决策支持系统（Decision Support System）是一个基于计算机用于支持业务或组织决策活动的信息系统
操作型数据和DSS型数据特征有如下说法：
操作型数据更新频率高，DSS型数据一般不更新
操作型数据是详细的，DSS型数据是综合的
操作型数据处理需求事先可知，DSS型数据处理需求事先不明确
22. 数据仓库有四个特点：①面向主题，操作型数据库的数据组织面向事务处理任务，各个业务系统之间各自分离，而数据仓库中的数据按照一定的主题域进行组织。主题是一个抽象概念，是指用户使用数据仓库进行决策时所关心的重点方面，一个主题通常与多个操作型信息系统相关；②集成的，面向事务处理的操作型数据库通常与某些特定的应用相关，数据库之间相互独立，并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的，必须消除源数据中的不一致性，以保证数据仓库内的信息是关于整个企业的一致的全局信息；③稳定的，操作型数据库中的数据通常实时更新，数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用，所涉及的数据操作主要是数据查询，一旦某个数据进入数据仓库以后，一般情况下将被长期保留，也就是数据仓库中一般有大量的查询操作，但修改和删除操作很少，通常只需要定期的加载、刷新；④反映历史变化，操作型数据库主要关心当前某一个时间段内的数据，而数据仓库中的数据通常包含历史信息，系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息，通过这些信息，可以对企业的发展历程和未来趋势做出定量分析和预测。
23. 事务是构成数据库应用中一个独立逻辑工作单元的操作的集合，也是访问并可能更新数据库中各种数据项的一个程序执行单元。数据库系统通过执行各种事务实现对数据库数据的操作，管理和执行事务是DBMS的基本功能。事务的四大特性为：①原子性；②一致性；③隔离性；④持久性。事务调度则是为了保证事务的此四大特性。调度分为串行调度和并发调度。串行调度的特点是一个事务的所有操作都执行完后才开始执行另一事务，不存在事务操作的交叉执行；不同事务操作的交叉执行称为并发调度，DBMS交叉执行来自多个事务的各个操作，以提高数据库系统的性能。并发调度中不同的事务的操作可以交叉执行。
24. 某些情况下，需要把数字数据类型显示为相应的文本名称，这就碰到了多表连接建立记录集的问题。多表连接的类型主要有left join、right join和inner join。其主要区别如下：①left join(左联接)，返回包括左表中的所有记录和右表中联结字段相等的记录；②right join(右联接)，返回包括右表中的所有记录和左表中联结字段相等的记录；③inner join(等值连接)，只返回两个表中联结字段相等的行。因此本题采用inner join，结果集将返回包括table_1和table_2都满足条件的行。
25. 事务日志是一个与数据库文件分开的文件。它存储对数据库进行的所有更改，并记录全部插入、更新、删除、提交、回退和数据库模式变化等操作。事务日志是数据备份和数据恢复的重要文件，也是使用 SQL Remote 或［复制代理］复制数据所必需的。
26. 在UML模型中，通信图是交互图的一种，也被称作协作图。它是表达对象之间的联系以及对象间发送和接收消息的图。
27. 堆文件也称为无序文件。在堆文件中，记录随机地存储在文件物理空间中，新插入的记录存储在文件的末尾。
28. 数据仓库的数据来自多种数据源。不同的数据源可能由不同的平台开发，使用不同的数据库管理系统，数据格式也可能不同。源数据在被装载到数据仓库之前，需要进行一定的数据转换。数据转换的主要任务是对数据粒度以及不一致的数据进行转换。
29. 对数据库系统的监控分为手动监控机制和自动监控机制两种。
30. 重点理解关系范式
31. 索引视图

  第四套

fetch的功能是通过Transact-SQL服务器游标检索特定的行，具体语法是：fetch 参数行数 from 游标名
next:紧跟当前行返回结果行，并且当前行递增为返回行。如果fetch next为对游标的第一次操作，则返回结果的第一行。默认为next
prior:搜索返回紧邻当前行前面的结果行，并且当前行递减为返回行。如果fetch prior为对游标的第一次提取操作，则没有行返回并且游标置于第一行之前。
first:返回游标中的第一行为结果行
last：返回游标中的最后一行并将其作为当前行搜索
absolute n/nvar:如果n或者nvar为正，则返回从当前行开始向后的第n行，并将返回的行作为当前行。如果为负，则返回从当前行开始向前的第n行，并将返回的结果作为当前行。如果为0则不反回行。
relative n/nvar:如果为正，则返回从当前行开始向后的第n行，并将返回结果作为当前行。如果为负，则返回从当前行向前的第n行，并将返回结果作为当前行。如果为0，则返回当前行。在第一次提取的时候，将n或者nvar设置为负数或者0时，则不反回行。
创建唯一聚簇索引：unique clustered
创建唯一非聚簇索引：unique nonclustered
分布式数据库的分片类型:
水平分片：按照一定的条件把全局关系的所有元组划分成若干不相交的子集，每个子集都是关系的一个片段
垂直分片：把全局关系的属性集若干子集，并且在这些自己上做投影运算，每个投影成为垂直分片
导出分片：导出水平分片，水平分片的条件不是本关系属性的条件，而是其他关系属性的条件。
混合分片：以上三种方法的混合。
常用的数据挖掘方法：分类（事先知道类型），回归分析，聚类，关联规则，特征，变化和偏差分析，web页挖掘。
SQL Server主要采用发布，分布，订阅的方式来处理复制。复制技术包括：快照复制，事务复制，合并复制
快照复制：发布服务器会定时向订阅服务器传送数据，如果订阅服务器修改过数据，定时传递后订阅服务器的数据修改会全部丢失，全部以发布服务器为准。
事务复制：发布服务器会定时检查数据是否有修改过，如果有则向订阅服务器传送数据（记录行级）
合并复制：发布服务器和订阅服务器可以独立修改，会定时合并。
需求分析主要包括数据需求分析、数据处理需求分析、功能需求分析（数据处理需求分析与业务规则需求分析）、性能需求分析和其它需求分析。
①数据处理需求分析：从对数据组织与存储的设计角度，辨识应用领域所管理的各类数据项和数据结构，与数据处理需求分析结果一起，组成数据字典，形成"数据规范说明书"。
②功能需求分析：功能需求分析主要针对DBAS应具有的功能进行分析，是DBAS需求分析的核心环节，总体上可分为数据处理需求分析与业务规则需求分析。数据处理需求分析从数据访问和处理的角度，明确对各数据项所需要进行的数据访问操作。在系统规划与分析阶段，DBAS开发者已经明确了各类用户视图。因此数据处理需求分析阶段可以从这些视图出发，针对每个用户视图进行数据处理需求分析，然后汇总各个视图的分析结果得到对系统的完整分析结果。故选择A项。
③性能需求分析：性能需求则描述了系统应当做到什么程度，分析DBAS应具有的性能指标。
④其他需求分析包括：存储需求、安全性需求等。
a.存储需求分析：存储需求分析是指估计DBAS系统需要的数据存储量，如DB所存储的数据总量。
b.安全需求分析：主要用于数据库安全设计，避免被非法使用和攻击。
顺序图是用来描述对象自身及对象间信息传递顺序的视图。
活动图主要用于描述系统、用例和程序模块中逻辑流程的先后执行次序、并行次序。
类图是展现一组类、接口和协作以及它们之间的关系的一种静态视图
协作图是交互图的一种，其中包含一组对象、对象之间的联系以及对象间发送和接收的消息
状态图主要用来描述一个实体在发生一些事件时的状态变化情况，用于展示该实体处于不同状态时对不同事件做出响应后的状态变化情况
count()函数用于统计元组的个数或者某个字段的个数，SUM()则用来计算某个字段的总和。
前型触发器是在引发该触发器执行的操作语句执行之前激活的触发器，后触发器就是在语句执行之后激活的触发器
自主存取控制：
通过GRANT（授予），REVOKE(收回)，DENY（拒绝）来实现的
权限的种类：
1.数据库管理系统进行维护的权限
2.数据库的对象和数据进行操作的权限：语句权限和执行权限
3.隐含权限：用户自动具有的权限，不能被更改
强制存取控制：
将全部实体划分成主体（DBMS所管理的实际用户，代表用户的各个进程）和客体（受主体操纵的，包括文件，基本表，索引，视图）两大类。
主体对客体的存取必须遵循如下规则：
仅当主体的许可证级别大于或者等于客体的密级时，主体才能读取相应的客体
主体等于客体时，才能进行写操作
检查点：最大限度的减少了数据库完全恢复时所必需的执行的日志部分。
记录的内容：检查点时刻所有正在执行的事物清单
这些事务最近一个日志记录的地址
重新开始文件用来记录各个检查点记录在日志文件中的地址
在检查点建立的同时，数据库管理系统会将当前数据缓冲区的所有数据记录写入数据库中
主-备方式（Active-Standby方式）即指的是一台服务器处于某种业务的激活状态（即Active状态），另一台服务器处于该业务的备用状态（即Standby状态)。该方式的特点是当Active状态服务器出现故障的时候，通过软件诊断将Standby机器激活，保证系统在最短时间内恢复正常使用。
公有网络为客户端和数据库服务器连接的网络，私有网络为两台数据库服务器之间检测的网络。接管的资源：共享存储资源，服务器ip地址。
异常情况：作为心跳检测的私有网络出现故障，备用服务器就会启动接管过程，强行接管服务器的IP地址和共享存储。叫做“脑裂”
缺点：备用服务器长期处于standby状态，计算资源浪费严重。运行服务器和备用服务器之间的切换本质上可以认为是数据库重新启动的过程，所有数据库的连接就会中断，并且重新启动会需要一段时间。
双主机方式（Active-Active方式）即指两种不同业务分别在两台服务器上互为主备状态（即Active-Standby和Standby-Active状态），优点是两台服务器切换速度快，数据库连接不中断，应用不受影响。
快照：该方法通过对当前数据表进行"照相"，记录当前的数据表信息"相片"，然后将当前的"相片"与以前的数据表"相片"进行比较，如果不一致将通过一定的方式传到数据仓库，从而实现数据的一致性，这种方式适合于更新频率较低的数据表。
大容量日志恢复模式：在包含最小化日志操作的日志记录的日志备份，是不能恢复数据库到特定时间点的。另外，如果运行的是最小化日志模式，有尾日志会备份失败的特殊情形，当数据库运行在大容量日志模式里，在事务日志里活动部分存在的记录和数据文件会因灾难而不可用（例如磁盘故障）。
数据库物理设计阶段的主要活动有：确定存储结构，存取路径的选择和调整，确定数据存放的位置和确定存储分配。
数据库备份与恢复设计属于数据库日常维护活动
DFD的主要组成包括外部实体（外部项），处理过程，数据存储和数据流。
外部实体是指系统之外又和系统有联系的人或者事物，说明了数据的外部来源和去处。
处理是指对数据逻辑处理，也就是数据变换，用来改变数据值
数据流：用箭头表示数据的流向
数据存储：表示用数据库的形式（或者文件的形式）存储数据，对其进行的存取分别以指向或者离开数据存储的箭头表示。
用例之间的关系包括：扩展，使用，组合
索引视图是存储一个查询结果的数据库对象。
事务内部故障可以分为预期和非预期的，非预期的事务内部故障包括：运算溢出故障，并发事务死锁故障，违反了某些完整性限制而导致的故障
在并行数据库中，无共享结构被认为是支持并行数据库系统结构的最好并行结构，适用于银行出纳之类的应用。
共享结构：每个处理机拥有独立的主存储器和磁盘
数据挖掘作为知识发现的过程，一般由三个阶段组成：数据准备，数据挖掘，结果的解释和评估
因为很少用到商品描述属性，系统在查询时也就很少查询。因此可以将其分割，这样虽然破坏了表的整体性，却可以将系统得到优化。
增加冗余列是指在多个表中增加具有相同语义的列，它常用来在查询时避免连接操作，值得一提的是，主码和外码在多表中重复出现不属于冗余列，这里指得冗余列是非关键字字段在多表的中的出现。
由于表的连接操作是比较费时的，如果在表中增加冗余列，则在行上执行查询操作时不需要进行表的连接操作，从而提高了查询效率。
一个聚集是一组表，可将经常一起使用的具有同一公共列值的多个表中的数据行存储在一起。对于经常频繁一起查询的表，使用聚集比较方便。
通常在运行Order By和Group By语句时会涉及到排序的操作，尤其是对大型的表进行重复的排序，会引起磁盘很大的开销。而散列文件的优点是：文件随机存放，记录不需进行排序；插入、删除方便；存取速度快；不需要索引区，节省存储空间。因此带有Order By和Group By的表可以使用散列文件存储，提高查询效率。
第五套
瀑布模型是基于严格的、明确的需求作为软件系统开发基础的软件开发模型；快速原型模型是一种快速开发方法，其指导思想是不必把前期各阶段的活动做得尽善尽美后才启动下阶段的活动；螺旋模型是将瀑布模型的系统化与快速模型的可修改性结合起来，引入风险评估活动
IDEF0:
顺序图的第一个消息一般在左边第一个对象的生命线顶端，然后其他消息按时间顺序相继加入顺序图中，后面发生的消息的线应该比前面发生的消息的线画得低些，以表示它们之间的时间关系。
顺序图的横向矩形框代表对象，水平消息线用于表示对象间通信。
顺序图可以用来描述对象的创建和销毁。
顺序图中的虚线称作“生命线”，表示一个对象在其时间周期内的存在。
desc降序排列，系统默认是升序
sp_addrolemember语句的作用是为固定数据库角色添加成员。
①create role R1语句是添加用户角色R1；
②create user U1语句是添加用户U1；
③grant INSERT on T to R1语句是授权用户R1在表上T具有insert（插入）权限；
④sp_addrolemember ‘R1’, 'U1’是将用户U1添加到R1角色中；⑤sp_addrolemember ‘db_datareader’, 'U1’是将用户U1添加到db_datareader角色中，db_datareader的角色具有查询数据库中所有用户数据的角色；
⑥deny SELECT on T to R1作用是不允许角色R1在表上T上具有查询的功能。
由步骤④、⑤和⑥知道，U1属于R1角色，而R1不能查询T1
SQL Server 2008支持三种恢复模式:简单恢复模式、完整恢复模式和大容量日志恢复模式。简单恢复模式只用于测试和开发数据库，或用于主要包含只读数据的数据库（如数据仓库），这种模式并不适合生产系统。大容量日志恢复模式一般只作为完整恢复模式的附加模式，该模式不支持时点恢复。
分片透明性是最高级别的透明性，位于全局概念模式与分片模式之间。局部数据模型透明性位于分配模式与局部概念模式之间
无共享结构通过最小化共享资源来降低资源竞争的概率，具有很高的扩展性，适合OLTP应用。B项错误。
共享磁盘结构比共享内存结构具有更大的优势，访问内存不再会产生冲突，但这种结构是通过互联网实现各个处理器之间的信息和数据交换，会产生一定的通信代价。C项错误。
分布式数据库系统的主要目的是实现场地自治和数据全局透明共享。D项错误。
故答案为A项。层次结构可以分为两层，顶层是无共享结构，底层是共享内存或共享磁盘结构
OLTP:联机事务处理环境，一般需要处理大量事务，且执行事务的内容比较简单且重复率高
OLAP:用于复杂的分析操作，侧重对决策人员和高层管理人员的决策支持。
在数据库事务概要设计阶段，使用read和write原语来表达存取操作
用例图用于描述系统与外部系统的交互
公用表表达式：with 公用表表达式标识符（列表1…列表n）AS(select 语句)
删除存储过程：drop proc
将视图sales.V定义为索引视图：create unique clustered index idx on sales.V(…)
分布式数据库管理系统由局部数据库管理系统，全局数据库管理系统，全局数据字典，通信管理四部分组成
数据从操作型环境转移到数据仓库过程中所用到的ETL工具通常需要完成的处理操作包括抽取，转换和装载
对sql语句进行性能优化属于数据库运行管理与维护
create function goods_prifit(@year)
returns @totle table
(
商品号 varchar(50),
销售总额 int
)
as
begin
insert into @totle
select a.商品号，sum(a.单价*b.销售数量) from 商品表 a join 销售变 b on a.商品号=b.商品号 where year(销售时间)=@year
group by a.商品号
return
end
数据库复制技术：
优点：能满足数据的一致性，因为利用数据库快照复制技术，可以将相关表分发给另一台服务器，可以满足数据的一致性。数据库的更新可以采用自动更新和手动更新方式。更新时间可以在建立分发数据库时设置，设置时间小于1分钟。通过这种方式可以满足用户体验。数据库的分发只在软件层面进行，对于已经建好的发布和订阅可以直接用delete按钮删除，然后进行重新设置，可扩展性强。
缺点：曾加了一台服务器的开销
存放网站系统的服务器被设置为发布服务器，另外一台服务器可以作为分发服务器和订阅服务器。发布服务器以事务复制的方式向分发服务器发送信息。客户端通过订阅服务器获取数据，实现信息同步更新。这种方式不会影响网站系统服务器的运行，又能保证客户端可以随时刷新信息。
建立索引是加快查询速度的有效手段。使用create index,一般格式为：
create [unique] index<索引名> on <表名>（<列名>[<次序>]，<列名>[<次序>]，）include (属性名) where 约束条件
区分数据库维护工作中的数据库备份和数据库监控
传统的索引（有序索引，树索引，聚集）都是建立在比较的基础上，在结构中查找记录时需要进行一系列与关键字的比较。理想情况是不希望经过任何比较，一次存取就能查到所有记录，则散列（哈希）索引可以办到。
文件备份（文件备份，差异文件备份）主要是对数据库中的数据文件的备份，不对日志文件备份。数据库备份（完整数据库备份，差异数据库备份）会对日志文件进行备份。
数据库系统的故障：事务内部故障，系统故障，介质故障，计算机病毒故障。
数据水平分片，关系中每一行至少属于一个片段，需要时可以重构关系。
数据垂直分片，个片段应该包含关系的主码，以便通过连接的方法恢复关系
分布式数据库可以从数据分片和数据分配两个角度考虑，一般先进行数据分片，再进行数据分配。
数据集中分配，便于控制，但数据过于集中，负载过重，已形成瓶颈，可靠性差
数据定义语言经过DDL编译处理后，存放在数据库的数据字典中。
数据字典：数据项，数据结构，数据流，处理
DFD四种基本元素：数据流，处理，数据存储，外部项
数据模型三要素：数据结构，数据操作，完整性约束
具有创建数据库权限：
exec sp_addsrvrolemember ‘log1’ ‘dbcreator’
采用事务等待图来检测死锁
并行数据服务器体系结构：共享和无共享。无共享：每个站点都要实现全局数据目录，每个站点有独立的内存和磁盘对应该站点的服务器。
第六套
DFD建模中，数据流用箭头表示，处理用矩形框表示，外部项用圆角框或者平行四边形框表示
一个数据库只能有一个主数据文件，可以有多个次要数据文件，主数据文件和次要数据文件可以放在相同的磁盘上，也可以分开放置。一个数据文件只能是一个文件组成员。日志文件和数据文件可以放在相同的磁盘上，也可以放在不同的磁盘上。
db_datawriter:具有插入，删除和更新数据库中所有用户数据的权限
db_accessadmin:添加和删除数据库用户的权限
db_backupoperator:备份和恢复数据库的权限
db_owner:具有创建数据库对象的权限
数据监控分析包括对数据库架构体系的监控（空间基本信息，空间使用率和剩余空间大小，空间是否具有自动扩展功能等）和对数据库性能的监控（数据缓冲区命中率，库缓冲，用户锁，锁与等待，回滚段，临时短的使用情况，索引的使用情况，等待时间和共享池）。监控分析的对象是数据库而不是数据库系统。
索引建立的原则：
经常在查询中作为条件的属性
表中数据大量更新后重建相关索引
频繁进行分组或者排序的属性建立索引
一个列的值范围很大应建立索引
如果排序的列有多个，应建立复合索引
RAID1比RAID5具有更好的写操作性能，所以在例如数据库系统日志文件的存储这样的应用中使用广泛。对于经常使用读操作而很少使用写操作的的应用，RAID5是首选。
全局外模式：全局应用在用户视图，即终端用户看到的逻辑上并未分布的表，视图等
全局概念模式：描述全体数据的逻辑结构和特征
分片模式：描述每个数据片段以及全局关系到片段的印象，是分布式数据库系统中全局数据的逻辑划分视图
分配模式：描述各片段到物理存放场地的映像
局部概念模式：描述全局关系在场地上存储的物理片段的逻辑结构和特征
局部内模式：描述局部概念模式涉及到的数据在本地的物理存储
在UML中，通信图主要是用于描述对象在空间中如何交互，即除了动态交互，它也直接描述了对象是如何连接在一起的。在图中没有时间轴，将消息按序编号
具有查询全部用户表数据权限的数据库角色的是：db_datareader
可以再查询语句中加入 FOR XML 子句实现以XML格式返回查询结果
局部数据模型透明性处于分配模式和局部概念模式之间，使用户在编写程序是不但要了解全局数据的分片情况，还要了解个片段的副本复制情况以及各副本的场地位置分配情况，但是不需要了解各场地上数据库的数据模型
分布式数据库的数据分配：
集中式，分割式（全局数据只有一份），全复制式（全局数据有多分），混合式

计算机三级知识点总结

猜你喜欢