【统计分析系统--SAS介绍】

一、SAS介绍基本介绍

SAS(全称STATISTICAL ANALYSIS SYSTEM,简称SAS)是全球最大的软件公司之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。

1976年SAS软件研究所(SAS INSTITUTE INC。)成立,开始进行SAS系统的维护、开发、销售和培训工作。期间经历了许多版本,并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛应用。


SAS不断地与各行各业共同发展商业资料分析与预测技术,重要应用领域涵盖政府的经济决策与企业的决策支援应用等,并已成为全球第五大软件公司。

SAS软件是用于决策支援的大型集成资讯系统,但该软件系统最早的功能限于统计分析;至今,统计分析功能也仍是它的重要模组和核心功能。目前SAS最新的版本为9.3(July 2011)。经过多年的发展,SAS已经遍布全世界,使用的单位遍及金融、医药卫生、生产、运输、通讯、科学研究、政府和教育等领域;在资料处理和统计分析领域,SAS系统被誉统计软件界的巨无霸。

SAS 是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。 SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。 SAS系统主要完成以数据为中心的四大任务:数据访问;数据管理(sas 的数据管理功能并不很出色,而是数据分析能力强大所以常常用微软的产品管理数据,再导成sas数据格式.要注意与其他软件的配套使用);数据呈现;数据分析。截止2007年,软件最高版本为SAS9.2。

SAS 系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASE SAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。

SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以增加如下不同的模块而增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、 SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外, SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。

SAS 是由大型机系统发展而来,其核心操作方式就是程序驱动,经过多年的发展,现在已成为一套完整的计算机语言,其用户界面也充分体现了这一特点:它采用MDI (多文档界面),用户在PGM视窗中输入程序,分析结果以文本的形式在OUTPUT视窗中输出。使用程序方式,用户可以完成所有需要做的工作,包括统计分析、预测、建模和模拟抽样等。但是,这使得初学者在使用SAS时必须要学习SAS语言,入门比较困难。 SAS的Windows版本根据不同的用户群开发了几种图形操作界面,这些图形操作界面各有特点,使用时非常方便。但是由于国内介绍他们的文献不多,并且也不是SAS推广的重点,因此还不为绝大多数人所了解。


二、SAS基本组成

SAS系统是一个模组软件系统,它由多个功能的模组组合而成,其相关软件模组的说明如下:

BASE

为SAS系统的核心模组。提供档案建立、资料撷取、管理、分析和展示的功能。

SAS/ASSIST

软件为选单式的使用者接口模组。它能将SAS系统所提供的各种应用工具,以不用撰写程式的方法,而是以选单的方式去执行各模组的功能。

SAS/CONNECT

为协同式及分散式处理模组。它提供将各种不同平台的SAS系统连结起来,使系统达到资料整合与资源共享的能力。

SAS/GRAPH

为制作高分辨率彩色图形模组。可用来产生多种颜色和多种型式的统计图,如:柱形图、圆饼图、点状图、3D图、等高线图和地图等等。

SAS/ETS

用来开发及维护主管资讯系统(Executive Information System)的应用系统开发工具。提供时间序列读取、分析、预测和建立计量经济模型等功能。

SAS/AF

应用系统开发工具。利用面向对象程式(Object-Oriented Programming)及图形的使用者界面(Graphic User Interface)来开应用系统。以利使用者方便应用SAS内的各项功能。

SAS/FSP

为图形使用者接口的资料交谈式工具。以图形接口作为资料登录、编辑、撷取和查询功能。SAS/ACCESS为和各数据库软件间的资料连结与转换。提供连结的数据库软件为:ORACLE, IBM DB2,MS ACCESS, DBASE, SYBASE, MS SQL SERVER等等。

SAS/STAT

为全面性统计分析方法的工具。提供如回归分析、变异数分析、类别分析、多变量分析、群集分析、存活分析、PSYCHOMETRICANALYSIS和无母数分析,并有正规化、线型化与非线型化等变量转换的功能。

SAS/LAB

以导引方式的进行资料分析的工具。提供统计的假设分析(Assumption),如OUTLIER、NORMAL、SCALING转换等功能,并可以协助作出结论,且可将执行过程全部储存,以做为日后分析或报告的参考。

SAS/EIS

应用系统开发工具。与SAS/AF不同的是,此模组不需作接口开发,祗要对相关资料作定义即可。

SAS/IML

为交谈式的高阶矩阵语言工具。提供高阶的科学、工程和统计上的应用,并具有图形产生及资料展示的功能。目前最新的9.3版本,亦支援自由软件统计软件计划R语言,透过其SAS/IML模组,可以有限度相互联结使用,但若要相互使用时,则必需安装R语言软件于SAS系统相同的电脑内。目前相关功能支援如下:

两软件间的资料格式转换

呼叫与使用R语言函数功能

传输由R语言分析结果至SAS内

SAS/QC

为统计品管的工具。用于制程分析、实验设计等功能,以选单接口方式,方便使用者快速的得到结果。

SAS/OR

为决策支援工具。用于计划管理、线性及非线性规划与资源最佳化分配等功能。SAS/GIS即为地理资料的图形系统。SAS/WebAF如同SAS/AF般的图形接口开发工具。主要使用于发展于Web上的使用者接口。

折叠客户端软件EnterpriseGuide软件

约于2000年开始,SAS即提供一新的用户端软件 Enterprise Guide 工具 (简语即 EG),其可提供视觉化的操作接口,以方便使用者操作应用程式,与降低统计分析的门槛。 该软件具有如下列几个主要功能:

可自订直觉式且视觉化的使用者接口,但不同于SAS/AF或SAS/WebAF

可更安全地存取原始资料,以方便数据库的使用者权限管理

分析资料以流程的方式来编辑,可以降低使用者的门槛

可对相关的程序分门别类为分析,报表,图表,查询...等等

可支援自动化排程处理与相关的指令码产生器

但仍可以支援用程式码编辑的程式

当使用 SAS Enterprise Guide 时,其与原有的 SAS (即为 Base SAS) 软件是相互支援与使用。SAS Enterprise Guide 目的如同上述重点,如以EG为使用者接口来产生相关指令程或程式,交由 SAS (Server/Client)来处理与执行,最终结果仍回传于EG接口上以方便使用者,即EG > SAS (Server/Client) > EG 的模式。

由于该软件己非完全由C语言来编写,而是以需要使用Java与C#(读为C-Sharp)配合使用,如需使用EG软件时,至少需要安装.NET Framework,而安装完成后,也并同安装JRE(即为Java SDK runtime 1.4.1版本)执行期环境套件。

折叠JMP软件

其读法同"Jump"(意即"跳跃"),由SAS的子公司JMP发表于1989,起初为使用于Mac系统上的高阶统计分析软件,后再陆续制作用于Windows与Linux的版本,目前最新版本为9.0(Sep 2010)。 该软件原有的统计分析外,更高阶的"参数式"图形显示分析与应用统计模型,透过变更相关参数来达到进一步的数据分析;其软件亦有给予微软Excel的使用组件Add-ins(增益集),提供JMP与Excel更紧密的结合,也可让Excel突破资料表上的使用极限。

猜你喜欢

转载自gaojingsong.iteye.com/blog/2314556