(二)SAS基本语法

1、语句

  • SAS语言的基本单位是语句,多条SAS语句构成一个SAS程序(*.SAS);

    • Libname mylib "c:\sasdata";
  • 语句通常由一个关键词、SAS名称、特殊字符、运算符等组成;

  • 语句一般以SAS关键词开头,以分号“;”结束;

  • 关键词是SAS系统定义的、有确定含义的符合,一般位于句首,用以说明语句的类型和功能

SAS语句书写规程:

  1. 语句可以从某一行的任意位置开始;

  2. 一条语句可以写成几行;

  3. 一行可以写几条语句;

  4. 不区分大小写;

  5. 注释语句的两种格式:

    • /* 注释内容 */

    • *注释内容;

除数据行外,SAS语句都是以关键词开头。

Run语句表示程序的结束,也可以每个程序后都加一个run。

title '2015 student';
libname mylib 'F:\sasdata';
data mylib.stud;
     input id $ name $ gender $ age hometown $;
cards;
201501001 周国兴 男 19 长沙
201501002 李铭   女 18 广西壮族自治区
201502003 彭晓钢  男 19 广州
201502004 胡大伟  男  18 武汉
;;;;
proc print data=mylib.stud;
run; 

​2、程序的构成

数据步

  • 数据步以关键词DATA开始;

  • 通常用于创建SAS数据集,对数据进行处理,如计算、挑选。

  • 数据步的输出可以是多种形式,如SAS数据集或报表,也可以将结果写到 日志窗口或外部文件中

过程步

  • 过程步以关键词PROC开始;

  • 通常用于分析和处理SAS数据集中的数据,绘制表图,展现数据集的信息等功能。

全程语句

  • 位于数据步和过程步之外;

  • 如:TITLE语句用于指定标题;OPTION语句用于规定系统运行的一些选项

  1. 一个SAS程序就是由0个或若干个数据步、过程步组成;

  2. 有时还包括一些全程语句用以贯穿控制整个SAS程序的某些选项、变量或程序运行的环境;

  3. SAS程序结束语句:RUN

  4. 运行程序:单击工具栏“提交”按钮,或单击F8

3、SAS数据步

3.1用DATA步创建数据集

方式一:直接输入方式

DATA<数据集名>;
INPUT<变量1>[$] <变量1>[$] <变量2>[$] ...<变量k>[$];
[其他数据步语句]
CARDS;
d11 d12 ... d1k
d21 d22 ... d2k
... ...
[;]
RUN;
  1. DATA语句

    • [格式] 逻辑库名.数据集名;

    • [功能] 标志数据步的开始,并定义新建数据集的名称

  2. INPUT语句

    • [功能] 为相应数据定义变量,告知SAS如何读取数据

  3. CARDS语句

    • [功能] 表面后面是数据行;

    • cards必须与input配合使用;

    • 在一个data步中只能使用一个cards;

    • 分号单独占用一行

方式二:外部文件读入数据集

DATA <数据集名>;
INFILE '<文件名>';
INPUT <变量名1> <变量名2> ... <变量名k>;
RUN;
  1. INFIILE语句用于从外部文件读入数据,必须出现在INPUT语句之前;

  2. 文件名包含盘符和路径;

  3. 文件中不包含变量名

data  temp2;
infile 'F:\sasdata\stud.txt';
input id $ name $ sex $ age hometown $;
run;

3.2 Input语句

语句格式: INPUT 变量名 输入格式;

功能:

  • 定义变量

  • 读取外部数据文件中的数据,读取CARDS语句后的数据

Input state $ 1-2 amount 4-8;
Input state $ amounnt @@;(行固定标识符))
  • 数据行中的值之间至少用一个空格分开;

  • 丢失值用“.”表示;

  • 在input语句中按数值出现顺序列出变量;

  • 以分号结尾;

  • 字符型变量名的后面跟$符号

3.3 SET语句

功能:

  1. 数据集的复制与修改;

  2. 拆分数据集;

  3. 纵向合并数据集

DATA[<新数据集名1>][<新数据集名2>]....;
SET[<已有数据集名1>][<已有数据集2>]....;
[KEEP <欲保持的变量名列表>;]
[DROP<欲丢弃的变量名列表>;]
[IF <条件>[THEN<语句>];]
RUN;

功能1:数据集的复制和修改

DATA[<新数据集名1>];
SET[<已有数据集名1>];
data class1;
 set sashelp.class;
 keep name sex age;/*字符变量后不要带$*/
 if sex="女";
run;

功能2:拆分数据集

DATA[<新数据集名1>][<新数据集名2>];
SET[<已有数据集名1>];
data boy girl;
   set sashelp.class;
   if sex=‘M' then output boy;
   if sex=‘F' then output girl;
run;

功能3:纵向合并数据集

DATA[<新数据集名1>];
SET[<已有数据集名1>][<已有数据集2>];

3.4 MERGE语句

横向合并数据集:

用merge语句将两个或多个SAS数据集中的观测横向匹配合并成一个新数据集中的一个观测。

DATA <新数据集名>;
MERGE <已有数据集列表>;
BY <变量1>[<变量2>...];
RUN;

用by语句指定匹配变量,每一个数据集必须按这些匹配变量进行排序。

3.5 IF语句

功能:仅对符合条件的观测值进行处理

格式一: IF <条件或表达式> THEN <语句>;
                       [ELSE <语句>];
格式二: IF <条件或表达式>;

4、过程步

常用过程步:Print、means、Sort、Format、Contents过程步

常用过程步语句:Var、By、class、output、Where、Label、Format

PROC <过程名>[DATA = <输入数据集>][<选项>];
    <过程语句>/<选项>;
    <过程语句>/<选项>;
RUN;

4.1 VAR语句

VAR语句在很多过程中用来指定分析变量

VAR<变量名1><变量名2>...<变量名n>;
Proc print data=sashelp.class;
    Var name age height;
Run;
  • 变量列表给出过程将要分析的数据集中的一些变量;

  • VAR语句中的变量顺序,也是将来输出结果时的变量顺序;

  • 通常VAR语句是放在过程的开始处。

4.2 CLASS语句

CLASS语句可用在某些SAS过程中,用来指定一些分类变量,SAS过程按分类的变量的不同值分别进行分析处理

按男女分类统计class数据集中收入weight的均值等统计量:
Proc Means Data=sashelp.class;
    Class Sex;
    Var weight;
    Title "How to use Class statement";
Run;

4.3 BY语句

BY语句在过程中一般用来指定一个或几个分类变量,根据这些分类变量值把观测分组,然后对每一组观测分别进行本过程指定的分析

BY <变量名1><变量名2>...;

4.4 LABEL语句

LABEL<变量名>='<标签>' <变量名>='<标签>'...;

5、全程语句

全程语句与一般语句不同,一般语句必须用在数据步或过程步内,作为数据步或过程步的一部分;

全程语句则既可以用在数据步和过程步内,又可以单独使用(在数据步、过程步外部)

-liibname

-Title

-Footnote

-Options

猜你喜欢

转载自blog.csdn.net/beiye_/article/details/130630485