sas简单描述统计分析和散点图

简单描述统计分析

一、 means过程
(一)例题和语句分析
例题1:某车间有30个人分成4组,求车间工人平均每小时制作的配件个数
这里写图片描述

data data3_1;
input no w n;       /*按自由格式输入变量no、w和n*/
cards;
01 10 35
02 6 32
03 8 29
04 6 26
;
run;
proc means data= data3_1 n mean;/*注意proc语句n与input语句n不同,proc语句的n表示未丢失的观测个数,这里有4个,
input语句的 n表示工人每小时制作配件的个数*/
var n;/*指定分析变量n*/
weight w;                          /*注意:必须设定变量w为均值的权数,否则算出的结果也不对*/
  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

结果是
这里写图片描述

在统计量缺省(即不指定输出哪一个或哪几个统计量)时,即上面没有N(观测数)和mean(均值),系统默认输出N、MEAN、STD DEV、MIN、MAX 5个统计量
结果是
这里写图片描述
如果这道题缺少指定哪一个变量是要分析的变量的均值的权数weight,如果权数就是观测数,结果就不会出错,否则就会出错。删掉weight w;结果是30.5,正确结果是31
这里写图片描述
这里写图片描述
不指定分析变量的话,系统会把除了权数的变量输出来,指定分析的变量的话,系统就只对指定的变量求它的统计量,用户可以在proc means data上指定要输出的统计量。
这里写图片描述

例题2:分地区、性别对收入情况进行简单的描述性统计分析
这里写图片描述
籍贯n表示湖南,h表示河南;年龄中1代表小于35岁,2代表大于35岁
分类需要class语句

data data3_2; 
input hometown $ age income@@; 
/*使用高级控制符@@,使input语句一次读取多条观测*/
cards; 
n 1 30081 n 2 25442 h 1 18036 h 1 42084 n 2 14075 n 2 20036 n 2 18584
n 1 30036 n 1 27085 h 1 35058 h 1 32152 h 2 35687 n 1 35698 n 1 25478
h 2 36547 h 2 54123 n 2 45698 n 1 62135 n 1 65874 h 1 25698
; 
run; 
proc means data=data3_2 maxdec=1;  
 /*调用means过程,设定输出的数值型结果含1位小数*/
 class age hometown;             /*指定分类变量为age和hometown*/
 var income;                     /*设定分析变量为income*/
output out=stats mean=incmean; 
/*output语句产生新的sas数据集stats中,定义统计量mean输出名称为incmean,注意一定要为输出的统计量定义名称,否则出错*/
run; 
proc print data=stats; 
title '不同地区收入情况调查';        /*定义此输出过程的标题*/
run;

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20

以下介绍means过程的两个部分
1、proc means data=数据集 后的<选项列表>
maxdec=数字—指定数值型变量的小数部分的位数,缺省时系统保留两位
alpha=数字—设置计算置信空间的置信水平a,a值在0~1之间
2、means过程一般使用的语句
var语句—规定进入描述性统计分析的变量,并定义他们的输出次序
class语句—分组计算观测的统计量
weight语句—设置统计量的权数
二、 univariate过程(单变量)
(一) means过程与univariate过程的差异
means允许有class语句,univariate没有
univariate不仅包含means的一些功能,还可以生成统计图,可以绘制茎叶图、盒型图和计算各种百分位值
(二) 例题和语句分析

Proc univariate data=chap1.data3_2 plot;  /*调用univariate过程,并指定输出图形,plot要求生成一个茎叶图、一个盒型图和一个正态概率图*/
Class hometown;                    /*定义分类变量为hometown*/
Var income;                        /*定义分析变量为income*/
Run;

  
  
  • 1
  • 2
  • 3
  • 4
  • 5

三、 散点图
绘制散点图有两个过程,分别是plot过程(低分辨率)和gplot过程(高分辨率)

Proc plot data=chap1.data3_6 vpct=50 hpct=70;
/*调用plot过程绘制散点图,图形在垂直方向占一页的50%,水平方向占一页的70%*/
Plot weight*height='*'/haxis=140 to 180 by 10
                      Href=150 160 170
                      Vaxis=30 to 70 by 10
                     Vref=50
                     ;
/*横坐标haxis从140到180每隔10取一个值,水平Vref参照线是50,
纵坐标 Vaxis从30到70每隔10取一个值,设定垂直Href参照线是150 160 170,*/
Run;

  
  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

这里写图片描述

haxis定义横轴相等间隔的刻度标记值,Vaxis定义纵轴相等间隔的刻度标记值
Vref是定义横轴参照线,Href是定义纵轴参照线
Plot语句的使用格式
Proc plot data=数据集

简单描述统计分析

猜你喜欢

转载自blog.csdn.net/weixin_43816210/article/details/86299210
今日推荐