Stata基本功能及其函数实现

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/moxigandashu/article/details/51774652

Stata简介:Stata使用简单,功能强大,是数据分析中常用的统计计量软件。本人使用的是Stata14,如若需要,可评论留言!

1 Stata基本描述

1.1主窗口
这里写图片描述
  如图所示,Stata大致可以分为五个部分。
  最上面是菜单栏,或者成为工具栏,功能栏,包括file,Edit,Data,Graphics,Statistics,User,Window,Help八个主要菜单,其中每个菜单下又有新的菜单。
  左边是历史命令区,历史命令会在这里显示。
  中间最大的区域是结果窗口,显示执行Stata命令之后的结果。
  结果窗口下面的Command是命令窗口,在这里输入 。
  最右边是变量窗口和属性窗口,显示当前变量和属性。
  左下角显示当前路径。
1.2 数据编辑器
这里写图片描述
  可以通过菜单栏Data->Data Editor->Data Editor打开数据编辑器,导入数据的方法有两种,第一种最简单粗暴,直接通过Excel复制粘贴过来,另外一种方式是File->Impot->spreadsheet(*xls;*xlsx)。
  
1.3 变量管理(Variables Manager)
这里写图片描述
  可以通过Window->Variables Manager打开变量管理器,可以编辑变量名,标签,变量类型,格式等;

2 Stata基本命令

2.1 数据审视(describe)

2.1.1数据描述

.describe[varlist] [, memory_options],可以查看变量的类型,显示格式,变量标签和变量值的标签。

这里写图片描述
2.1.2数据列表

.list [varlist] [if] [in] [, options],查看变量的具体数据。

这里写图片描述
当结果太长,会以more的方式显示,如果关闭more分页显示,可以用set more off,这样就不会分页显示了,如果想要打开,set more on。
这里写图片描述
.list [varlist] [if] [in] [, options],中if 和in是条件控制,如查看1-5个r变量,可以 .list r in 1/5。
这里写图片描述
如果要查看r>5000的r值,可以 .list r if r>5000。
这里写图片描述
2.1.3 数据删除

.drop [varlist][if],用该命令来删除数据。

这里写图片描述
2.1.4 数据排序

.sort varlist [in] [, stable],对数据进行升序排列,降序排列使用命令,.gsort -varlist [in] [, stable]

如按s从小到大升序排序:

这里写图片描述

如果要按照降序排列,可以.gsort -s。

这里写图片描述

3 画图

3.1 直方图

.histogram varname [if] [in] [weight] [, [continuous_opts |discrete_opts] options],直方图。

比如想要画变量support的直方图,可以.histogram s。

这里写图片描述

3.2 散点图

[twoway] scatter varlist [if] [in] [weight] [, options],散点图。

如想要画变量r的散点图,,可以scatter r。
这里写图片描述
其中,如果想要在散点图上标注是哪个观测值,可以
.gen n=_n
.scatter r,mlable(n),

_n表示第n个观测值,mlable表示以n作为标签。
这里写图片描述

3.3 连线图

[twoway]line varlist [if] [in] [, options]

通过line可以画连线图,如要画x与y之间的折线图
line y x
这里写图片描述

3.4 阴影图

twoway area yvar xvar [if] [in] [, options],阴影图。

options Description
vertical vertical area plot; the default
horizontal horizontal area plot
cmissing(y|n) missing values do not force gaps in area; default is cmissing(y)
base(#) value to drop to; default is 0
nodropbase programmer’s option
sort sort by xvar; recommended

如要画x和y的阴影图,输入命令:
twoway area y x
这里写图片描述

4 统计分析

4.1 summarize

summarize [varlist] [if] [in] [weight] [, options]

options           Description
-----------------------------------------------------------
Main
  detail          display additional statistics
  meanonly        suppress the display; calculate only the mean;
                    programmer's option
  format          use variable's display format
  separator(#)    draw separator line after every # variables; default is
                    separator(5)

例如要统计s变量,则输入命令:
summarize s
这里写图片描述
su
这里写图片描述
此结果显示所有变量的统计项,包括样本容量,均值,标准差,最小值和最大值。

4.2 tabulate 经验累积分布函数

tabulate varname1 [varname2] [if] [in] [weight] [, options]

.ta y
这里写图片描述
显示y变量频数,百分比和累积百分比。

4.3 generate 生成新变量

generate [type] newvar[:lblname] =exp [if] [in] [, before(varname) | after(varname)]

4.4 display 计算功能

display

例如 dispaly 2^2
结果为:4

猜你喜欢

转载自blog.csdn.net/moxigandashu/article/details/51774652
今日推荐