stata学习笔记①stata基础介绍


一、为什么要学stata

  • 对经济统计、计量比较友好,经济学读博必备、必会
  • 窗口菜单和代码完成一定的功能,简单
  • 上手简单
  • 可靠性强-这里指的是权威性
  • 模型种类丰富-类似R包、python模块

二、软件基本解释

1.软件界面

在这里插入图片描述

  • 注意历史窗口,红色表示报错哦

2.导入示例数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
输入summarize price,有时候可简写为sum price
在这里插入图片描述

3.认识几个重要的功能符号

在这里插入图片描述

  • 1.保存日志
  • 2.帮助文档
  • 3.绘图编辑
  • 4.生成do-file文档
  • 5.数据编辑
  • 6.数据浏览

三、数据的基本观测

  1. describe返回数据的基本情况,如右下角属性窗口
    语法:describe [变量],或者不加,注意[]表示可以加可不加
    例子:describe, price
  2. count查看观测变量个数,可以加逻辑判断
    语法:count if [变量]>80,或者不加
    例子:describe if price>500\ describe if missing(rep78)
  3. isid类似于索引,独特的区分出每一个观测值
    语法:isid 变量
    例子:isid price,如果报错,这说明不可以独立区分出每一个观测值,这里说明,每个观测值可能存在重复值
  4. unique
    语法:unique 变量找唯一
    例子:unique mpg weight

四、统计性描述

1.codebook 数据字典使用

可以用于查看数据类型、简单统计量、缺失值、异常值
codebook [] [] [] [,options]
[]:代表不是必须的
varlist:变量名单
if:逻辑判断
in:第几个到第几个观测值
options:跟在逗号后面,一些自定义选项
在这里插入图片描述
llast
ffirst

2.summarize

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
Skewness:偏度

Kurtosis:峰度

五、图像初步探索

1.histogram 直方图

histogram varname[if] [] [] [,[continuous_opts | discrrte_opts]options]
注意这里的varname是个单独变量
语法:
hist varname朴素的图
hist varname, freq bin(5) normal连续的 如果离散的discrete
hist varname, by(varname2) 分组

2.graph box /hbox 箱线图

graph box var

在这里插入图片描述
hbox表示横向的直方图
graph box pirce, over(foreign)
分组的直方图

3.vioplot小提琴图

一般情况下,小提琴图比箱线图更好,因为可以看到每一个分位下,数据的观测值数量
在这里插入图片描述
语法和图像展示

猜你喜欢

转载自blog.csdn.net/weixin_43213884/article/details/130626885