数据分析入门第一个月——统计学第一章

一、什么是统计学

  • 描述统计:通过对数据的汇总、概括与分析,得出所关心的数据特征。
  • 推断统计:通过样本数据来推断总体特征,包括参数估计和假设检验;其中参数估计是用样本信息推断所关心的总体特征,而假设检验是利用样本信息判断对总体的某个假设是否成立。

二、变量与数据

类别变量(定性数据):无序类别变量(数据名义值):即变量之间不存在顺序关系,如学生的学科成绩,语文、数学等。

                                     有序类别变量(数据顺序值):变量之间存在顺序关系,如用户对商品的评价,好、很好、一般等。

数值变量(定量数据):离散变量(有限值):能够一一列举的有限点

                                     连续变量(无限值):在一定区间内连续取值

另外根据数据的时间性质可以将数据分为截面数据和时间序列数据:

                                     截面数据:在相同的时间或近似相同的时间点上收集的数据,通常是不同空间下同意时间截面的数据,如2017年我国各省GDP

                                      时间序列数据:不同时间内收集的数据,如2000年到2017年我国的GDP产值

三、数据抽样方法

                                      简单随机抽样:重复抽样、不重复抽样

                                      分层抽样

                                      总体抽样

                                      整群抽样:先将整体随机划分为若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,比如可以将宿舍看成一个群,在全校内的宿舍随机抽取。

   总结:重点了解了数据或变量的类型,对统计学有一个整体的认识。

猜你喜欢

转载自blog.csdn.net/moxiaoaijing/article/details/81003773