统计学—数据的搜集

目录

一、数据的来源

二、调查方法

三、数据的误差


一、数据的来源

        数据的来源分为直接来源和间接来源,其中直接来源是指通过调查和实验的方法直接获取的一手资料;间接来源是指与研究内容有关的原信息已存在,只是对原信息进行重新加工、整理,使之成为我们进行统计分析可以使用的数据,称为间接来源的数据,即二手资料。

一手资料和二手资料的优缺点:

一手资料优点:针对性强。缺点:成本高,不易搜集。

二手资料优点:成本低,易搜集,作用广泛。 缺点:相关性不够,容易出现口径不一致,时效性不够等问题。

二、调查方法

        调查方法分为抽样方法和搜集方法。

        抽样方法:分为概率抽样和非概率抽样。其中概率抽样是遵循随机原则进行的抽样,即每个单位都有一定机会被选入样本。非概率抽样是不依据随机原则,根据研究目的对数据的要求,采用某种方式 从总体中抽出部分单位对其调查。


        概率抽样与非概率抽样的特点:

        概率抽样:①依据随机原则 ②可用样本推断总体 ③可以满足特定精度要求
所需样本量 ④技术含量更高,专业性更强,成本高
        非概率抽样:①不依据随机原则,样本量分布不确切 ②操作简单,时效快,
成本低 ③专业技术要求不高 ④适用于探索性研究和概念测试 ⑤不可适用于估
计总体参数
        概率抽样分类:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样
        非概率抽样分类:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样

        搜集方法:自填式、面访式、电话式


三、数据的误差

        造成统计数据误差的原因有哪些?如何减少和控制统计数据中的误差?

         统计数据的误差是指通过调查搜集到的样本结果与总体真值之间的差异。数
据的误差有两类:抽样误差和非抽样误差。
        抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差,通过增
加样本量可以减少抽样误差,当样本量大到和总体单位相同时,也就是抽样调查
变成普查时,抽样误差较小到 0。
        非抽样误差是指除抽样误差以外的,由于其他因素引起的样本观察结果与总
体真值之间的差异。非抽样误差包括抽样框误差、回答误差、无回答误差、调查
员误差、测量误差等。非抽样误差的控制主要是控制调查的质量,包括对调查员

的筛选、培训等。

数据误差的影响因素:

①样本单位数目,在其他条件不变的情况下,样本量越大,抽样误差越小,
当 n=N 时,抽样误差为 0;
②总体标志变异程度,在其他条件不变的情况下,总体标志变异程度越大,
抽样误差越大;
③抽样方法,一般情况下,不重复抽样的抽样误差要小于重复抽样的抽样误
差,当 n 相对于 N 非常小时,两种方法之间的差异可以忽略不计;
④抽样组织方式,采用不同的抽样组织方式,也会有不同的抽样误差,一般
情况下,分层抽样的抽样误差较小,整群抽样的抽样误差较大。

猜你喜欢

转载自blog.csdn.net/m0_52051577/article/details/130488236
今日推荐