大数据时代,我竟然在用Excel和SPSS做数据分析,真香!

目录

写在前面

本篇文章介绍的是基于Excel和SPSS的数据分析和数据可视化操作.大数据时代,我们每天接受的数据量是巨大的,只有分析数据之间的联系进而才可能得到商机和"钱"途,本篇文章将从最基础的概念入手到实际的对数据的分析实战,从Excel和SPSS两个方面对数据进行分析.

概述

基于SPSS和Excel写了的调查数据分析

什么是统计?

统计学是用已收集数据.分析数据并进而由数据得出结论的一组概念.原则和方法,因而也有人称统计学为统计方法

统计.计算机与统计软件

SPSS和Excel

(重点)变量及其分类

变量:用来描述总体中成员的某一特性

数据收集

第二章

问卷的组成和结构

问卷组成:封面信(目的).指导语(如何填写问卷).问题.答案.编码几个部分组成

问题可分为开放式问题封闭式问题:

编码:指的是将问题和答案用一个字母或者数字来代替

问卷的结构:开头,正文(调查信息和背景资料)和结尾(可以设置开放题,征询被调查者的意见或者感受,也可以是感谢语以及其他补充说明)三部分组成

几种典型的问卷题型:

1填空题(一般就是填数字的填空题,让调查者容易回答,容易填写的问题可以设置为填空题)

2.二项单选题:

问题的答案只有不是(或其他形式但是只有肯定和否定两种形式)

回答者根据自己的情况选择其一

3.多项单选题

给出的答案至少在两个以上,回答者根据自己的情况选择其中一种作为回答,这是各种社会调查问卷中采用最多的一种问题形式,其答案特别适合进行频率分析交叉分析,在设计上,这种问题形式的关键之处是保证答案的穷尽性互斥性

4.多项限选题

多项限选也称为限选不排序,与多项选一(多项单选题)有所不同的是,可以在所列举的多个答案中,要求回答者根据自己的情况选择若干个

5.多项排序选(后面处理这种问题是需要加权值进行处理的)

多项排序选也称为限选排序,这种题目可以是针对多项限选题(限选不排序)的不足而出现的一种问题类型,在一定程度上可以看成是多项单选题和多项限选题的一种结合.

6.多项任选题

多项任选也称为不限选.多项任选题是在所提供的的答案中,被调查者可以任意选择各种不同答案的一种问题形式.

7.矩阵题(表格题)

采用矩阵(表格)的形式将同一类型的若干个问题集中在一起,构成一个"大"问题矩阵题通常采用李克特量表

8.相倚问题

答案的设计

穷尽性互斥性

穷尽性:表示了答案包括了所有可能的情况

互斥性:指的是答案之间不能交叉重叠互相包含

量表

量表主要是用来测量人们的感觉或者主观判断,它的测量逻辑是假定有相同主观感觉的人会在一个由弱到强的连续线段(维度)的相同位置,标出自己的感觉.

(1)李克特量表 (答案类型在4~8个之间)

(2)博加德斯社会距离量表

(3)语义差异量表(要确定的是人们对于某一事件或者事务的感觉,先找到最强和最弱,然后分为不同的等级,一般为7分等级)

第三章:数据的录入和清理

数据的录入

在统计分析之前,必须将问卷数据录入计算机,而在录入之前需要对录入的数据进行核对和清理

Excel技巧:

要改动多个单元格的值为同一个值时

在Ctrl选择多个单元格,写要修改的值然后按Ctrl+Enter确定.

1.单选题的录入(注意题目和答案都用字母或者数字表示)

2.多项单选题

3.多项限选题(两种处理方式:二分法和分类法):建议使用分类法,这样变量的取值比较少

二分法

二分法的关键是:把每个小答案都分为两份,选或者不选(选择这个小选项则用1表示,否则置空表示不选)

二分法:有几个选项就取多少个变量,每个变量有两个取值,一个是1,一个是空,做多限选的个数就是变量中最多能选择的个数.

分类法:

分类法:是只有三个(几项限选就是几个)变量,每个变量的取值都可以是任意的一个答案选项代表的数字或者字母.

相当于把答案分为了n类,每个变量的取值都可以是任意一个选项

二分法相当于把每个选项分为两类,选或者不选

4.多项不限选(推荐使用二分法)

在Excel中求均值.最大值.最小值
: = a v e r a g e ( ) = m a x ( ) = m i n ( ) 均值: = average(单元格范围) \\最大值 = max(单元格范围) \\最小值 = min(单元格范围)

如果是处理填空题中的求均值,一般把一组数据中的组中值作为该组的度量的标准参与计算,这里可能会使用到if函数

在Excel中使用if函数
= i f ( , , ) : i f = if(函数条件,真值,假值) \\注意:if函数是可以嵌套的
量表:

排序题:

数据的清理

  • 数据有效范围的清理
    • 对数据中的奇异值进行清理,例如:在数据录入中,性别男用1,女用2,那么3就属于奇异值
  • 数据逻辑一致性的清理
    • 在相倚问题和多项限选题中出现较多,如有问题1:您是否有手机,问题2:您的手机平均月费,那么就不能没有手机还有月费
  • 数据质量的抽查

image-20200528220557102

image-20200528220700664

3.4在Excel中核对数据

  • 筛选出范围不合理的单列
    • 在Excel中核对"大小适中"的数据
  • 用自动筛选找出不合理的关联题
    • “是否有手机"和"平均月费”
  • 用高级筛选找出重复的记录
    • 重复记录

简单筛选:仅仅只筛选出一个选项不符合范围的问卷(这样可能会导致我们需要多次筛选才能得到所有的不符合范围的问卷的编号)

步骤:

  1. 点击筛选
  2. 在标题中选择不合理的范围或者自己定义不合理范围的筛选条件

高级筛选出所有不符合范围的问卷

分为两种,

条件是或还是与(不符合一个就筛选出来还是全部不符合才筛选出来)

步骤:

  1. 复制要筛选的部分的列标题,粘贴(细节:和本来的数据之间至少隔3行)
  2. 写条件
    1. 与(全部不符合才筛选出来):与条件写在一行
    2. 或(不符合一个就筛选出来):不能写在同一行
  3. 点击高级筛选:将筛选结果复制到其他位置
    1. 列表区域:选择的就是我们原数据区域的(所有原数据区域)
    2. 条件区域:点击选择我们写的条件区域
    3. 复制到:指的是筛选结果复制到,点击选择一个单元格(因为我们不知道我们的筛选结果到底有多少),注意和条件区域也最少隔3行

image-20200528224214456

避免录入数据时超出有效范围

  1. 选中要输入数据的区域
  2. 点击数据---->数据有效性(设置合适的数据有效性的允许值)
  3. 点击来源------>选中我们数据的来源

这样在数据录入时,我们就只能输入规定的数值

image-20200528224752562

同时还可以设置出错警告来给出友好的提示信息.

对于"没有手机’'和"有平均月费"的问题,

1.我们可以通过多次普通筛选(在筛选基础上筛选)来得出结果

2.通过if函数标记处奇异值

=if(and(b2=2,F3<>""),“F”,""):表示的是如果B2的列的值为2F3的列的值不为空,就用F标记,否则用空标记

解决有逻辑错误的重复值(多项限选题的逻辑不一致性的解决靠函数)

如:你购买的原因1和购买原因2相同,就是逻辑错误的

也可以适用多重筛选来得到结果,但是如果答案的选项很多,就很复杂

我们同样使用函数来解决这个问题

主要是学习or函数的使用

=IF(COUNT(C2:E2)<2,"",IF(OR(C2=D2,D2=E2,C2=E2),“F”,"")):

表示的含义是:从外层开始解释

如果C2到E2的数小于2,即填写的原因只填写了1个,或者没填写,这时置空,否则:

判断如果C2=D2,D2=E2,E2=C2中有一个符合就置为"F",都不符合就置为空

image-20200528231337430

筛选出重复的记录

有的记录是完全重复的记录,我们需要将其删除

image-20200528231802236

建立调查问卷的SPSS数据文件

  • 在变量视图中建立变量充当问题,值填写(选项)
  • 不同种类的问题,在SPSS中使用不同的策略,比如:
    • 单选题:直接在值中输入不同选项的答案
    • 多项限选题:采用分类法,限选几项就创建几个变量,变量的值是所有的选项
    • 多项任意选:采用二分法,为为每一个选项创建一个变量,值可以是两种,选中或者不选中(比如1代表选中而空代表未选中----这样设置之后保存为Excel文件时,打开文件空的地方会显示#Null,这时可使用替换所有来把#Null替换为空 ----操作:开始 ----查找替换)
  • 当创建录入了SPSS文件时,这时我们就可以对SPSS文件进行保存和另存为.SPSS文件的后缀是.sav

第4章单变量的一维频率分析

  • 频率分析是所有问卷调查中最广泛使用的分析技巧
  • 因为频率分布表的建表方式简单,分析容易,阅读容易
  • 基本统计分析往往从频率分析开始
  • 通过频率分析,能够在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差
  • 频率分析的基本任务:
    • 1.编制频率分布表
    • 2.绘制统计图(最直接的数据刻画方式)

利用SPSS对单选题进行一维频率分析

分析菜单-------描述统计------频率------具体操作

区分概念:

在SPSS中生成的频率分布表中有百分比,有效百分比,累计百分比

  • 频数/问卷数===百分比
  • 频数/有效问卷数(部分问卷可能对该问题没有回答)===有效百分比 我们在调查报告中的百分比指的就是有效百分比
  • 累计百分比是根据我们分析的顺序对百分比进行累加

利用Excel对单选题进行一维频率分析(重点)

两个步骤:

1.在Excel中,将SPSS格式的一维频率分析表转换为调查报告所需的格式

在已生成的SPSS的一维频率分析表上单击右键----复制------在Excel中粘贴

把我们需要的数据摘抄和进行数据格式的转换(百分数)

image-20200530094528012

2.在Excel中根据频率进行排名

1.图形化操作

左键单击选中要排序的数据列-----在数据选项卡------排序-----在

或者:

数据------排序------操作选择要排序的列

2.使用函数进行排名(rank函数)

rank(参数1,参数2,参数3):进行排序的函数

  • 第一个参数:需要排序的单项列:如C2
  • 第二个参数:需要排序的列的范围,如:C2:C8,为了使用排序函数时排序区间不发生变化,这时我们要使用单元格的绝对引用方式------选中C2:C8按下F4将单元格变成$C 2 : 2: C48
  • 第三个参数:排序时使用的排序顺序0代表降序(默认),1代表升序排序

=RANK(C2,$C 2 : 2: C$8,0):需要排序根据的是C2的列(单项),排序范围是C2:C8,使用的排序方式是降序排列

image-20200530160440736

注意这种排序的方式使用的是:美式排序,如果有相同的排名就会顶替掉一些排名,如:1,2,2,4,5

COUNTIF(范围(为了范围不发生变化,使用绝对引用),表达式)函数,统计函数:能够统计在某一范围中,表达式出现的次数

如:COUNTIF($B 2 : 2: B$1001,E2)

image-20200530162229563

如何使用Word编辑一维频率分布表(重点)

在Excel中绘制一维频率分布统计图(重点)

单选题的一维频率统计图可以是饼图,柱形图,条形图,但是优选饼图,因为单选题的频率之和为100%

绘制单选题的一维频率分布图饼图

(1)选取要绘制饼图的数据来源同时Ctrl选中数据对应的百分比

(2)插入-----饼图

(3)可以修改图表的标题名称和字体大小

(4)不显示图例

(5)点击饼图-----布局----数据标签-----设置数据标签格式(显示类别名称和值):选择数据标签外和按照分行符的格式来显示

(6)设置图表样式—其中样式26是立体的样式

柱形图和条形图的绘制方法基本上和饼图的方法相同

在Excel中绘制的图表会和我们的数据相关联,当我们的数据发生变化时,图表的信息也会发生变化,可实现实时数据的可视化显示

利用SPSS对填空题进行一维频率分析

因为填空题所填的数字(数值)的可能性很多,我们不能使用分类法来对所填的数据进行统计一维频率分析,也不能使用二分法进行一维频率分析.因此,我们需要先在SPSS中对数据进行分组和转换.

转换----------重新编码为不同的变量------具体操作

转换后我们可能需要在变量视图中对值的标签中填充我们的值内容

然后点击分析------一维频率分析------选择新编码出来的变量进行分析

就可以得到分析出来的结果

image-20200530171648635

利用Excel对填空题进行一维频率分析(重点)

image-20200530171720892

2.使用Excel计算学生的期末的最终成绩

image-20200530215042106

计算百分总成绩:=B220%+C2505+D2*30%

最终成绩是使用了一个用于四舍五入的ROUND(范围单列,保留小数位数):=ROUND(E2,0)

需要突出分数<60分的成绩:开始------条件格式-------突出或新建规则------具体操作

完成最终的成绩统计

image-20200530215652825

1.使用COUNTIF函数来做:符合条件就统计(可以用多条件来实现复合条件)

=COUNTIF(范围,条件)

=COUNTIF($F 2 : 2: F$69,"<=60")

使用多条件来实现复合条件的筛选

=COUNTIF($F 2 : 2: F 69 , " < = 90 " ) C O U N T I F ( 69,"<=90")-COUNTIF( F 2 : 2: F$69," >=80")

需要注意条件要用双引号括起来,范围为了拖动时不发生错误要使用绝对位置

2.使用COUNTIFS函数来做:符合复合条件就统计

=COUNTIFS($F 2 : 2: F 69 , " < = 90 " , 69,"<=90", F 2 : 2: F$6," >=80")

根据频率排名

前面介绍过了RANK函数

撰写调查报告

标题小三的字体大小(宋体)

正文小四的字体大小(宋体)

1.5倍行距(在段落中设置)

表例和图例的字体大小一般比正文小一号字(一般为五号字)

注意表例要在表的上方

图例要在图的下方

在word中我们的单词可能会下面有红线,找到审阅------拼写和语法-----选择忽略所有

在word中撰写调查报告时插入的表格中列有表格对不齐的情况:选中对不齐的列,按下ALT键进行微调对准

在word中插入我们在Excel中制作好的统计图时,我们选择粘贴的方式如果是图片,那么在Excel中数据发生变化时,我们在word中插入的统计图是不会发生变化的,但是默认的粘贴的方式是,粘贴为图形对象,就是在Excel中的数据发生变化,在word中的统计图表也会发生变化

第5章双变量的交叉表分析

市场调查民意调查,经常利用交叉表来分析两个分类(定性)变量之间的关系,比如:性别与品牌偏好.教育程度(学历)与使用品牌.收入与是否有数码相机.性别与移动电话类型偏好.地区与移动电话类型偏好,等等

在SPSS中进行两个单选题的交叉表分析

分析-------描述统计-------交叉表------选择行----选择列------单元格中百分比选择行

要注意是描述的是谁和谁的关系的分析,性别与幸福感,则性别作为交叉表的行变量

image-20200531115931874

然后将表复制到Exce中,进行简单的处理

image-20200531120224885

然后使用Ctrl选中绿色和蓝色来绘制图表,我们在Excel中绘制图表,不同的图表的区别很大,我们首选绘制的是百分比堆积柱状图-------簇状柱形图-------簇状条形图

在Excel中绘制两个单选题的交叉表统计图

经过在SPSS中进行交叉表的分析和在Excel中对统计图的简单绘制我们得到了如下的结果

image-20200531120702205

接下来,我们需要调整图表的系列

设计------切换行/列

将数据标签显示在图表的内部:布局------数据标签----选择数据标签内

删除网格线:单击网格线,按下DEL键

设置坐标轴格式:单击选择设置坐标轴格式------坐标轴选项----选择固定填写0.2

设置立体感:设计—样式—选择立体的样式

设置一个图表标题:布局----图表标题----图表上方–输入标题(修改字体大小)

最终效果:

image-20200531121823021

在Excel中利用数据透视表实现一维频率分析和交叉表分析

在SPSS中使用数据透视表实现一维频率分析

插入-----数据透视图—选择数据范围----选择放置数据透视表的位置(一般选择新的工作表)

image-20200531130602287

关于数据透视表的操作:

概念:

  • 行标签:行标签
  • 列标签:列标签
  • 数值:选择要添加到数据透视表的字段(BH)到数值就可以分析字段
    • BH表示计数项
    • 可选的BH的计算项类型:在计数项上单击----选择值字段设置:求和,求平均值,最大值,最小值,乘积计数等
    • 其中百分比的生成可以依靠在选择字段设置时选择计数再选择值显示方式中选择占同列数据综合的百分比

image-20200531130956169

再对数据透视表进行操作:

复制筛选合适的数据,使用函数或者图形化操作生成表格.

image-20200531131131942

根据表格就可以生成统计图

image-20200531131207549

在SPSS中使用数据透视表实现双变量交叉表分析

双变量交叉表分析在Excel中分析就是在透视表中不仅有行标签而且有列标签,这样就实现了行列双变量,而数值就是实现的是对双变量的交叉分析.

image-20200531132820387

第6章多选变量的一维频率分析和交叉表分析

多选变量使用二分法进行一维频率分析

多选变量:指的就是我们之前所遇到的那种多项不限选题多项限选题

我们要处理这些问题的数据,我们需要先在SPSS中对数据进行处理

我们这里举例说明一个多项不限选问题的一维频率分析和交叉表分析

首先看一维频率分析,对于多项不限选,现在SPSS中

  • 首先要将该问题的所有选项定义成一个变量集(不论是做一维频率分析还是交叉表分析都需要先定义变量集)

    • 分析--------多重响应---------定义变量集---------把选项都拖进去----------要注意将变量转化为(如果我们的选项的处理方式是二分法(也就是我们的题目是多项不限选),就选择二分法计数值填写1,如果我们的问题是分类法处理的,我们就选择类别,然后确定范围[ ]到[ ])-------名称写我们变量集的名称

    image-20200531182510588

  • 生成了我们的变量集之后:我们对多项不限选问题进行一维频率分析

    • 分析-------参数响应------频率----------具体操作
image-20200531183219971

注意变量的含义

  • N都表示的是回答的次数(选择这个选项的次数)
  • 百分比是N回答次数(比如559)占总回答次数(1108)的百分比
  • 个案百分比:该选项被选择次数()559在总个案数(总回答人数,714)中所占的百分比

这样就在SPSS中生成了对多项不限选题的一维频率分析

接下来就要把SPSS中的一维频率分析的结果在Excel中转化为调查报告所需的格式.

image-20200531184351795

  • 排序可使用rank函数或者图形化操作
  • 排名可以简单生成:(就是在排序后,数字1然后简单拖动),或者直接使用rank函数

接下来我们需要根据图表对多项不限选题进行绘制统计图

注意:多项不限选题目我们绘制统计图时首先推荐绘制条形图和柱形图,而不能绘制饼图,因为我们的百分比超过了100%(我们需要分析的是个案百分比)

image-20200531185905639

格式调整之后:

image-20200531190129698

最后就可以在word中做调查报告

多选变量使用分类法进行一维频率分析

多选变量使用分类法是多项限选题

对于使用分类法的多选题的一维频率分析,我们

  • 先定义变量集(和使用二分法重新定义变量集的方式相同)
    • 需要注意的是将变量编码为选择**类别:**然后填写类别
  • 然后得到了频率分析的结果,然后就在Excel中进行操作

SPSS中实现多选题的交叉表分析

  • 先查看要分析的交叉表的问题选项的最大值和最小值
  • 分析-------------多重响应----------交叉表------------选择分析的行(这里要填写行的最大值和最小值)--------填写列(列就是我们重新编码的变量集)
  • 在选项中选择:---------单元格百分比(选择行)---------百分比基于(个案)

就得到了多选题的交叉表分析:

image-20200603082744369

然后将表格复制到Excel中进行操作

image-20200603082925998

复制后我们要重新构建表,技巧:原来的表头是横着排列的,我们需要其竖着排列.复制原表头,选择性粘贴中选择转置,对于其他的有横竖转换的粘贴,都可以使用到转置的技巧

image-20200603084225198

在Excel中对多选变量进行一维频率分析

在Excel中对多选变量使用分类法进行一维频率分析

在Excel中要求能向下拖动而保证范围不变,一般改变的是第二个参数,要保证横向拖动而范围不变,一般改变的是第一个参数

image-20200603085609951

在Excel实现二分法编码多选题的一维频率分析

image-20200603090604188

Excel中对使用分类法编码多选变量的交叉表分析

Excel中对使用二分法编码多选变量的交叉变分析

方法和分类法的方法相同.

第7章描述统计分析

描述统计分析

问卷回收后,对于数值型数据(定量数据),通常会以均值.中位数.众数等统计量来描述其集中趋势,也会以标准差.最小值.最大值.极差等统计量老描述其离散程度

均值

  • 描述的是统计量的集中趋势
  • 样本值的平均值.均值是度量数据集中趋势的常用统计量.在参数估计及假设检验中经常用到

众数

  • 统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数不存在或者多余一个)
  • 当数值或观察者没有明显的顺序时,使用众数很有用

在Excel中来统计众数

  • x选中要求众数的数据--------数据标题栏-----排序(升序降序无所谓,要求数据的众数,先要对数据进行排序,才能便于我们进行分类汇总)
  • 数据标题栏---------分类汇总(对谁进行排序就对谁进行分类汇总)

image-20200604194036589

中位数

  • 一组数据排序后位于中间位置上的数
  • 中位数是用中间位置上的数值(求出均值)代表数据的集中趋势,其特点是不易受极端值的影响,所以中位数均值稳健

在Excel中求中位数

注意

  1. 中位数在数据的个数是奇数和偶数时是不同的
  2. 在Excel中求中位数,我们数据得出的中位数的位置都需要加1才是真实的数据位置,因为我们的标题通常要占据一行

image-20200604194959952

分析了在数据是偶数个和奇数个时求中位数的方法,得出了一个统一的方法是:(数据个数+1)/2

奇数个数据求中位数
  • 用到的函数:COUNT()函数,用于求出公式中的中位数的位置(非在Excel中真实的位置)
  • address()函数,需要三个参数
    • 第一个参数:表示行
    • 第二个参数:表示列
    • 第三个参数:表示数据是绝对引用还是混和引用
  • indirect(取数据的位置坐标):用于取出数值代表的坐标的数值

image-20200604200622823

图中第二个函数写错了,应该是=ADDRESS(B13+1,2,4)

偶数个数据求中位数
  • 用到的函数:COUNT()函数,用于求出公式中的中位数的位置(非在Excel中真实的位置)为了确切函数的位置我们在COUNT函数的外面嵌套int函数()
    • 例题中的函数为=INT((COUNT(B2:B11)+1)/2)
  • 偶数中求具体的位置和数值的方法和奇数中一样,这里我们把函数进行一个嵌套,直接得出中位数的数值
    • 例题中求一个中位数使用的函数为:=INDIRECT(ADDRESS(B13+1,2,4))
    • 例题中求第二个中位数使用的函数为:=INDIRECT(ADDRESS(B13+2,2,4))
  • 求出最终的中位数
    • 例题中最后一个中位数使用的函数为:=(B14+B15)/2

image-20200604201343064

不论数据的个数,直接求中位数

image-20200604202530590

这里使用到了mod函数(范围,对谁求余数):求余数函数

离散程度

离散程度描述的是数据散布,即描述集中与离散程度的度量

一般来说,数据越分散,离散程度统计量的值越大

极差

  • 极端值之差.即一组数据的极大值和极小值之差,也称全距
  • 因为极差只是利用了一组数据两端的信息,因而容易受极端值的影响,不能全面反映差异状况

在Excel中求极差就是求出最大值和最小值然后求差.

用到的函数是max函数和min函数

标准差

  • 样本中各个数值到均值的距离的一种平均
  • 标准差实际上的方差的平方根

s = 1 n i = 0 n ( n i x ˉ ) 2 标准差s=\sqrt{\frac{1}{n}\sum_{i=0}^n(n_i-\bar{x})^2}

在Excel中求标准差

  • 求平均值的函数AVERACE(数据范围)
    • 在例题中的函数为:AVERACE(B2:B7)
  • 然后求离差的平方,(数据坐标-均值数据坐标)^2这里的语法和markdown中求平方的语法很像
    • 在例题中的函数为:=(B2-$B$10)^2这里使用了坐标的绝对引用是因为我们需要拖动数据,为了使列坐标保持不变
  • 求方差:就是离差的平方求均值,AVERACE(数据范围)
    • 在例题中的函数为:=AVERACE(C2:C7)
  • 求标准差:数据坐标^(1/2)
    • 在例题中的函数为:=B11^(1/2)
    • 也可以使用函数sqrt(数据范围):=sqrt(B11)

image-20200604213951004

方差

  • 各点到均值距离的平方的平均
  • 方差由于和数据的量纲不同,因而在实际应用中使用得不如标准差那么普遍

s 2 = 1 n i = 0 n ( n i x ˉ ) 2 = ( x 1 x ˉ ) 2 + ( x 2 x ˉ ) 2 + + ( x n x ˉ ) 2 n s^2=\frac{1}{n}\sum_{i=0}^n(n_i-\bar{x})^2=\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\ldots+(x_n-\bar{x})^2}{n}

数据的标准得分

因为评分标准不同导致的最终得分不同,那么不同标准不同得分的数据怎么进行比较呢?

就用到了数据的标准得分,数据标准化之后,再比较标准化之后的数据

  • 标准化的方法:把原始观测值(亦称得分,score)和均值之差除以标准差得到的度量称为标准得分(standard score):(x-m)/s(m表示均值,x表示原始数据,s表示标准差)

image-20200604214150142

分析标准化得分时要分别讨论:

比如题中的得分85和得分73

85分的成绩在1班的成绩中属于中等成绩

73分的成绩在2班的成绩中属于较高的成绩

但是如果是同一份试卷,那么85分的成绩是高于得分74的成绩的

利用SPSS实现定量变量的描述统计分析

分析------描述统计------描述------选项(添加要分析的项)-----选择显示顺序(一般选择按均值的升序排序)

image-20200604215103043

将描述统计结果复制到Excel中进行转换和绘制统计图

image-20200604215218105

转换方式和绘图方式在前面的章节中有具体的操作,这里不做赘述.

利用SPSS实现定量变量的多组均值比较

多组均值意思就是在数据之前有不同的分类,比如医院(私人医院,公立医院,学院医院)在分类的情况下讨论其他值的均值的关系,在本例中工作.工资,升职机会都是度量类型的数据.

在SPSS中操作

分析-----比较均值----均值-----自变量列表就是就是分类的变量-----而因变量的类型就是我们的定量变量(变量的类型是度量类型的变量)-------选项中选择要分析的标准(一般为个案数,标准差,均值)

image-20200604221736754

然后将在SPSS中的分析结果复制到Excel中进行数据的转换和统计图的绘制

image-20200604222043914

利用SPSS实现有序变量的描述统计分析

有序变量指的是:在统计的调查问卷中,我们有时会设置这样的问题:比如你对某几个方面的重要程度进行排序,假如说3个方面,1代表非常重要,2表示无所谓,3表示一点不重要.那么这个变量就是有序变量,

有序变量问题我们在SPSS中把每个选项都使用的是分类法来进行变量的描述

现在我们就要讨论对有序变量的描述统计分析

分析------描述统计------描述------把要分析的多个方面都添加到分析变量中-------选项(一般只选择均值,并选择按照均值的升序排序)

image-20200604223315896

然后将在SPSS中的分析结果复制到Excel中进行数据的转换和统计图的绘制

image-20200604223344209

然后进行调查报告的编写(这里截取了书中标准的模板,这个也是调查报告的标准模板)

image-20200604223502337

利用SPSS实现有序变量的多组均值比较

和多组定量变量同样也就存在多组有序变量,意思就是在原本有序变量的基础上加上了分组(或者称为分类)

分析-------比较均值---------均值-------添加类别变量到自变量菜单---------添加因变量(也就是那些我们要分析的定序变量)----------选项(这里我们只分析均值,也可以添加上个案数)

image-20200604224310745

然后将在SPSS中的分析结果复制到Excel中进行数据的转换和统计图的绘制

这是最终结果

image-20200604224359238

我们在自己绘制统计图时可能会因为建表不同而导致和规定的图表不同

这是我们要点击设计-------切换行/列来转换统计图的行列的格式

image-20200604224809231

利用Excel"描述统计"分析工具实现矩阵题的统计分析描述

矩阵题:

多个题目都有同一分类度量的标准

数据选项卡----数据分析----描述统计--------选择数据区域-----逐列分组-------选中标志位于第一行-----选择输出区域(只能选取一个单元格)------选中汇总统计

image-20200604234859839

图表进行处理

image-20200604234940327

排序(根据满意度)

image-20200604235027326

绘制统计图调整统计图的格式

image-20200604235103155

最终结果

image-20200604234025696

我是一个普通二本的学生,可能写的有不周到之处,希望各位大佬指点.让我们一起努力,不过平庸的生活.
如果您感觉`我写的不错麻烦点个赞.

如果有什么问题,可以留言我们一起探讨
如果有什么建议,也可以留言给我,我会虚心的接收,
最后谢谢您,看完了我的文章

猜你喜欢

转载自blog.csdn.net/qq_40742223/article/details/106583128