5、数据的重构

目录

一、为什么进行数据重构

二、如何进行数据重构


一、为什么进行数据重构

进行数据分析时,有可能会发现数据的结构并不适合直接进行数据分析操作,如下面数据,但通过复制-粘贴-转置等方法操作又太繁琐,数据量小还行,所以数据重构应运而生

二、如何进行数据重构

1.打开上面数据的文件,可以看到数据结构如下:每个观测记录各占一行,各行之间有唯一的标识变量“编号”进行区分,每个属性或变量各占一列。这种格式称为横向结构,也叫变量组结构

2.将5个日期变量组合为一个,为每个人的每天建立一条观测记录,即为纵向结构,也叫观测量组结构

3.依次单击菜单“数据-重构”,弹出“重构数据向导”对话框,默认值“将选定变量重构为个案”意为将横向结构转为纵向结构,单击“下一步”按钮

4.跳转到第2步“变量组数目”。保留默认值“一个”(因为本例中只重组一组变量),单击“下一步”按钮

5.跳转到第3步“选择变量”。

1)个案组标识选择“”。因为源数据已有“编号”变量作为唯一标识变量

2)目标变量修改为“工时”,并将5个日期变量选入要变换的变量列表中。这一步代表着原来的5个日期变量的值会输出在新变量“工时”中。

3)将“编号”、“姓名”选入固定变量列表中,表示这两个变量仍保持不变。

4)单击“下一步”按钮。

6.跳转到第4步“创建索引变量”。保留默认值“1个”,因为我们只转换一组变量。单击“下一步”按钮

7.跳转到第5步“创建一个索引变量”。选择“变量名”类型,编辑索引变量名称为“日期”。直接单击“完成”按钮

8.输出结果:纵向结构数据——每个人的每天为一条观测记录

猜你喜欢

转载自blog.csdn.net/qq_25990967/article/details/128770672