基础笔记1 补充

认识数据

认识数据
1.数据
1.1.数据对象
1.2.数据集
1.2.1.多个数据对象的集合
1.2.2.行代表着不同的样本,列代表着不同特征
1.3.数据的属性
1.3.1.标称属性
其值是一些符号或者事物的名称
如头发的颜色,如人的姓名
1.3.2.二元属性
特殊的标称属性
•	只有两种结果的标称属性
对称的二元属性
•	两种结果重要性一样
•	如:男女
非对称的二元属性
•	两种结果重要性不一样
•	如:是否患病
1.3.3.序数属性
其可能的值之间具有有意义的序或者秩评定(ranking),但是相继值之间的 差是未知的。
如:身高的高、中、矮;如颜值的帅、中等、不帅;如成绩的优良中差
1.3.4.数值属性
具有真实数值的属性
•	离散属性
•	离散的、类别的
•	具有有限或者无限可数个值。
•	如省编号
•	如超市的VIP编号
•	可以用或者不用整数表示。
•	连续属性
•	连续的小数
2.统计指标
2.1.更好地识别数据的性质,把握数据全貌、查看的走势、及分布范围
2.2.如:均值、众数、分位数、最大值、最小值等统计指标
3.数据可视化
3.1.更加直观的去把握数据全貌、走势、波动
3.2.折线图、柱状图、直方图、饼图、散点图、箱线图、雷达图
4.相关性与相异性

认识数据处理

认识数据处理
1.为什么要进行数据处理
1.1.数据是杂乱无章的
1.1.1.由于人、机为的造成数据的丢失、异常、不一致等数据问题
1.2.没有高质量的数据处理,就没有高质量的结果
2.数据处理操作
2.1.数据清洗
2.1.1.1、缺失值处理
2.1.2.2、异常值处理
2.1.3.3、数据的统一化
2.2.数据合并
2.2.1.进行数据的拼接
2.3.数据规约
2.3.1.去除量级的影响
2.3.2.标准化
2.4.数据转化
2.4.1.将非数值型的类别型数据转化为数值型数据
2.4.2.将连续型的数据离散成类别型数据

矩阵

矩阵
1.m*s数表,用中括号括起来
2.对角矩阵
2.1.除过对角线之外的所有的矩阵元素都为0
2.2.如果对角矩阵的对角线上全部为1,那么该矩阵被称为单位矩阵,记为E
3.矩阵的运算
3.1.矩阵与矩阵的相加
3.1.1.对应位置元素进行相加
3.1.2.注意:同型矩阵
3.1.3.不同型的零矩阵是不相同的
3.2.矩阵与数的相乘
3.2.1.矩阵的每一个元素与数进行相乘
3.3.矩阵与矩阵的相乘
3.3.1.规则
左矩阵的列数必须等于右矩阵的行数,才能进行相乘,生成一个左矩阵行、右矩阵列的矩阵
4.矩阵的属性
4.1.转置
4.1.1.行列互换
4.2.矩阵的逆
4.2.1.如果矩阵可逆,那么矩阵*矩阵的逆=E

数据分析概念

数据分析概念
1.数据采集、数据处理、数据可视化来发现数据的规律并进行分析,撰写报告
2.数据分析
2.1.偏向于业务,注重于解决具体的问题
3.数据挖掘
3.1.利用数据、利用所学Python知识进行数据价值的挖掘
发布了128 篇原创文章 · 获赞 24 · 访问量 4262

猜你喜欢

转载自blog.csdn.net/return_min/article/details/103896636