版权声明:本文为博主原创文章,未经允许,不得转载!欢迎留言附带链接转载! https://blog.csdn.net/qq_15698613/article/details/86292355
0 统计量:描述数据特征
0.1 集中趋势衡量
- 均值,平均数,平均值,mean
- 中位数:将数据中的各个数值按照大小顺序排列,居于中间的变量,若是偶个数,取中间两个均值
- 众数:数据出现次数最多的书
0.2 离散程度衡量
- 方差 variance
- 标准差 standard deviation,方差的开二次方
1 回归问题和分类问题区别:
回归问题:Y变量是连续性数值,比如房价,人数,
分类问题:Y变量是类别型,如电脑品牌
2 简单线性回归(simple linear regression)
- 很多决定过程是根据两个或者多个变量之间的关系
- 回归分析用来建立方程模拟两个或多个变量之间如何关联
- 被预测变量叫做因变量(dependent variable) ,输出值
- 用来使用的变量叫做自变量(independent variable),输入值
3 什么是简单线性回归?
- 简单线性回归智包含一个自变量x,一个因变量y
- 两个变量关系用一条直线来模拟
- 如果多于两个以上的自变量,称为多元回归分析 (multiple regression)
4 简单线性回归模型
- 被用来描述y和x以及偏差之间关系的方程叫做回归模型
- 简单模型是
5 简单线性回归方程
6 线性关系
- 正向线性关系,系数>0
- 负向线性关系,系数<0
- 无关系,系数=0
7 估计的简单线性回归方程
8 线性回归分析流程
9 关于偏差的设定
- 是一个随机变量,均值是0
- 方差对于所有自变量x都是一样的
- 偏差的值是独立分布
- 偏差的值满足正态分布