为了解决任务T,设计一段程序,,从经验e中学习,达到性能p,当且仅当有了经验E后,经过评判P,程序在处理T时性能得到提升
机器学习和人类类似,根据历史数据训练模型当做经验,
有标签,代表有监督比如有结果红色绿色(回归分类)
无标签,代表无监督(聚类基于距离,分裂)
分类,回归,聚类,时序分析
概念:
特征:也有称维度,
连续变量:(数值变量):尺寸身高体重 (一般采用回归)
离散数据:季节,性别(通常要进行分箱cut,qcut,或归一化)(一般用分类)
监督学习:含有结果(标签)的数据
分类:样本标签为离散变量
回归:样本标签属于连续变量
分类问题:
生成模型(概率模型)输出概率大的结果
判别模型(非概率)直接根据特征打分判别
联合概率分布