机器学习基础之《概述》

一、机器学习与人工智能、深度学习
1、机器学习是人工智能的一个实现途径
2、深度学习是机器学习的一个方法发展而来

二、统计学习和机器学习
实际机器学习在上世纪80年代已经出现,搞统计的

机器学习中有一个方法,叫人工神经网络,发展成深度学习

三、机器学习、深度学习能做什么
机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景

机器学习领域:
1、传统预测
2、图像识别
3、自然语言处理

用在挖掘、预测领域:
应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类...

用在图像领域:
应用场景:街道交通标志检测、人脸识别等等

用在自然语言处理领域:
应用场景:文本分类、情感分析、自动聊天、文本检测等等

四、什么是机器学习
1、定义
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

2、解释
我们人从大量的日常经验中归纳规律,当面临新的问题的时候,就可以利用以往总结的规律去分析现实状况,采取最佳策略

对猫、狗的识别:
从数据(大量的猫和狗的图片)中自动分析获得模型(辨别猫和狗的规律),从而使机器拥有识别猫和狗的能力

预测房屋的价格:
从数据(房屋的各种信息)中自动分析获得模型(判断房屋价格的规律),从而使机器拥有预测房屋价格的能力

思考问题:
从历史数据当中获得规律,这些历史数据是怎样的格式?

3、数据集构成
结构:特征值+目标值

注:
对于每一行数据我们可以称之为样本
有些数据集可以没有目标值

五、机器学习算法分类
1、如何区分猫和狗
特征值:猫/狗的图片
目标值:猫/狗 - 类别
  是分类问题

2、对房屋价格进行预测
特征值:房屋的各个属性信息
目标值:房屋价格-连续性数据
  是回归问题

3、识别职业
特征值:人物的各个属性信息
目标值:无
  是无监督学习

4、分类
目标值:类别 - 分类问题
目标值:连续型的数据 - 回归问题
目标值:无 - 无监督学习
分类是逻辑回归,预测是线性回归

5、小练习
预测明天的气温是多少度?  回归
预测明天是阴、晴还是雨?  分类
人脸年龄的预测?  具体年龄:回归问题;判断大小:分类问题
人脸识别?  分类

6、监督学习(supervised learning)(预测)
定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)
分类:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
回归:线性回归、岭回归

7、无监督学习(unsupervised learning)
定义:输入数据是由输入特征值所组成
聚类:k-means

六、机器学习开发流程

步骤:
1、获取数据(爬虫)
2、数据处理(数据分析)
3、特征工程
4、使用机器学习算法训练,训练好之后得到模型
5、模型评估(验证集)
如果模型比较好,就可以应用了
如果模型不好,返回数据处理重新来过,产生新的模型

七、学习框架和资料

1、需明确几点问题
(1)算法是核心、数据与计算是基础
(2)找准定位

2、大部分复杂模型的算法设计都是算法工程师在做,而我们
(1)分析很多的数据
(2)分析具体的业务
(3)应用常见的算法
(4)特征工程、调参数、优化

3、我们应该怎么做
(1)学会分析问题,使用机器学习算法的目的,想要算法完成何种任务
(2)掌握算法基本思想,学会对问题用相应的算法解决
(3)学会利用库或者框架解决问题
当前重要的是掌握一些机器学习算法等技巧,从某个业务领域切入解决问题

机器学习 -- "西瓜书" 周志华
统计学习方法 -- 李航
深度学习 -- "花书"

4、库和框架
先成为一个调包侠~

pytorch、tensorflow、theano、caffe2、chainer、华为的mindspore
theano可以看做tensorflow的前身
chainer可以看做pytorch的前身

猜你喜欢

转载自blog.csdn.net/csj50/article/details/131480356