AI学习--机器学习


 

01-人工智能概述

  • 机器学习、人工智能与深度学习的关系

达特茅斯会议-人工智能的起点

机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来(人工神经网络)

image

    从图上可以看出,人工智能最开始是用于实现人机对弈,到后面的开始处理垃圾邮件过滤【机器学习,机器去模仿人工神经网络】,到最后的图片识别效果显著【深度神经网络,在图像识别中取得好的成绩】,也就是人工智能发展的3个历程。

  • 机器学习、深度学习的应用

传统预测: 店铺销量预测,移动用户流量消费预测,
图像识别: 人脸识别、无人驾驶
自然语言处理: 英文翻译、文本分类、感情分析、只能客服

image

02-机器学习

  • 什么是机器学习 

机器学习就是从数据中自动分析获得模型,并利用模型对未知的数据进行预测

  大量的数量 –》 发布预测模型 --》 结果预测

image

例如,我们将大量的猫图片,利用Py转换为二进制的文件,然后交给机器去学习,去发现一定的规律后,下次机器就可以在大量的图片中发现包含猫的图片。

  • 数据集的构成: 特征值 + 目前值

image

说明:有些数据我们没有目标值,但是也是可以根据他们的特征进行归类(有专门的算法)


 

03-机器学习算法分类

      根据我们机器学习的结果有无目标值分为监督学习无监督学习

     监督学习根据输入的数据特征分为分类学习回归学习

image

image

监督学习:
            目标值:类别 - 分类问题(猫狗的识别)
                k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
            目标值:连续型的数据 - 回归问题(房屋价格预测,看做曲线)
                线性回归、岭回归

无监督学习:
          目标值:无 - 无监督学习
             聚类 k-means

生活案例:
        1、预测明天的气温是多少度? 回归
        2、预测明天是阴、晴还是雨? 分类
        3、人脸年龄预测? 可回归/可分类
        4、人脸识别? 分类

04-机器学习开发流程

机器学习开发流程:
        1)获取数据(数据量越大,数据越精确)
        2)数据处理(对不符合要求的数据进行剔除,对不完整的数据进行数据完整)
        3)特征工程(把数据处理成符合我们具有特征值的数据)
        4)机器学习算法训练 –》 产生模型
        5)模型评估(用一系列的方法对产生的模型进行评估,如果符合要求,则继续,否则轮训继续进行数据处理和特征工程)
        6)应用(用模型对未知的数据进行预测)

imageimage

05-学习框架介绍

学习框架和资料介绍:
    1)算法是核心,数据与计算是基础【很消耗计算性能,需要能支持它计算的硬件设备,CPU和GPU等】

    2)我们做的都是基于专业的算法工程师的基础上进行数据分析、业务分析、常见算法的整合以及结合特征工程进行参数的调优、优化
    3)  实战类书籍推荐:

              机器学习 -”西瓜书”- 周志华
               统计学习方法 - 李航
               深度学习 - “花书”

    4)开源框架:

image

06-可用数据集

     我们的数据集分为训练集测试集合,机器学习主要用到了sklearn,下面介绍sklearn数据集

  • 可用数据集

    互联网公司内部接口:  借用百度
    学习阶段可以用的数据集:
        1)sklearn
        2)kaggle(数据挖掘)
        3)UCI(加州大学的一个研究机构)

image

  • Scikit-learn工具介绍

image

  • Scikit-Learn安装
# 会帮助我们去安装一下中间的插件,例如Numpy, Scipy等库
pip3 install Scikit-learn

image

  • Scikit-learn包含的内容

image


07-sklearn数据集使用
08-字典特征抽取
09-文本特征抽取CountVectorizer
10-中文文本特征抽取
11-文本特征抽取TfidfVevtorizer
12-数据预处理-归一化
13-数据预处理-标准化
14-什么是降维
15-删除低方差特征与相关系数
16-主成分分析
17-instacart降维案例
18-总结

猜你喜欢

转载自www.cnblogs.com/ftl1012/p/10493332.html
今日推荐