机器学习基础总结——2020最新版(随时更新)

一、机器学习(ML)

人工智能的一个分支,让一个计算机程序针对某一特定任务,从经验中学习,并且越来越好。

二、深度学习(DL)

是机器学习算法中的一种算法,一种实现机器学习的技术和方法。

三、机器学习的类型,及详细解释

类型 说明
Supervised learning 训练集包含特征(x)和目标(y),且目标人为标注【需要你提前告诉模型,你输入的特征是什么,目标是什么】,模型根据这个训练集学习出一个函数,当新的数据到来的时候,可以根据这个函数预测结果
Unsupervised leanrning 有训练集,有输入和输出,与无监督学习相比,训练集没有人为标记
Semi-supervised learning 介于监督学习和无监督学习之间;使用的数据,一部分是标记过的,而大部分是没有标记的
Reforcement learning 通过观察来学习做成某种动作,每个动作都会对环境有所影响,学习对象根据观察到的周围的环境的反馈来做出判断【也是使用未标记的数据,但是可以通过一些方法知道你是离正确答案越来越近还是越来越远(奖惩函数)。可以把奖惩函数看作正确答案的一个延迟、稀疏的形式。可以得到一个延迟的反馈,并且只有提示你是离答案越来越近还是越来越远

1.监督学习:给其看猫和狗的照片,并告诉哪些是猫、哪些是狗,然后进行分类预测。

2.非监督学习:给你 看猫和狗的照片,不告诉哪些是猫、哪些是狗,然后进行分类预测。

3.半监督学习:主要考虑如何利用少量有标签的样本和大量没有便签的样本进行训练和分类。

4.强化学习:用于在规划机器人准则方面,把计算机丢到一个对于它完全陌生的环境 或者 让它完成一项没接触过的任务,它会自己去尝试各种手段,最后让自己成功适应这一个陌生的环境。for instance,我想训练一个机器人去投篮,我只需要给它一个球,并告诉它你投进了,我就给你记一分,让他自己去尝试各种各样的投篮方法,在开始阶段,它的命中率可能非常低,不过它会像人类一样,自己总结和学习投篮失败或者成功的经验,最后达到很高的命中率。如google的AlphaGo。

5.此外还有一种和强化学习类似的学习方法,叫做遗传算法(genetic algorithm):模拟我们熟悉的进化理论,淘汰弱者,适者生存,通过这种淘汰机制去选择最优的设计或模型。for instance,让计算机学会玩超级玛丽,最开始的马里奥1代可能不久就牺牲了,然后计算机会根据1代的马里奥随机产生2代,然后在保存这些代里面最厉害的马里奥,淘汰掉比较若的马里奥,然后再次基于强者“繁衍和变异”,生出更强的马里奥,这就是遗传算法的基本思想。

四、Machine Learning涉及的一些python库

1.Numpy:科学计算库

2.Pandas:数据分析库,把numpy进行升级,比如缺失值处理等

3.Matplotlib:数据可视化库

4.Scikit-learn:机器学习库,封装的机器学习的很多算法

特征值——>x,标签值——>y

五、一些概念的介绍

1.神经网络

在计算机里面每一个神经元都有属于他的一个激励函数(activation function),我们可以用这个函数给计算机一个刺激行为;当我们第一次给这个神经网络看一只飞奔的猫的时候,神经网络里只有部分的神经元被激励或者被激活,被激活的神经元传递下去的信息是计算机最重视的信息,也是对输出结果最有价值的信息;如果预测的结果是一只狗,所有的神经元参数就会被调整。这样一些变得迟钝、一些变得敏感起来,就说明了所有的神经元参数正在被改变,变得对图片里面真正重要的信息敏感,这时被改进的参数就能预测出正确的答案,也就是一只猫。

2.神经网络:梯度下降

optimization(优化问题)的Solutions:

  • 牛顿迭代法(Newton's method)
  • 最小二乘法(Least Square method)
  • 梯度下降(Gradient Descent):神经网络就属于该类的一个分支

初学神经网络时会遇到这样一个方程:cost func,叫误差方程。用来计算预测中的值和实际的值 有多大的区别。

Cost func = (predicted - real)^2 = (Wx-y)^2

3.卷积神经网络CNN(Convolutional Neural Network)

用于图片识别、视频分析、自然语言处理、药物发现,以及AlphaGo等等。

4.循环神经网络(RNN recurrent neural network)

解决数据之间的关联;用于序列化强的数据,如语音、文字的RNN神经网络

普通RNN的弊端:

提出来LSTM RNN(Long short-term memory RNN)长短期记忆循环神经网络

5.什么是自编码(Autoencoder)?神经网络的非监督学习(没用到标签)

6.GAN(生成对抗网络) Generative Adversarial Nets

神经网络有很多种,譬如:

此外,GAN神经网络,使用无意义的随机数来生成有意义的作品

例如使用戴眼镜的男士+没戴眼镜的男士+没戴眼镜的女士=戴眼镜的女士;根据随机画的几张图片,画出相应的景色图片

7.回归、分类、聚类(无监督)

  • 回归:预测数据为连续型数值
  • 分类:预测数据为类别型数据,并且类别已知
  • 聚类:预测数据为类别型数据,但是类别未知

更新于2020-07-27

猜你喜欢

转载自blog.csdn.net/newlinfeng/article/details/107624088