机器学习基础总结——2020最新版(随时更新)

一、机器学习(ML)

人工智能的一个分支，让一个计算机程序针对某一特定任务，从经验中学习，并且越来越好。

二、深度学习(DL)

是机器学习算法中的一种算法，一种实现机器学习的技术和方法。

三、机器学习的类型，及详细解释

类型	说明
Supervised learning	训练集包含特征(x)和目标(y)，且目标人为标注【需要你提前告诉模型，你输入的特征是什么，目标是什么】，模型根据这个训练集学习出一个函数，当新的数据到来的时候，可以根据这个函数预测结果
Unsupervised leanrning	有训练集，有输入和输出，与无监督学习相比，训练集没有人为标记
Semi-supervised learning	介于监督学习和无监督学习之间；使用的数据，一部分是标记过的，而大部分是没有标记的
Reforcement learning	通过观察来学习做成某种动作，每个动作都会对环境有所影响，学习对象根据观察到的周围的环境的反馈来做出判断【也是使用未标记的数据，但是可以通过一些方法知道你是离正确答案越来越近还是越来越远（奖惩函数）。可以把奖惩函数看作正确答案的一个延迟、稀疏的形式。可以得到一个延迟的反馈，并且只有提示你是离答案越来越近还是越来越远】

1.监督学习：给其看猫和狗的照片，并告诉哪些是猫、哪些是狗，然后进行分类预测。

2.非监督学习：给你看猫和狗的照片，不告诉哪些是猫、哪些是狗，然后进行分类预测。

3.半监督学习：主要考虑如何利用少量有标签的样本和大量没有便签的样本进行训练和分类。

4.强化学习：用于在规划机器人准则方面，把计算机丢到一个对于它完全陌生的环境或者让它完成一项没接触过的任务，它会自己去尝试各种手段，最后让自己成功适应这一个陌生的环境。for instance，我想训练一个机器人去投篮，我只需要给它一个球，并告诉它你投进了，我就给你记一分，让他自己去尝试各种各样的投篮方法，在开始阶段，它的命中率可能非常低，不过它会像人类一样，自己总结和学习投篮失败或者成功的经验，最后达到很高的命中率。如google的AlphaGo。

5.此外还有一种和强化学习类似的学习方法，叫做遗传算法（genetic algorithm）:模拟我们熟悉的进化理论，淘汰弱者，适者生存，通过这种淘汰机制去选择最优的设计或模型。for instance，让计算机学会玩超级玛丽，最开始的马里奥1代可能不久就牺牲了，然后计算机会根据1代的马里奥随机产生2代，然后在保存这些代里面最厉害的马里奥，淘汰掉比较若的马里奥，然后再次基于强者“繁衍和变异”，生出更强的马里奥，这就是遗传算法的基本思想。

四、Machine Learning涉及的一些python库

1.Numpy:科学计算库

2.Pandas:数据分析库，把numpy进行升级,比如缺失值处理等

3.Matplotlib:数据可视化库

4.Scikit-learn:机器学习库，封装的机器学习的很多算法

特征值——>x，标签值——>y

五、一些概念的介绍

1.神经网络

在计算机里面每一个神经元都有属于他的一个激励函数(activation function)，我们可以用这个函数给计算机一个刺激行为；当我们第一次给这个神经网络看一只飞奔的猫的时候，神经网络里只有部分的神经元被激励或者被激活，被激活的神经元传递下去的信息是计算机最重视的信息，也是对输出结果最有价值的信息；如果预测的结果是一只狗，所有的神经元参数就会被调整。这样一些变得迟钝、一些变得敏感起来，就说明了所有的神经元参数正在被改变，变得对图片里面真正重要的信息敏感，这时被改进的参数就能预测出正确的答案，也就是一只猫。

2.神经网络：梯度下降

optimization(优化问题)的Solutions：