人工智能入门算法自述

线性回归：已知多组输入输出，ax+b=y，误差平方和对a,b求偏导，然后a,b修改即加上偏导值乘学习率
逻辑回归：已知多组输入输出，1/(1+e^(-ax))=y，误差是cost(h(a,x),y)=-ylog(h(a,x))-(1-y)log(1-h(a,x))
注意y只取0或1，然后对一组样例的误差求和再平均，对参数a求导得偏导值，然后乘学习率
神经网络：感知机扩展版，已知输入输出，前向传导，反向修正

决策树：先求判定目标混乱度，然后求每种分支方法的混乱度，看哪个方法的混乱度下降最多
集成：   bagging：从总样本中有放回地随机抽取样本集
   random forest：样本用bagging法抽n个，再随机抽k个属性建决策树，重复上面两步骤m次，最后m棵决策树投票得到预测分类
   boosting：前一分类器被错误分类的样本下次抽到的权值增大，最后投票时误差率小的分类器话语权大
   stacking：多种分类器（例如KNN与决策树），最后投票

KNN：平面上有两类点，现给出一点问属哪类，防止过拟合与欠拟合，加权KNN，讨论K值交叉验证及选不同K值测试
K-MEANS：把平面上的点分成K类：先随机选K个点作质心，然后每个点归类于最近质心，求每个类的重心作为新质心，循环至质心不变
   优化一：数据大收敛慢，每次取部分样本
   优化二：K值难取，取不同的K用肘部原则
   优化三：对初始点敏感，多次随机取
   优化四：只能识别球形，用密度归类

CNN：   卷积层：局部感受野即5x5划分+权值共享即每个感受野卷积的权值对应相等
   池化层：max/mean/stochastic，same padding/valid padding
   全连接层：神经网络修改权值
RNN：第i隐藏层的输出 = 隐藏层激活函数（第i隐藏层偏置 + 第i隐藏层输入*权重 + 第i-1隐藏层输出*权重）
   输出层的输出 = 输出层激活函数（上一隐藏层输出*权重 + 输出层偏置）
   缺点：易出现梯度消失，改用LSTM

QLearning：先建好Reward表，即每种状态下每种行为的即时奖励，Q表初始为0，就是每种状态下每种行为的期望价值，训练是在每一个状态下，随机选择行为并更新Q表，直至走到终点，再开始下一次训练，Q(s,a)=即时奖励R(s,a)+折扣*max(Q(s',b),Q(s',c),Q(s',d))，其中s'是s执行a后转移得到，a,b,c,d是行为，s,s'是状态

Deep QLearning：就是把Q表更新的过程变成神经网络，与Q表一样输入状态，输出所选决策

人工智能入门算法自述

猜你喜欢