1.確率分布
学習は、フロントに戻っているので、我々は、確率分布の回帰を通して見るために持っているので、
分類結果があるときに、クラス1は
、結果は-1で、クラス2に分類
結果は1クラス1に近い場合、結果ならば、テストそれは-1 class2の近くにあります。
しかし、その後、それだけで非常に美しく見えますが、彼はクラス1に分類したり、それをCLASS2しなければならないとき、結果が1よりもはるかに大きいとき場合と?我々は、分類機能が発見された調整する必要があり、全体の誤差を小さくするために、これは不正確な実際の結果につながります。
私たちが解決するための回帰を使用することはできません対象の種類の確率分布のためにそう。
:機械学習は、まだ三つのステップに従う
。1.デザインモデルを
:私たちは、たとえば、バイナリCHANG教師の映像に応じて使用
2.loss機能(機能喪失)
最高の機能を探す3.
(perceptorn、SVM)2種類を使用します方法。
2.確率生成モデル
根据李宏毅老师的视频中我们设计了两个盒子box1和box2 假设我们重盒子里面拿出来的蓝球为p(b1) = 2/3 , 则绿球的概率p(b2) = 1/3 假设p(b1|x)>0.5说明x属于box1;反之则属于box2。
因此盒子来自box1的概率为:
其中这里面涉及有关数论的知识,由于本身没有学过,所以里面有些内容不是很理解。
我们假设这种概率分布模型是高斯分布(因为是最常见的分布类型),根据概率论中的中心极限定理告诉我们答案,所以我们选择的高斯分布。
相关理解可以查阅网站:
其中均值为μ,协方差为∑(用来表示一组数据的波动大小的)
根据李宏毅老师的视频中我们假设有79组宝可梦数据,因此:
我们计算得出μ和∑的值
3.解决分类问题
(李宏毅老师的例子)
开始我们的分类问题:
我们要进行二分类,分别是水系的怪物精灵和一般的怪物精灵,我们计算得到他们的高斯分布分别为
我们就可以用第一部分的概率分布公式计算x的分类了,水系p(C1),非水系p(C2)分别在数据中就可以简单计算,p(x∣C1),p(x∣C2)由它们概率密度函数推导求解得到(积分)。
如果P(C1|x)>0.5,说明x属于水系。
但是得到的结果的正确率只有54%。
分析一下原因,是由于两类额协方差导致参数过多,那我们让协方差共享∑\sum∑,减少协方差的种类。
这样正确率就达到了73%
本图片,公式均引用自李宏毅老师的机器学习。
以上是我对李宏毅老师视频学习的笔记记录。