【深度学习笔记】机器学习基本概念

  • 特征:待学习对象的属性
  • 标签:对待学习对象的某一指标的预测
  • 样本:标记好特征以及标签的的待学习对象
  • 数据集:一组样本构成的集合
  • 训练集:用来训练模型的样本集合
  • 测试集:用来检验模型好坏的样本集合
  • 特征向量:表示一个待学习对象所有特征构成的 D D D维向量 x = ˙ [ x 1 , x 2 , . . . , x D ] T x\dot=[x_1,x_2,...,x_D]^T x=˙[x1,x2,...,xD]T

假设训练集 D D D N N N个样本组成,其中每个样本都是独立同分布的,即独立地从相同的数据分布中抽取的,记为
D = ˙ D\dot= D=˙{ ( x ( 1 ) , y ( 1 ) ) , ( x ( 2 ) , y ( 2 ) ) , . . . , ( x ( N ) , y ( N ) ) (x^{(1)},y^{(1)}),(x^{(2)},y^{(2)}),...,(x^{(N)},y^{(N)}) (x(1),y(1)),(x(2),y(2)),...,(x(N),y(N))}

对于给定训练集 D D D,我们希望让计算机从一个函数集合 ϝ = \digamma= ϝ={ f 1 ( x ) , f 2 ( x ) , . . . , f_1(x),f_2(x),..., f1(x),f2(x),...,}中自动寻找一个“最优"的函数 f ∗ ( x ) f^*(x) f(x)来近似每个样本的特征向量 x x x和标签 y y y至今的真实映射关系,对于一个样本 x x x,可以通过函数 f ∗ ( x ) f^*(x) f(x)来预测其标签的值 y ^ = ˙ f ∗ ( x ) \hat{y}\dot=f^*(x) y^=˙f(x)

寻找最优函数通过学习算法 Λ \Lambda Λ来完成。

计算预测结果的准确率 A c c ( f ∗ ( x ) ) = ˙ 1 ∣ D ′ ∣ ∑ ( x , y ) ∈ D ′ I ( f ∗ ( x ) = ˙ y ) Acc(f^*(x))\dot=\frac{1}{|D^{'}|}\sum_{(x,y)∈D^{'}}I(f^*(x)\dot=y) Acc(f(x))=˙D1(x,y)DI(f(x)=˙y),其中 D ′ D^{'} D为测试集, I ( ⋅ ) I(·) I()为指示函数

猜你喜欢

转载自blog.csdn.net/RealCoder/article/details/107296401
今日推荐