朴素贝叶斯模型1

是什么

考虑如下文本分类问题:训练集为n条文本特征1,文本类别对,\(\{(\mathbf{t}^i,c^i)\}_{i=1}^n\)2
现给定文本特征\(\mathbf{t}\),要求判定它的类别。
朴素贝叶斯做法就是算使得\(p(\mathbf{t},c)\)最大的\(c^*\)作为\(\mathbf{t}\)的类别:
\[ c^*=\arg \max p(\mathbf{t},c) \]
其中,
\[ p(\mathbf{t},c)=p(c)\prod_{j=1}^{m} p(t_j|c) \]
而右边的\(p(c)\),\(p(t_j|c)\)则是由训练数据估计值代替,则估计值为:

\[ p(c)=\frac{\#\{c^i=c\}}{n} \]

\[ p(t_j|c^i=c)=\frac{\#\{c^i=c\quad\text{and}\quad t^i_j=t_j\} }{\#\{c^i=c \}} \]
考虑如下文本分类问题:训练集为n条文本特征3,文本类别对,\(\{(\mathbf{t}^i,c^i)\}_{i=1}^n\)4
现给定文本特征\(\mathbf{t}\),要求判定它的类别。
朴素贝叶斯做法就是算使得\(p(\mathbf{t},c)\)最大的\(c^*\)作为\(\mathbf{t}\)的类别:
\[ c^*=\arg \max p(\mathbf{t},c) \]
其中,
\[ p(\mathbf{t},c)=p(c)\prod_{j=1}^{m} p(t_j|c) \]
朴素贝叶斯做法就是算使得\(p(\mathbf{t},c)\)最大的\(c^*\)作为\(\mathbf{t}\)的类别:
\[ \begin{align} c^*=\arg \max p(\mathbf{t},c) \end{align} \]
朴素贝叶斯做法就是算使得\(p(\mathbf{t},c)\)最大的\(c^*\)作为\(\mathbf{t}\)的类别:
\[ \begin{align} c^*=\arg \max p(\mathbf{t},c) \end{align} \]


  1. 假设每条文本特征有m个属性

  2. 用上标表示整条记录,用下标表示这条记录一部分,即\(\mathbf{t}^i=[t_1^i,t_2^i,...,t_m^i]\)

  3. 假设每条文本特征有m个属性

  4. 用上标表示整条记录,用下标表示这条记录一部分,即\(\mathbf{t}^i=[t_1^i,t_2^i,...,t_m^i]\)

猜你喜欢

转载自www.cnblogs.com/qizhien/p/11282540.html
今日推荐