bag of Word

这里写图片描述

词袋模型

词袋模型概述

词袋模型起先应用在文本处理领域。给定的文本中 ,提取出关键词,然后统计每个关键词出现的次数,然后根据每个关键词在每个文档中出现的次数,将关键词表示成向量的形式。例如一个稳定中有五个关键词,这个文档中的每一个关键词出现的次数依次写下就是记录成一个向量的形式。每一个关键词都是相互独立的,那么整个文档就可以表示成关键词出现频率的集合;

词袋模型在计算机视觉中的应用

类似文本处理统计关键词出现的概率的方法,我们将词袋模型应用在图像处理和识别领域。文本领域是可以提取关键词的,要提取图像的关键词,就得构造图像的关键词,利用k-means对提取到的大量的特征进行无监督聚类,将具有相似性较强的特征归入到一个类别中。将每个聚类中心为关键词。聚类类别的数量就是词典的大小、对于每一类的图形进行视觉单词的统计,就会得到视觉词典。之后采用同样的方法将待分类图像中的每一个特征和词典中的数字键进行匹配,寻找每个特征对应的最相似的视觉单词。得到直方图统计,然后去分类器中进行统计。

词袋模型在计算机视觉中的应用的具体步骤详解

  • 特征提取和描述
    特征提取就是从图像中抽取出具有代表性的局部特征,这些特征具有较强的区分性,可以最大限度与其他物体区分开,还要有较好的稳定性,这些区域通常存在于图像的高对比度区域。例如图像的边缘和角点。
    1.规格网格就是将网格,,
    就可以得到图像的局部特征。
    2.兴趣点检测方法
    兴趣点检测子和兴趣区域检测子都通过数学计算的
    常用的检测子有edge-laplace、harris-laplace、hessian-laplace、harris-affine、hessian-affine、MSER、salient regions
  • 视觉词典构造
    对前面提取的特征构造视觉词典,分为k 个簇,簇(:з」∠)额相似度很高,簇间的相似度很低,将词义相似的词汇进行合并,作为整个单词的基础词汇。簇的类别就是词典的大小。
  • 单词中的词汇表示图像
    每个图像中都有很多的特征点,将每个特征点用词典中的单词表示。统计每个单词出现的次数,可以将每幅图像表示成一个K维的特征i向量。

猜你喜欢

转载自blog.csdn.net/yychentracy/article/details/82253206