计算机视觉-图像检索

初识图像检索

什么是图像检索

当我们在搜索引擎输入“法斗”时,网页会出现很多的关于法斗的图片,这个可以理解为图片检索。此外,当我们喜欢一个东西却不知道它的购买链接时,我们可以拍下来在网上搜索,如百度识图,淘宝识图。
这位两种情况都是图片检索,一个是文字检索,一个是根据图片内容进行检索。

图像检索的特征选取

小孩只见过“法斗”,“比熊”的话,当他出门玩耍的时候看见了“金毛”,他肯定能推断出这是一只狗,而不会想这是一只兔子。这是因为他通过狗的特征进行判断的。那么如何进行图片检索呢?答:要通过图片的特征。
图片的特征:
1:局部特征
从图像局部区域中抽取的特征,包括边缘、角点、线、曲线和特别属性的区域等。
2:全局特征
颜色特征、纹理特征和形状特征,比如强度直方图等

实际案例分析

街景字符编码识别

将不定长字符转换为定长字符的识别问题,并使用CNN完成训练和验证,具体包括以下几个步骤:
1 赛题数据读取(封装为Pytorch的Dataset和DataLoder)
2 构建CNN模型(使用Pytorch搭建)
3 模型训练与验证
4 模型结果预测

先检测出字符的具体位置,假定每幅图有11个字符,没有的自动填充。检测出来以后进行比对

猜你喜欢

转载自blog.csdn.net/qq_43440040/article/details/106238305
今日推荐