(CV,Math)仿射几何

本文地址: 1 仿射变换矩阵表示以二维坐标为例讲述仿射变换。变换前坐标为(x,y)(x,y),变换后坐标为(x′,y′)(x',y'),本文均使用齐次坐标系,且此处不介绍其次坐标。二维仿射变换保持了图像的“平直性”(即变换后直线还是直线)和“平行性”(平行线还是平行线)。仿射变换可以通过一系列的原子变换的复合来实现,包括:平移(Translation)、缩放(Scale)、翻转(Flip)、旋转(R
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(CV,Math)射影几何

本文地址: 计算机视觉中常涉及欧式几何(Euclidean Geometry)、仿射几何(Affine Geometry)、射影几何(Projective Geometry)、微分几何( Differential Geometry)。 1 无穷远点元素 对nn维欧式空间加入无穷远元素,并对有限元素和无穷远元 素不加区分,则他们共同构成nn维射影空间。 一维射影空间是一条射影直线,
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(CV)三维视觉

本文地址: 1 仿射变换矩阵表示 以二维坐标为例讲述仿射变换。变换前坐标为(x,y)(x,y),变换后坐标为(x′,y′)(x',y'),本文均使用齐次坐标系,且此处不介绍其次坐标。 二维仿射变换保持了图像的“平直性”(即变换后直线还是直线)和“平行性”(平行线还是平行线)。仿射变换可以通过一系列的原子变换的复合来实现,包括:平移(Translation)、缩放(Scale)、翻转(F
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Caffe,LeNet)反向传播(六)

本文地址: 本部分剖析Caffe中Net::Backward()函数,即反向传播计算过程。从LeNet网络角度出发,且调试网络为训练网络,共9层网络。具体网络层信息见 (Caffe,LeNet)初始化训练网络(三) 第2部分本部分不介绍反向传播算法的理论原理,以下介绍基于对反向传播算法有一定的了解。1 入口信息Net::Backward()函数中调用BackwardFromTo函数,从网络最后一层到
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Caffe,LeNet)权值更新(七)

本文地址: 在Solver::ApplyUpdate()函数中,根据反向传播阶段计算的loss关于网络权值的偏导,使用配置的学习策略,更新网络权值从而完成本轮学习。
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Math)矩阵求导

本文地址:http://blog.csdn.net/mounty_fsc/article/details/51583809 前言 本文为维基百科上矩阵微积分部分的翻译内容。本文为原文的翻译与个人总结,非一一对照翻译。由于水平不足理解不够处,敬请原谅与指出。原文地址https://en.wikipedia.org/wiki/Matrix_calculus。原文为矩阵微积分,本文题为矩阵求导,原因是
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Caffe)基本类Filter(五)

本文地址: Filter类在Caffe中用来初始化权值大小,有如下表的类型: 类型 派生类 说明 constant ConstantFiller 使用一个常数(默认为0)初始化权值 gaussian GaussianFiller 使用高斯分布初始化权值 positive_unitball PositiveUnitballFiller uniform
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Paper)Network in Network网络分析

本文地址: 《Network in Network》论文笔记1.综述这篇文章有两个很重要的观点: 1×1卷积的使用 文中提出使用mlpconv网络层替代传统的convolution层。mlp层实际上是卷积加传统的mlp(多层感知器),因为convolution是线性的,而mlp是非线性的,后者能够得到更高的抽象,泛化能力更强。在跨通道(cross channel,cross feature map
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Slide)CNN图像分类与物体检测

本文地址
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Slide)论文笔记:Generative Visual Manipulation on the Natural Image Manifold

PPT地址:http://download.csdn.net/download/mounty_fsc/10113012
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

(Slide)Attention Mechanism注意力机制

PPT地址:http://download.csdn.net/download/mounty_fsc/10113027
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

OpenCV|图片与视频的相互转换(C++&Python)

前言在学习opencv的过程中,终会遇到需要把视频转换成图片处理,或者把处理后的图片保存为视频格式的时候。这篇文章中就来看一下如何进行图片和视频之间的相互转换。视频转图片对于这种情况大家应该很熟悉了。因为学习opencv的时候肯定打开过摄像头,比如打开摄像头检测个人脸或者笑脸之类的。在这个过程中,实际就是把摄像头拍摄到的视频转换为一帧一帧的图片连续地进行处理。我们知道,对于打开视频和摄像头,open
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

人脸识别源码运行指南

前言人脸识别的源码放出来之后,不少小伙伴下载之后仍然不能运行成功。于是被逼无奈,把源代码改成了我认为最容易运行成功的版本。即使如此,我认为写下这个指南还是有必要的。因为反复回答相同的问题实在是太累人了。 重复一遍,本文环境为win7+vs2015+opencv3.2_with_contrib源码下载地址公众号回复:人脸识别源码或者 网盘: http://pan.baidu.com/s/1b1J2
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

百度AI开发者大会见闻

7月5日在国家会议中心举办的百度AI开发者大会结束好,貌似吃瓜群众关注的重点是李彦宏乘坐无人驾驶汽车被交警介入调查。一般违反交通规则的处罚,包括罚款扣分吊销驾驶证啥的,针对的都是开车司机。那么问题来了,对于没有司机的无人驾驶汽车,到底要扣谁的分?难道是坐在副驾驶上的“乘客”李彦宏的吗? 但是不管这些吸引眼球的新闻,作为一个通过CSDN拿到票的小白来说,听了陆奇了讲了一个上午,除了总体思路是让人觉
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

OpenCV3.3出炉,DNN为最大亮点

OpenCV3.3在8月3号正式出炉,想要体验最新特性的朋友可以去官网下载了,反正配置一下只需要几分钟。这次最主要的更新就是,终于把DNN模块从contrib里面提到主仓库里面,放到了官方发布版中。虽然我配置的一直是OpenCV with contrib,但是对于DNN模块,限于电脑配置太低,一直没有怎么尝试。这次可以借着新版发布抽空尝试一下了。按照官方介绍,DNN现在有下面几点特性:无需任何依赖新
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

OpenCV的鼠标操作——用鼠标画矩形(代码解读)

起因知乎上被邀请回答一个问题,关于OpenCV的鼠标操作的问题。我发现回答下来写了不少东西,可以整理为一篇文章发出来,顺便说下不少人关心的如何用操作鼠标,比如如何用鼠标在图像上画一个矩形或者说选择一个矩形的ROI。知乎上的问题问的是下面这段代码是什么意思。正好,这段代码我是看过的,而且就在最近两周。所以正好可以说道一下。介绍这一段代码我最初是在contrib模块里面tracking模块的sample
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

UnicodeDecodeError: 'rawunicodeescape' codec can't decode bytes in position 80-81: truncated \UXXX

一、环境 windows 7 python3.6(Anaconda3) keras 2 api 二、模型保存遇到了这个问题保存部分代码如下:model_name = 'ssd7_0' model.save("ssd7_0.h5") model.save_weights(r'ssd7_0_weights.h5')然后运行就遇到了这个问题:--------------------------------
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

OpenCV的dnn模块调用TesorFlow训练的MoblieNet模型

一、初得模型那是一个月之前的事情了,我利用TesorFlow Object Detection API训练了现在目标检测里面应该是最快的网络MobileNet。当时的目的就只是学习整个finetuning的流程,于是我只是用了20张自己标注的人脸样本图片作为训练集去finetuning,训练完之后的模型通过修改TesorFlow Object Detection API自带的例程代码,即object
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

有人开源了Mask R-CNN对象检测和分割的Keras和TensorFlow代码

有人在github上发布了何凯明的Mask R-CNN目标检测和对象分割Keras和TensorFlow的实现代码。这个实现基于Python 3、Keras和TensorFlow。模型对图片中的每个对象实例生成包围框(bounding boxes)和分割掩膜(segmentation masks)。基于特征金字塔网络(FPN)和ResNet101的主干(backbone)。 这个giuhub仓
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0

用Python给头像加上圣诞帽

引言随着圣诞的到来,大家纷纷@官方微信给自己的头像加上一顶圣诞帽。当然这种事情用很多P图软件都可以做到。但是作为一个学习图像处理的技术人,还是觉得我们有必要写一个程序来做这件事情。而且这完全可以作为一个练手的小项目,工作量不大,而且很有意思。用到的工具 OpenCV(毕竟我们主要的内容就是OpenCV…) dlib(前一篇文章刚说过,dlib的人脸检测比OpenCV更好用,而且dlib有OpenCV
分类: 其他 发布时间: 09-22 23:28 阅读次数: 0