MTCNN 训练记录（待续） - 代码天地

MTCNN 训练记录（待续）

其他 2019-01-29 13:01:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/pingfan2014/article/details/86626864

训练

1.基础问题
a.样本问题，mtcnn训练时，会把训练的原图样本，通过目标所在区域进行裁剪，得到三类训练样本，即：正样本、负样本、部分(part)样本
其中：
裁剪方式：对目标区域，做平移、缩放等变换得到裁剪区域
IoU：目标区域和裁剪区域的重合度

此时三类样本如下定义：
正样本：IoU >= 0.65，标签为1
负样本：IoU < 0.3，标签为0
部分(part)样本：0.65 > IoU >= 0.4，标签为-1

b.网络问题，mtcnn分为三个小网络，分别是PNet、RNet、ONet，新版多了一个关键点回归的Net（这个不谈）。
PNet：12 x 12，负责粗选得到候选框，功能有：分类、回归
RNet：24 x 24，负责筛选PNet的粗筛结果，并微调box使得更加准确和过滤虚警，功能有：分类、回归
ONet：48 x 48，负责最后的筛选判定，并微调box，回归得到keypoint的位置，功能有：分类、回归、关键点

c.网络大小的问题，训练时输入图像大小为网络指定的大小，例如12 x 12，而因为PNet没有全连接层，是全卷积的网络，所以预测识别的时候是没有尺寸要求的，那么PNet可以对任意输入尺寸进行预测得到k个boundingbox和置信度，通过阈值过滤即可完成候选框提取过程，而该网络因为结构小，所以效率非常高。

2.训练步骤
参考：https://github.com/dlunion/mtcnn/tree/master/train
一般训练几万次后，loss到0.0x的时候就可以接受了

记得在当前目录下创建models-12、models-24、models-48来迎接喜气招财哟~

3.使用阶段
将训练的caffemodel，复制到caffemodel_2_mtcnnmodel里面，编译执行他（代码写的必须3个网络同时存在，所以自己看情况改下），这时候产生的mtcnn_models.h，就是我们要的网络头文件，添加到mtcnn-light覆盖下就可以执行看效果

猜你喜欢

转载自blog.csdn.net/pingfan2014/article/details/86626864

MTCNN 训练记录（待续）

MTCNN训练

MTCNN的训练与测试小结

MTCNN（一）训练与运行

MTCNN训练数据整理

MTCNN训练整理

MTCNN网络的训练

MTCNN论文的阅读记录

mtcnn

MTCNN配置及训练详细步骤

MTCNN对训练数据进行采样

MTCNN创建训练样本

基于PyTorch的MTCNN复现记录

人脸检测：MTCNN的训练数据处理

MTCNN训练统计分析

MTCNN理解到亲手训练

利用celebA数据集训练MTCNN网络

人脸检测：MTCNN的训练步骤和样本的处理

人脸检测：MTCNN训练数据正负样本生成

人脸检测之MTCNN：训练过程详解

人脸检测MTCNN的训练过程（PRO网络）

人脸检测之MTCNN（二）——模型的训练尝试

MTCNN人脸检测及人脸关键点提取（学习记录）

MTCNN试用

口述MTCNN

mtcnn原理

MTCNN 复现

Training MTCNN

MTCNN 人脸

MTCNN笔记

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)