深度学习目标检测项目实战(五)—基于mobilenetv2和resnet的图像背景抠图及其界面封装

编程语言 2023-06-18 19:36:54 阅读次数: 0

深度学习目标检测项目实战(五)—基于mobilenetv2和resnet的图像背景抠图及其界面封装

该项目很有意思，也是比较前沿，项目主要参考了开源代码：
https://github.com/PeterL1n/BackgroundMattingV2

环境搭建

kornia==0.4.1
tensorboard==2.3.0
torch==1.7.0
torchvision==0.8.1
tqdm==4.51.0
opencv-python==4.4.0.44
onnxruntime==1.6.0

数据集

https://grail.cs.washington.edu/projects/background-matting-v2/#/datasets
下载比较小的数据集

训练

主要看readme的介绍
有两个训练的代码：
train_base.py
train_refine.py
要用gpu训练，不然顶不住，比如

 CUDA_VISIBLE_DEVICES=0,1 python train_refine.py \
     --dataset-name videomatte240k \
     --model-backbone resnet50 \
     --model-name mattingrefine-resnet50-videomatte240k \
     --model-last-checkpoint "PATH_TO_LAST_CHECKPOINT" \
     --epoch-end 1

配置data_path.pth以指向您的数据集。原始论文使用train_base.pth只训练基本模型直到收敛，然后使用train_refine.pth端到端训练整个网络。更多细节将在论文中详细说明：
https://arxiv.org/abs/2012.07810

使用

inference_images.py：在图像目录上执行抠图。
inference_video.py：对视频进行抠图处理。
inference_webcam.py：一个使用网络摄像头的交互式抠图演示。

将结果保存为pth文件：
pytorch_mobilenetv2.pth

界面效果

封装成web界面，有模有样。
在这里插入图片描述

在这里插入图片描述

需要界面代码可以私聊。
这个开源代码的写法很值得学习。

猜你喜欢

转载自blog.csdn.net/weixin_39735688/article/details/130100067

深度学习目标检测项目实战(五)—基于mobilenetv2和resnet的图像背景抠图及其界面封装

深度学习目标检测项目实战(三)—基于Yolov5的遥感图像目标检测及其界面封装

tensorflow MobileNetV2的目标检测测试

深度学习目标检测项目实战(四)—基于Tensorflow object detection API的骨折目标检测及其界面运行

机器学习笔记 - 基于MobileNetV2的迁移学习训练关键点检测器

深度学习目标检测项目实战(六)-基于Faster rcnn pytorch的遥感图像检测

MobileNetV2学习与实现

深度学习模型压缩之MobileNetV2

目标检测YOLO实战应用案例100讲-基于深度学习的SAR图像舰船目标检测

MobileNet实战：tensorflow2.X版本，MobileNetV2图像分类任务（大数据集）

MobileNet实战：tensorflow2.X版本，MobileNetV2图像分类任务（小数据集）

MobileNetV2 论文学习

深度学习目标检测项目实战(一)—基于深度学习框架yolov的交通标志检测

基于TF-Slim使用MobilenetV2进行图像分类

MobileNetV2

MobilenetV2学习笔记 --- MobileNetV2: Inverted Residuals and Linear Bottlenecks

目标检测YOLO实战应用案例100讲-基于深度学习的光学遥感图像目标检测及价值评估

目标检测YOLO实战应用案例100讲-基于深度学习的可见光遥感图像目标检测

目标检测YOLO实战应用案例100讲-基于深度学习的SAR图像舰船目标检测（续）

深度学习目标检测项目实战(二)—基于Faster-RCNN的交通标志检测

基于深度学习的复杂背景下目标检测

paddlepaddle2.3 实现mobilenetv2图像分类

Pytorch CIFAR10图像分类 MobileNetv2篇

基于mobilenetV2的deeplabV3+模型-空洞卷积

基于视频分析 Mobilenetv2 网络结构

第七课：MobileNetv1、MobileNetv2、MobileNetv3学习

人像抠图——基于深度学习一键去除视频背景

【深度学习实战04】——SSD tensorflow图像和视频的目标检测

深度学习图像分类（五）： ResNet

MobileNetv2优化问题

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)