pytorch实现mtcnn人脸检测算法

pytorch实现mtcnn人脸检测算法

原博地址: https://blog.csdn.net/Sierkinhane/article/details/83308658
mtcnn-pytorch代码: https://github.com/Sierkinhane/mtcnn-pytorch(star!)
论文地址: https://kpzhang93.github.io/MTCNN_face_detection_alignment/paper/spl.pdf

这篇博客记录本人复现CSDN博主@Sierkinhane 提供的mtcnn-pytorch人脸检测算法代码的过程,感谢@Sierkinhane的工作。

训练数据准备

训练步骤

  • 生成P-Net训练数据(positive、negative、part)

    run > python mtcnn/data_preprocessing/gen_Pnet_train_data.py
    run > python mtcnn/data_preprocessing/assemble_pnet_imglist.py

  • 训练 P-Net

    run > python mtcnn/train_net/train_p_net.py

  • 生成R-Net训练数据(positive、negative、part)

    run > python mtcnn/data_preprocessing/gen_Rnet_train_data.py (可能你需要修改代码中已经训练好的P-Net模型路径,默认的是原来的模型)
    run > python mtcnn/data_preprocessing/assemble_rnet_imglist.py

  • 训练 R-Net

    run > python mtcnn/train_net/train_r_net.py

  • 生成O-Net训练数据(positive、negative、part)

    run > python mtcnn/data_preprocessing/gen_Onet_train_data.py
    run > python mtcnn/data_preprocessing/gen_landmark_48.py
    run > python mtcnn/data_preprocessing/assemble_onet_imglist.py

  • 训练 O-Net

    run > python mtcnn/train_net/train_o_net.py

Error1: ValueError: low >= high

delta_x = np.random.randint(max(-size,-x1),w) 
File "mtrand.pyx", line 1264, in mtrand.RandomState.randint 
ValueError: low >= high;;

Solution1:

运行 gen_Pnet_train_data.py 时出现很多小问题,这里没有一一列举。最后发现WIDER FACE 数据库 gt 存储的格式是 box (x_left, y_top,w, h),训练数据准备阶段运行 transform.py 生成的anno_train.txt 转换为以 box (x_left, y_top, x_right, y_bottom)的格式保存,运行成功。
除此之外,WIDER_train\images\54–Rescue54_Rescue_rescuepeople_54_29.jpg 倒数第5个gt给出的w为负数,我直接删除了这个样本。

猜你喜欢

转载自blog.csdn.net/kelvinxxx_ky/article/details/88028028