关于YOLO系列模型训练的那些事

关于验证集的损失函数漂浮不定的原因

一般YOLO系列会有六个损失函数,第一行是训练集的损失函数,第二行是验证集的损失函数,三个所代表的含义均分别为检测框的损失函数、分类的损失函数、目标损失函数。

一般大家训练如果出现验证集的损失函数漂浮不定的话有以下几种可能:

(1)如果是混合数据集的话,可能是由于几个混合数据集之间的样本分类不均匀,可以在不同数据集去相同的样本。

(2)如果是单一数据集或者自制的数据集,如果出现这种情况,极大的可能是因为图片的分辨率不一致,需要脚本将图片的分辨率调整为一致,当时也需要注意标签文件也要进行相应比例的调整。

import glob
import xml.dom.minidom
import cv2
from PIL import Image
import matplotlib.pyplot as plt
import os

# 定义待批量裁剪图像的路径地址
IMAGE_INPUT_PATH = r'D:\mix\Images'
XML_INPUT_PATH = r'D:\mix\Annotations'
# 定义裁剪后的图像存放地址
IMAGE_OUTPUT_PATH = r'D:\mix\newImages'
XML_OUTPUT_PATH = r'D:\mix\newAnnotations'
imglist = os.listdir(IMAGE_INPUT_PATH)
xmllist = os.listdir(XML_INPUT_PATH)

for i in range(len(imglist)):
    # 每个图像全路径
    image_input_fullname = IMAGE_INPUT_PATH + '/' + imglist[i]
    xml_input_fullname = XML_INPUT_PATH + '/' + xmllist[i]
    image_output_fullname = IMAGE_OUTPUT_PATH + '/' + imglist[i]
    xml_output_fullname = XML_OUTPUT_PATH + '/' + xmllist[i]
    # 定义缩放信息 以等比例缩放到416为例
    dom = xml.dom.minidom.parse(xml_input_fullname)
    root = dom.documentElement
    # 读取标注目标框
    objects = root.getElementsByTagName("bndbox")

    for object in objects:
        xmin = object.getElementsByTagName("xmin")
        xmin_data = round(float(xmin[0].firstChild.data))
        # xmin[0].firstChild.data =str(int(xmin1 * x))
        ymin = object.getElementsByTagName("ymin")
        ymin_data = round(float(ymin[0].firstChild.data))
        xmax = object.getElementsByTagName("xmax")
        xmax_data = round(float(xmax[0].firstChild.data))
        ymax = object.getElementsByTagName("ymax")
        ymax_data = round(float(ymax[0].firstChild.data))
        img = cv2.imread(image_input_fullname)
        height, width = img.shape[:2]



        scale1 = 480 / height
        scale2 = 640 / width
        height = 480
        width = 640
        # 更新xml
        width_xml = root.getElementsByTagName("width")
        width_xml[0].firstChild.data = width
        height_xml = root.getElementsByTagName("height")
        height_xml[0].firstChild.data = height
        print(scale1)
        print(scale2)
        xmin[0].firstChild.data = round(xmin_data * scale2)
        ymin[0].firstChild.data = round(ymin_data * scale1)
        xmax[0].firstChild.data = round(xmax_data * scale2)
        ymax[0].firstChild.data = round(ymax_data * scale1)

        # 另存更新后的文件
        with open(xml_output_fullname, 'w') as f:
            dom.writexml(f, addindent='  ', encoding='utf-8')

        # 测试缩放效果
        img = cv2.resize(img, (width, height))

        # xmin, ymin, xmax, ymax分别为xml读取的坐标信息
        left_top = (int(xmin_data * scale2), int(ymin_data * scale1))
        right_down = (int(xmax_data * scale2), int(ymax_data * scale1))
        # cv2.rectangle(img, left_top, right_down, (255, 0, 0), 1)
        cv2.imwrite(image_output_fullname, img)

猜你喜欢

转载自blog.csdn.net/weixin_43397302/article/details/127758866
今日推荐