Python:目标检测中xml的信息批量统计

想实现一个功能,统计目标检测数据集中,目标的平均宽、高、面积,以及目标面积与原图面积比例的情况。目的是可以对数据集的情况有一些感性的认识。

代码逻辑

'''
1.读取路径下的xml文件名,并保存为列表
2.循环
  1)按文件名字列表分别读取xml和jpg
  2)针对每一个xml,循环
     a.读取每一个object的属性,记录一下信息读取每一个object的属性,记录一下信息
       目标名字、目标的坐标
       计算坐标的长宽
     b.读取名字对应的jpg文件
       获取图像的长、宽
       计算图像的面积
     c.计算一下几个量
       针对每一类,计算目标的平均长度、平均宽度,目标和图像的长度比值、宽度比值、平均面积、平均占比

‘’‘’

下面是代码

# -*- coding:utf-8 -*-
import os
import xml.etree.ElementTree as ET
import numpy as np
np.set_printoptions(suppress=True, threshold=np.nan)
import matplotlib
from PIL import Image

def parse_obj(xml_path, filename):
  tree=ET.parse(xml_path+filename)
  objects=[]
  for obj in tree.findall('object'):
    obj_struct={}
    obj_struct['name']=obj.find('name').text
    bbox=obj.find('bndbox')
    obj_struct['bbox']=[int(bbox.find('xmin').text),
                        int(bbox.find('ymin').text),
                         int(bbox.find('xmax').text),
                        int(bbox.find('ymax').text)]
    objects.append(obj_struct)
  return objects


def read_image(image_path, filename):
  im=Image.open(image_path+filename)
  W=im.size[0]
  H=im.size[1]
  area=W*H
  im_info=[W,H,area]
  return im_info


if __name__ == '__main__':
  image_path='../JPEGImages/'
  xml_path='../Annotations/'
  filenamess=os.listdir(xml_path)
  filenames=[]
  for name in filenamess:
    name=name.replace('.xml','')
    filenames.append(name)
  print(filenames)
  recs={}
  ims_info={}
  obs_shape={}
  classnames=[]
  num_objs{}
  obj_avg={}
  for i,name in enumerate(filenames):
    print('正在处理 {}.xml '.format(name))
    recs[name]=parse_obj(xml_path, name+ '.xml' )
    print('正在处理 {}.jpg '.format(name))
    ims_info[name]=read_image(image_path, name + '.jpg' )
  print('所有信息收集完毕。')
  print('正在处理信息......')
  for name in filenames:
    im_w = ims_info[name][0]
    im_h = ims_info[name][1]
    im_area = ims_info[name][2]
    for object in recs[name]:
      if object['name'] not in num_objs.keys():
         num_objs[object['name']]=1
      else:
         num_objs[object['name']]+=1
      num_objs+=1
      ob_w = object['bbox'][2] - object['bbox'][0]
      ob_h = object['bbox'][3] - object['bbox'][1]
      ob_area = ob_w*ob_h
      w_rate= ob_w / im_w
      h_rate= ob_h / im_h
      area_rate= ob_area / im_area
      if not object['name'] in obs_shape.keys():
        obs_shape[object['name']]=( [[ob_w,
                                           ob_h,
                                           ob_area,
                                           w_rate,
                                           h_rate,
                                           area_rate]] )
      else:
        obs_shape[object['name']].append( [ob_w,
                                           ob_h,
                                           ob_area,
                                           w_rate,
                                           h_rate,
                                           area_rate] )
    if object['name'] not in classnames:
        classnames.append(object['name'])#求平均

  for name in classnames:
    obj_avg[name]=(np.array(obs_shape[name]).sum(axis=0))/num_objs[name]
    print('{}的情况如下:*******\n'.format(name))
    print('  目标平均W={}'.format(obj_avg[name][0]))
    print('  目标平均H={}'.format(obj_avg[name][1]))
    print('  目标平均area={}'.format(obj_avg[name][2]))
    print('  目标平均与原图的W比例={}'.format(obj_avg[name][3]))
    print('  目标平均与原图的H比例={}'.format(obj_avg[name][4]))
    print('  目标平均原图面积占比={}\n'.format(obj_avg[name][5]))
  print('信息统计计算完毕。')

  #计算每一个目标在原图中的占比
  #计算目标的平均长度、
  #计算平均宽度,
  #计算平均面积、
  #计算目标平均占比

输出结果如下:

还有一个想法就是,对于场景固定的数据,可以在一张空画布上把目标都画出来,直观感受一下目标的分布情况。都基本出现在什么位置。代码里面记录了获取了其他很多信息,可以扩展出其他的统计功能。比如绘制图像大小分布如下图:

可以看到数据集的图像主要集中在500~1000的长、宽范围内。

---画图的代码

#-*- coding:utf-8 -*-
......
from PIL import Image
import matplotlib.pyplot as plt
......

if __name__ == '__main__':
......
height=[]#1
weight=[]#2
......
    im_w = ims_info[name][0]
    im_h = ims_info[name][1]
    weight.append(im.size[0])#3
    height.append(im.size[1])#4
......
......
x = np.array(tuple(height))#5
y = np.array(tuple(weight))#6
fig = plt.figure(0)#7
plt.xlabel('x')#8
plt.ylabel('y')#9
plt.title('长宽分布')
plt.scatter(y, x, c='red', alpha=1, marker='.', label='样本') # c='red'定义为红色,alpha是透明度,marker是画的样式
plt.grid(True)
plt.legend(loc='best')
plt.show()

猜你喜欢

转载自blog.csdn.net/gusui7202/article/details/85136268