问题描述:
- 现有images图片,txt文件包含四种类别bounding box 坐标,需要将txt中两种类别坐标提取出来并转化成xml文件。
- images文件夹中有18184张图片,txt文件夹中只有16907个txt文件(即有一千多张图片是没有标注的,需要将这些图片删除)
# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os, sys
import glob
from PIL import Image
# 图像存储位置
src_img_dir = "./1028data/images"
# 图像的 ground truth 的 txt 文件存放位置
src_txt_dir = "./1028data/annotations"
# 生成xml文件存放位置
src_xml_dir = "./1028data/xml"
img_Lists = glob.glob(src_img_dir + '/*.jpg')
img_basenames = [] # e.g. 100.jpg
for item in img_Lists:
img_basenames.append(os.path.basename(item))
img_names = [] # e.g. 100
for item in img_basenames:
temp1, temp2 = os.path.splitext(item)
img_names.append(temp1)
for img in img_names:
im = Image.open((src_img_dir + '/' + img + '.jpg'))
width, height = im.size #xml文件中需要width和height信息,这里通过Image库计算出来
# open the corresponding txt file,由于图片数量和txt数量不一致,所以对于有些图片,没有对应的txt文件,所以这边要用try
try:
gt = open(src_txt_dir + '/' + img + '.txt').read().splitlines() #把txt文件里每一行提取出来,我的txt有两行
except:
continue #跳过这次循环,进入下一张图片循环
# write in xml file
# os.mknod(src_xml_dir + '/' + img + '.xml')
xml_file = open((src_xml_dir + '/' + img + '.xml'), 'w')
xml_file.write('<annotation>\n')
xml_file.write(' <folder>VOC2007</folder>\n')
xml_file.write(' <filename>' + str(img) + '.jpg' + '</filename>\n')
xml_file.write(' <size>\n')
xml_file.write(' <width>' + str(width) + '</width>\n')
xml_file.write(' <height>' + str(height) + '</height>\n')
xml_file.write(' <depth>3</depth>\n')
xml_file.write(' </size>\n')
# write the region of image on xml file
num_obj = int(gt[0])
print('num_obj: ',num_obj)
# assert 0
for i in range(num_obj):
i += 1
spt = gt[i].split(' ') # 这里如果txt里面是以逗号‘,’隔开的,那么就改为spt = img_each_label.split(',')。
xml_file.write(' <object>\n')
xml_file.write(' <name>' + str('pedestrian') + '</name>\n') # 类别名称,可以固定下来
xml_file.write(' <pose>Unspecified</pose>\n')
xml_file.write(' <truncated>0</truncated>\n')
xml_file.write(' <difficult>0</difficult>\n')
xml_file.write(' <bndbox>\n')
xml_file.write(' <xmin>' + str(spt[1]) + '</xmin>\n')
xml_file.write(' <ymin>' + str(spt[2]) + '</ymin>\n')
xml_file.write(' <xmax>' + str(float(spt[3]) + float(spt[1])) + '</xmax>\n')
xml_file.write(' <ymax>' + str(float(spt[4]) + float(spt[2])) + '</ymax>\n')
xml_file.write(' </bndbox>\n')
xml_file.write(' </object>\n')
xml_file.write(' <object>\n')
xml_file.write(' <name>' + str('headshoulder') + '</name>\n') # 类别名称
xml_file.write(' <pose>Unspecified</pose>\n')
xml_file.write(' <truncated>0</truncated>\n')
xml_file.write(' <difficult>0</difficult>\n')
xml_file.write(' <bndbox>\n')
xml_file.write(' <xmin>' + str(spt[11]) + '</xmin>\n')
xml_file.write(' <ymin>' + str(spt[12]) + '</ymin>\n')
xml_file.write(' <xmax>' + str(float(spt[13]) + float(spt[11])) + '</xmax>\n')
xml_file.write(' <ymax>' + str(float(spt[14]) + float(spt[12])) + '</ymax>\n')
xml_file.write(' </bndbox>\n')
xml_file.write(' </object>\n')
xml_file.write('</annotation>')
print('finish {}'.format(img))
将images文件夹中与txt不匹配的图片删去,遍历txt文件夹,将对应的images复制到另一个文件夹中(这个方法有点笨)
# ! /usr/bin/python
# -*- coding:UTF-8 -*-
import os,shutil
import glob
from PIL import Image
src_img_dir = "./1028data/images"
# 图像的 ground truth 的 txt 文件存放位置
src_txt_dir = "./1028data/annotations"
src_xml_dir = "./1028data/xml"
# 新的images文件夹
topath = './1028data/new'
xml_Lists = glob.glob(src_xml_dir + '/*.xml')
print(xml_Lists)
xml_basenames = []
for items in xml_Lists:
xml_basenames.append(os.path.basename(items))
print(xml_basenames)
xml_names = []
for items in xml_basenames:
temp1, temp2 = os.path.splitext(items)
xml_names.append(temp1)
#
print('xml_names',xml_names)
for xml in xml_names:
print('xml:',xml)
# raw_img = Image.open(src_img_dir + '/' + xml + '.jpg')
try:
#raw_img = Image.open(src_img_dir + '/' + xml + '.jpg')
#print('open {}'.format(raw_img))
shutil.copy(src_img_dir + '/' + xml + '.jpg', topath + '/' +xml+ '.jpg') #主要就是这句起复制图片作用
except:
continue