在大老板的安排下最近在某公司实习,实习期间要求实现一个图像识别模块的封装。无奈基础太薄弱,只能将任务细分,单独学习来实现。以此为背景……
经过公司师姐的指点,突然毛瑟顿开,编写了V3.0的代码,可以实现的功能:用户输入欲改变的图片尺寸后计算新的xml中bnb box的值、将图片尺寸改变后保存、将xml的新值写入xml并保存。
完整代码如下:
# coding:utf-8
########################################################################
# version:3.0 @author:KangShiFu #
# 思路:1.首先统一resize图片-,图片尺寸用户自行输入2.读取标注原图的xml文件的长、宽值#
# 3.计算变化后的xml的相应坐标值,并写入xml文件中 #
########################################################################
import os
import os.path
import cv2
import xml.dom.minidom
#---------------------------part one-----------------------------------#
imgw = input("请输入图像尺寸变化后的宽度:\n")
imgw = int(imgw)
imgh = input("请输入图像尺寸变化后的高度:\n")
imgh = int(imgh)
# 地址也可以改成交互式???
path_img='/home/kanghao/learning_something/about_xml/yibiao512/JPEGImages/'
# sorted可以让os.listdir顺序遍历文件夹中的文件
files_img=sorted(os.listdir(path_img))
for imgfile in files_img:
img_dir = os.path.join(path_img,imgfile)
raw_img = cv2.imread(img_dir)
raw_size = raw_img.shape
raw_imgh = float(raw_size[0])
raw_imgw = float(raw_size[1])
resize_img = cv2.resize(raw_img, (imgw, imgh), interpolation=cv2.INTER_CUBIC)
# ~ cv2.imshow('rezied img', resize_img)
# ~ cv2.waitKey(0)
# ~ cv2.destroyAllWindows()
cv2.imwrite(img_dir, resize_img)
print("图片尺寸转换已完成!")
#--------------------------part one over-------------------------------#
#---------------------------part two-----------------------------------#
path_xml='/home/kanghao/learning_something/about_xml/yibiao512/Annotations'
files_xml=sorted(os.listdir(path_xml)) #得到文件夹下所有文件名称
for xmlFile in files_xml:
if not os.path.isdir(xmlFile): #判断是否是文件夹,不是文件夹才打开
print(xmlFile)
dom=xml.dom.minidom.parse(os.path.join(path_xml,xmlFile))
root=dom.documentElement
width=root.getElementsByTagName('width')
height=root.getElementsByTagName('height')
xmin=root.getElementsByTagName('xmin')
ymin=root.getElementsByTagName('ymin')
xmax=root.getElementsByTagName('xmax')
ymax=root.getElementsByTagName('ymax')
# 修改<xmin>
for i in range(len(xmin)):
print("原始的xmin坐标值为 " + str(xmin[i].firstChild.data))
xmin_raw = unicode.encode(xmin[i].firstChild.data)
xmin[i].firstChild.data=float(xmin_raw)*(imgw/raw_imgw)
print("修改后的xmin坐标值为 " + str(xmin[i].firstChild.data))
# 修改<xmax>
for i in range(len(xmax)):
print("原始的xmax坐标值为 " + str(xmax[i].firstChild.data))
xmax_raw = unicode.encode(xmax[i].firstChild.data)
xmax[i].firstChild.data=float(xmax_raw)*(imgw/raw_imgw)
print("修改后的xmax坐标值为 " + str(xmax[i].firstChild.data))
# 修改<ymin>
for i in range(len(ymin)):
print("原始的ymin坐标值为 " + str(ymin[i].firstChild.data))
ymin_raw = unicode.encode(ymin[i].firstChild.data)
ymin[i].firstChild.data=float(ymin_raw)*(imgh/raw_imgh)
print("修改后的ymin坐标值为 " + str(ymin[i].firstChild.data))
# 修改<ymax>
for i in range(len(ymax)):
print("原始的ymax坐标值为 " + str(ymax[i].firstChild.data))
ymax_raw = unicode.encode(ymax[i].firstChild.data)
ymax[i].firstChild.data=float(ymax_raw)*(imgh/raw_imgh)
print("修改后的ymax坐标值为 " + str(ymax[i].firstChild.data))
#--------------------------part two over-------------------------------#
#保存修改到xml文件中
with open(os.path.join(path_xml,xmlFile),'w') as fh:
dom.writexml(fh)
print('恭喜,写入xmin/ymin成功!')
需要的小伙伴直接拿去用,顺便帮我检测一下还有什么问题……十分感谢!有不足的地方恳请评论区指出。