Python如何操作目標(biāo)檢測數(shù)據(jù)集xml

發(fā)布時(shí)間：2022-02-23 09:48:52 來源：億速云閱讀：212 作者：iii 欄目：開發(fā)技術(shù)

這篇“Python如何操作目標(biāo)檢測數(shù)據(jù)集xml”文章的知識(shí)點(diǎn)大部分人都不太理解，所以小編給大家總結(jié)了以下內(nèi)容，內(nèi)容詳細(xì)，步驟清晰，具有一定的借鑒價(jià)值，希望大家閱讀完這篇文章能有所收獲，下面我們一起來看看這篇“Python如何操作目標(biāo)檢測數(shù)據(jù)集xml”文章吧。

1. 根據(jù)xml文件統(tǒng)計(jì)目標(biāo)種類以及數(shù)量

# -*- coding:utf-8 -*-
#根據(jù)xml文件統(tǒng)計(jì)目標(biāo)種類以及數(shù)量
import os
import xml.etree.ElementTree as ET
import numpy as np
np.set_printoptions(suppress=True, threshold=np.nan)
import matplotlib
from PIL import Image
 
def parse_obj(xml_path, filename):
  tree=ET.parse(xml_path+filename)
  objects=[]
  for obj in tree.findall('object'):
    obj_struct={}
    obj_struct['name']=obj.find('name').text
    objects.append(obj_struct)
  return objects
  
def read_image(image_path, filename):
  im=Image.open(image_path+filename)
  W=im.size[0]
  H=im.size[1]
  area=W*H
  im_info=[W,H,area]
  return im_info
  
if __name__ == '__main__':
  xml_path='/home/dlut/網(wǎng)絡(luò)/make_database/數(shù)據(jù)集——合集/VOCdevkit/VOC2018/Annotations/'
  filenamess=os.listdir(xml_path)
  filenames=[]
  for name in filenamess:
    name=name.replace('.xml','')
    filenames.append(name)
  recs={}
  obs_shape={}
  classnames=[]
  num_objs={}
  obj_avg={}
  for i,name in enumerate(filenames):
    recs[name]=parse_obj(xml_path, name+ '.xml' )
  for name in filenames:
    for object in recs[name]:
      if object['name'] not in num_objs.keys():
         num_objs[object['name']]=1
      else:
         num_objs[object['name']]+=1
      if object['name'] not in classnames:
         classnames.append(object['name'])
  for name in classnames:
    print('{}:{}個(gè)'.format(name,num_objs[name]))
  print('信息統(tǒng)計(jì)算完畢。')

2.根據(jù)xml文件統(tǒng)計(jì)目標(biāo)的平均長度、寬度、面積以及每一個(gè)目標(biāo)在原圖中的占比

# -*- coding:utf-8 -*-
#統(tǒng)計(jì)
# 計(jì)算每一個(gè)目標(biāo)在原圖中的占比
# 計(jì)算目標(biāo)的平均長度、
# 計(jì)算平均寬度，
# 計(jì)算平均面積、
# 計(jì)算目標(biāo)平均占比
import os
import xml.etree.ElementTree as ET
import numpy as np
#np.set_printoptions(suppress=True, threshold=np.nan)  #10,000,000
np.set_printoptions(suppress=True, threshold=10000000)  #10,000,000
import matplotlib
from PIL import Image
def parse_obj(xml_path, filename):
    tree = ET.parse(xml_path + filename)
    objects = []
    for obj in tree.findall('object'):
        obj_struct = {}
        obj_struct['name'] = obj.find('name').text
        bbox = obj.find('bndbox')
        obj_struct['bbox'] = [int(bbox.find('xmin').text),
                              int(bbox.find('ymin').text),
                              int(bbox.find('xmax').text),
                              int(bbox.find('ymax').text)]
        objects.append(obj_struct)
    return objects
def read_image(image_path, filename):
    im = Image.open(image_path + filename)
    W = im.size[0]
    H = im.size[1]
    area = W * H
    im_info = [W, H, area]
    return im_info
if __name__ == '__main__':
    image_path = '/home/dlut/網(wǎng)絡(luò)/make_database/數(shù)據(jù)集——合集/VOCdevkit/VOC2018/JPEGImages/'
    xml_path = '/home/dlut/網(wǎng)絡(luò)/make_database/數(shù)據(jù)集——合集/VOCdevkit/VOC2018/Annotations/'
    filenamess = os.listdir(xml_path)
    filenames = []
    for name in filenamess:
        name = name.replace('.xml', '')
        filenames.append(name)
    print(filenames)
    recs = {}
    ims_info = {}
    obs_shape = {}
    classnames = []
    num_objs={}
    obj_avg = {}
    for i, name in enumerate(filenames):
        print('正在處理 {}.xml '.format(name))
        recs[name] = parse_obj(xml_path, name + '.xml')
        print('正在處理 {}.jpg '.format(name))
        ims_info[name] = read_image(image_path, name + '.jpg')
    print('所有信息收集完畢。')
    print('正在處理信息......')
    for name in filenames:
        im_w = ims_info[name][0]
        im_h = ims_info[name][1]
        im_area = ims_info[name][2]
        for object in recs[name]:
            if object['name'] not in num_objs.keys():
                num_objs[object['name']] = 1
            else:
                num_objs[object['name']] += 1
            #num_objs += 1
            ob_w = object['bbox'][2] - object['bbox'][0]
            ob_h = object['bbox'][3] - object['bbox'][1]
            ob_area = ob_w * ob_h
            w_rate = ob_w / im_w
            h_rate = ob_h / im_h
            area_rate = ob_area / im_area
            if not object['name'] in obs_shape.keys():
                obs_shape[object['name']] = ([[ob_w,
                                               ob_h,
                                               ob_area,
                                               w_rate,
                                               h_rate,
                                               area_rate]])
            else:
                obs_shape[object['name']].append([ob_w,
                                                  ob_h,
                                                  ob_area,
                                                  w_rate,
                                                  h_rate,
                                                  area_rate])
        if object['name'] not in classnames:
            classnames.append(object['name'])  # 求平均
    for name in classnames:
        obj_avg[name] = (np.array(obs_shape[name]).sum(axis=0)) / num_objs[name]
        print('{}的情況如下：*******
'.format(name))
        print('  目標(biāo)平均W={}'.format(obj_avg[name][0]))
        print('  目標(biāo)平均H={}'.format(obj_avg[name][1]))
        print('  目標(biāo)平均area={}'.format(obj_avg[name][2]))
        print('  目標(biāo)平均與原圖的W比例={}'.format(obj_avg[name][3]))
        print('  目標(biāo)平均與原圖的H比例={}'.format(obj_avg[name][4]))
        print('  目標(biāo)平均原圖面積占比={}
'.format(obj_avg[name][5]))
    print('信息統(tǒng)計(jì)計(jì)算完畢。')

3.修改xml文件中某個(gè)目標(biāo)的名字為另一個(gè)名字

#修改xml文件中的目標(biāo)的名字，
import os, sys
import glob
from xml.etree import ElementTree as ET
# 批量讀取Annotations下的xml文件
# per=ET.parse(r'C:UsersockhuangDesktopAnnotations00003.xml')
xml_dir = r'/home/dlut/網(wǎng)絡(luò)/make_database/數(shù)據(jù)集——合集/VOCdevkit/VOC2018/Annotations'
xml_list = glob.glob(xml_dir + '/*.xml')
for xml in xml_list:
    print(xml)
    per = ET.parse(xml)
    p = per.findall('/object')
    for oneper in p:  # 找出person節(jié)點(diǎn)
        child = oneper.getchildren()[0]  # 找出person節(jié)點(diǎn)的子節(jié)點(diǎn)
        if child.text == 'PinNormal':   #需要修改的名字
            child.text = 'normal bolt'    #修改成什么名字
        if child.text == 'PinDefect':    #需要修改的名字
            child.text = 'defect bolt-1'   #修改成什么名字
    per.write(xml)
    print(child.tag, ':', child.text)

以上就是關(guān)于“Python如何操作目標(biāo)檢測數(shù)據(jù)集xml”這篇文章的內(nèi)容，相信大家都有了一定的了解，希望小編分享的內(nèi)容對(duì)大家有幫助，若想了解更多相關(guān)的知識(shí)內(nèi)容，請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

Python如何操作目標(biāo)檢測數(shù)據(jù)集xml

1. 根據(jù)xml文件統(tǒng)計(jì)目標(biāo)種類以及數(shù)量

2.根據(jù)xml文件統(tǒng)計(jì)目標(biāo)的平均長度、寬度、面積以及每一個(gè)目標(biāo)在原圖中的占比

3.修改xml文件中某個(gè)目標(biāo)的名字為另一個(gè)名字

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

2.根據(jù)xml文件統(tǒng)計(jì)目標(biāo)的平均長度、寬度、面積以及每一個(gè)目標(biāo)在原圖中的占比