计算机视觉——【数据集】MOT17、COCO数据输入格式、数据集可视化脚本

这篇具有很好参考价值的文章主要介绍了计算机视觉——【数据集】MOT17、COCO数据输入格式、数据集可视化脚本。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

写在前面:本篇博文的目的是1. 理清MOT17数据集中文件及其内容的含义;2. COCO数据输入格式和YOLO数据输入格式和VOC数据输入格式的区别;3. 提供一个数据集可视化脚本,可以选中某个数据集,将该数据集中的groundtruth可视化在jpg上并生成视频播放。

Track1

数据格式的含义:

<camera_id> <obj_id> <frame_id> <xmin> <ymin> <width> <height> <xworld> <yworld>

MOT17数据集

数据集下载: https://pan.baidu.com/s/1TtKOUdcACLXBzS9L3lmE0A?pwd=67ey 提取码: 67ey
参考博客:多目标跟踪数据集 :mot16、mot17数据集介绍以及多目标跟踪指标评测

数据集介绍

如下所示,该数据集中的文件结构如图所示。MOT17有21个训练集和21个检测集。
计算机视觉——【数据集】MOT17、COCO数据输入格式、数据集可视化脚本

训练集

det

训练集中/det 文件夹中是针对检测的信息,该目录下只有一个det.txt文件,每行一个标注,代表一个检测的物体。
每一行标注的含义如下:第一个代表第几帧,第二个代表轨迹编号(因为检测结果只看检测框质量,不看id,故为id=-1。),bb开头的4个数代表物体框的左上角坐标及长宽。conf代表置信度,最后3个是MOT3D用到的内容,2D检测总是为-1.

<frame>, -1, <bb_left>, <bb_top>, <bb_width>, <bb_height>, <conf>, <3D_x>, <3D_y>, <3D_z> 
gt

训练集中/gt 文件夹中是针对追踪的信息,该目录下只有一个gt.txt文件,每行一个标注,代表一个检测的物体。
每一行标注的含义如下:第一个代表第几帧,第二个值为目标运动轨迹的ID号,bb开头的4个数代表物体框的左上角坐标及长宽,第7个值为目标轨迹是否进入考虑范围内的标志,0表示忽略,1表示active。第八个值为该轨迹对应的目标种类(种类见下面的表格中的label-ID对应情况),第九个值为box的visibility ratio,表示目标运动时被其他目标box包含/覆盖或者目标之间box边缘裁剪情况。

<frame>, <id>, <bb_left>, <bb_top>, <bb_width>, <bb_height>, <trajectory_conf>, <trajectory_type>, <visibility_ratio> 

COCO数据输入格式和YOLO数据输入格式和VOC数据输入格式

参考博客:VOC/YOLO/COCO数据集格式转换及LabelImg/Labelme/精灵标注助手Colabeler标注工具介绍
VOC标签格式,标注的标签存储在xml文件
YOLO标签格式,标注的标签存储在txt文件中
COCO标签格式,标注的标签存储在json文件中

数据集可视化脚本

yolo格式的可视化文章来源地址https://www.toymoban.com/news/detail-478700.html

import cv2
import os

label_path = '*.txt'
pic_path = '*.bmp'

img_gray = cv2.imread(pic_path)
width = img_gray.shape[1]
height = img_gray.shape[0]
label = []
if os.path.exists(label_path):
    label = []
    with open(label_path, 'r') as label_f:
        for line in label_f.readlines():
            txt_list = line.split(' ')
            print('txt_list',txt_list)
            norm_x = float(txt_list[1])
            norm_y = float(txt_list[2])
            norm_w = float(txt_list[3])
            norm_h = float(txt_list[4])
            xmin = int(width * (norm_x - 0.5 * norm_w))
            ymin = int(height * (norm_y - 0.5 * norm_h))
            xmax = int(width * (norm_x + 0.5 * norm_w))
            ymax = int(height * (norm_y + 0.5 * norm_h))
            label.append(ymin)
            label.append(xmin)
            label.append(ymax)
            label.append(xmax)  # [x1, x2, y1, y2]--> [212, 324, 296, 390]
    print('label',label)
    cv2.rectangle(img_gray, (label[1], label[0]),
                  (label[3], label[2]),
                  (120, 255, 120), 1)
cv2.imshow('vis', img_gray)
cv2.waitKey(0)

到了这里,关于计算机视觉——【数据集】MOT17、COCO数据输入格式、数据集可视化脚本的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 计算机视觉常用数据集介绍

    计算机视觉常用数据集介绍

    MINIST 数据集应该算是CV里面最早流行的数据了,相当于CV领域的Hello World。该数据包含70000张手写数字图像,其中60000张用于train, 10000张用于test, 并且都有相应的label。图像的尺寸比较小, 为28x28。 数据说明及下载地址: http://yann.lecun.com/exdb/mnist/ 这个数据是由 Yann LeCun 创建

    2024年02月14日
    浏览(10)
  • 计算机视觉——手机目标检测数据集

    计算机视觉——手机目标检测数据集

    这是一个手机目标检测的数据集,数据集的标注工具是labelimg,数据格式是voc格式,要训练yolo模型的话,可以使用脚本改成txt格式,数据集标注了手机,标签名:telephone,数据集总共有1960张,有一部分是直实数据,有一部分是是真实数据。 数据集地址:https://download.csdn.net/dow

    2024年04月15日
    浏览(18)
  • 计算机视觉 - 了解Mosaic数据增强

    计算机视觉 - 了解Mosaic数据增强

            数据增强包含各种扩展和增强机器学习和深度学习模型数据集的技术。这些方法跨越不同的类别,每种方法都会改变数据以引入多样性并提高模型的稳健性。几何变换(例如旋转、平移、缩放和翻转)会修改图像方向和结构。颜色和对比度调整会改变图像外观,包

    2024年01月17日
    浏览(9)
  • 数据分析案例:计算机视觉与图像生成

    在本篇文章中,我们将探讨计算机视觉和图像生成领域的数据分析案例。这些案例将帮助我们更好地理解计算机视觉和图像生成技术的实际应用,以及它们在现实生活中的重要性。 计算机视觉是一种通过计算机程序对图像进行处理和理解的技术。它涉及到图像的获取、处理、

    2024年02月19日
    浏览(11)
  • 数据增强:让计算机视觉模型更加智能和有效

    作者:禅与计算机程序设计艺术 引言 1.1. 背景介绍 随着计算机视觉技术的快速发展,各种数据增强技术也应运而生。数据增强技术可以有效地提高计算机视觉模型的智能和有效性,从而在众多应用场景中取得更好的表现。 1.2. 文章目的 本文旨在阐述数据增强技术在计算机视

    2024年02月08日
    浏览(10)
  • 数据挖掘与图像挖掘:计算机视觉的创新

    计算机视觉是人工智能领域的一个重要分支,它涉及到计算机对图像和视频数据进行分析和理解。数据挖掘则是数据科学领域的一个核心技术,它涉及到从大量数据中发现隐藏的模式和规律。随着数据量的增加,数据挖掘技术在计算机视觉领域得到了广泛应用,以提高计算机

    2024年04月17日
    浏览(14)
  • 数据应用开发的图像识别与计算机视觉

    图像识别和计算机视觉是计算机视觉领域的重要应用领域,它们涉及到人工智能、机器学习、深度学习等多个领域的技术。在这篇文章中,我们将讨论图像识别与计算机视觉的背景、核心概念、算法原理、最佳实践、应用场景、工具和资源推荐以及未来发展趋势与挑战。 图像

    2024年02月19日
    浏览(14)
  • FastBup:计算机视觉大型图像数据集分析工具

    FastBup:计算机视觉大型图像数据集分析工具

    官方github网址 项目目的 :当前大规模图像数据集一团糟,数据量巨大但质量堪忧,有时候训练集、验证集、测试集会有重复数据造成数据泄露。FastBup可以识别重复项、近似重复项、异常图像、错误标注、异常值,在cpu上就可以处理数百万的图片。 支持环境 :Python 3.7 and 3

    2024年02月07日
    浏览(22)
  • 【深度学习:数据增强】计算机视觉中数据增强的完整指南

    【深度学习:数据增强】计算机视觉中数据增强的完整指南

    可能面临的一个常见挑战是模型的过拟合。这种情况发生在模型记住了训练样本的特征,但却无法将其预测能力应用到新的、未见过的图像上。过拟合在计算机视觉中尤为重要,在计算机视觉中,我们处理高维图像输入和大型、过度参数化的深度网络。有许多现代建模技术可

    2024年02月03日
    浏览(13)
  • 数据增强:如何让计算机视觉模型更加准确和可靠

    作者:禅与计算机程序设计艺术 数据增强(Data Augmentation)是一种常用的技术,可以提高计算机视觉模型的精度和鲁棒性。本文主要介绍数据增强技术的原理、分类方法及应用。通过实例分析,阐述数据增强对模型精度提升的重要作用。最后,讨论一些未来可能遇到的问题与

    2024年02月07日
    浏览(12)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包