Voc数据集简述

这篇具有很好参考价值的文章主要介绍了Voc数据集简述。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、了解VOC

是一种数据集的格式——VOC格式的数据集

PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛,
PASCAL VOC挑战赛主要包括以下几类:

  • 图像分类(Object Classification)
  • 目标检测(Object Detection)
  • 目标分割(Object Segmentation)
  • 行为识别(Action Classification) 等。

1.1 voc数据集下载

现在主要使用两个版本的voc,为2007和2012
链接地址:voc官网
voc2007数据集下载
voc2012数据集下载
浏览器或者迅雷(最快)下载。

二、VOC文件结构

在文件夹下按住shift+鼠标右键,打开shell(VOC2012为例)

VOCdevkit
    └── VOC2012
         ├── Annotations               所有的图像标注信息(XML文件)
         ├── ImageSets    
         │   ├── Action                人的行为动作图像信息
         │   ├── Layout                人的各个部位图像信息
         │   │
         │   ├── Main                  目标检测分类图像信息
         │   │     ├── train.txt       训练集(5717)
         │   │     ├── val.txt         验证集(5823)
         │   │     └── trainval.txt    训练集+验证集(11540)
         │   │
         │   └── Segmentation          目标分割图像信息
         │         ├── train.txt       训练集(1464)
         │         ├── val.txt         验证集(1449)
         │         └── trainval.txt    训练集+验证集(2913)
         │ 
         ├── JPEGImages                所有图像文件
         ├── SegmentationClass         语义分割png图(基于类别)
         └── SegmentationObject        实例分割png图(基于目标)

2.1 Annotations

存放xml格式的标签文件,每个xml对应JPEGImage中的一张图片。并且每个xml中存放的是标记的各个目标的位置和类别(C=20)信息,命名通常与对应的原始图像一样,以(x,y)的格式保存坐标点。可使用labelImg进行标注和查看。
xml文件解析:

<annotation>  
    <folder>VOC2012</folder>                             
    <filename>2007_000392.jpg</filename> //文件名  
    <source>                             //图像来源(不重要)  
        <database>The VOC2007 Database</database>  
        <annotation>PASCAL VOC2007</annotation>  
        <image>flickr</image>  
    </source>  
    <size>                              //图像尺寸(长宽以及通道数)                        
        <width>500</width>  
        <height>332</height>  
        <depth>3</depth>  
    </size>  
    <segmented>1</segmented>            //是否用于分割(在图像物体识别中01无所谓)  
    <object>                            //检测到的物体  
        <name>horse</name>              //物体类别  
        <pose>Right</pose>              //拍摄角度  
        <truncated>0</truncated>        //是否被截断(0表示完整)  
        <difficult>0</difficult>        //目标是否难以识别(0表示容易识别)  
        <bndbox>                        //bounding-box(包含左下角和右上角xy坐标)  
            <xmin>100</xmin>  
            <ymin>96</ymin>  
            <xmax>355</xmax>  
            <ymax>324</ymax>  
        </bndbox>  
    </object>  
    <object>              //检测到多个物体  
        <name>person</name>  
        <pose>Unspecified</pose>  
        <truncated>0</truncated>  
        <difficult>0</difficult>  
        <bndbox>  
            <xmin>198</xmin>  
            <ymin>58</ymin>  
            <xmax>286</xmax>  
            <ymax>197</ymax>  
        </bndbox>  
    </object>  
</annotation> 

2.2 ImageSets

  • Action 存放人的动作
  • Layout 存放的是具有人体部位的数据(head、feet等)
  • Main 图像物体识别的数据
  • Segmentation 可用于分割的数据

训练集与测试集

  • train.txt 训练集
    均为图片名,没有后缀。以train.txt为例,分为两列,第一列为图像名如00012;第二列为-1和1,-1表示目标在对应的图像没有出现,1则表示出现。
  • val.txt 验证集
  • trainval.txt 训练和验证集

2.3 JPEGImages

所有的图片,包括训练和测试的图片
共17125张图片
Voc数据集简述

2.4 SegmentationClass

2.5 SegmentationObject

三、目标检测任务

如何使用数据集中的数据进行目标检测呢?

  1. 首先在VOC2012\ImageSets\Main中,读取txt文件
  • xxx_train xxx类的训练集
  • xxx_val xxx类的验证集
  • xxx_trainval xxx类的训练和验证集
  1. 在VOC2012\Annotations
    接着通过索引在Annotations文件夹下找到对应的标注文件(.xml)。
  2. 接着通过在标注文件中的filename字段在JPEGImages 文件夹中找到对应的图片。比如在2007_000323.xml文件中的filename字段为2007_000323.jpg,那么在JPEGImages 文件夹中能够找到2007_000323.jpg文件。

四、语义分割任务

如何领用数据集进行语义分割任务呢?

  1. VOC2012\ImageSets\Segmentation中读取对应的txt文件
  └── Segmentation          目标分割图像信息
        ├── train.txt       训练集(1464)
        ├── val.txt         验证集(1449)
        └── trainval.txt    训练集+验证集(2913)

  1. 在VOC2012\JPEGImages 找到对应的图片
  2. 在VOC2012\SegmentationClass找到对应的标注图像(png)

注意,在语义分割中对应的标注图像(.png)用PIL的Image.open()函数读取时,默认是P模式,即一个单通道的图像。在背景处的像素值为0,目标边缘处用的像素值为255(训练时一般会忽略像素值为255的区域),目标区域内根据目标的类别索引信息进行填充,例如人对应的目标索引是15,所以目标区域的像素值用15填充。

五、实例分割任务

注意,在实例分割中对应的标注图像(.png)用PIL的Image.open()函数读取时,默认是P模式,即一个单通道的图像。在背景处的像素值为0,目标边缘处或需要忽略的区域用的像素值为255(训练时一般会忽略像素值为255的区域)。然后在Annotations文件夹中找到对应的xml文件,解析xml文件后会得到每个目标的信息,而对应的标注文件(.png)的每个目标处的像素值是按照xml文件中目标顺序排列的。如下图所示,xml文件中每个目标的序号是与标注文件(.png)中目标像素值是对应的。

六、类别索引与名称对应关系

{
	"background": 0,
    "aeroplane": 1,
    "bicycle": 2,
    "bird": 3,
    "boat": 4,
    "bottle": 5,
    "bus": 6,
    "car": 7,
    "cat": 8,
    "chair": 9,
    "cow": 10,
    "diningtable": 11,
    "dog": 12,
    "horse": 13,
    "motorbike": 14,
    "person": 15,
    "pottedplant": 16,
    "sheep": 17,
    "sofa": 18,
    "train": 19,
    "tvmonitor": 20
}

参考博客:链接: 参考文章来源地址https://www.toymoban.com/news/detail-440620.html

到了这里,关于Voc数据集简述的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包赞助服务器费用

相关文章

  • 【数据科学赛】2023大模型应用创新挑战赛 #¥10万 #百度

    【数据科学赛】2023大模型应用创新挑战赛 #¥10万 #百度

    CompHub  主页增加了 “近两周上新的奖金赛” ,更加方便查找最新比赛,欢迎访问和反馈! 以下内容摘自比赛主页(点击文末 阅读原文 进入) 2023大模型应用创新挑战赛 Baidu AI Studio 指导单位:中共上海市委统战部、浦东新区科技和经济委员会 主办单位:百度飞桨 联合主办

    2024年02月13日
    浏览(6)
  • 报名 | 2023中国高校计算机大赛—大数据挑战赛火热开启!

    报名 | 2023中国高校计算机大赛—大数据挑战赛火热开启!

    2016年,教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办了“中国高校计算机大赛”(China Collegiate Computing Contest,简称C4),目前“中国高

    2024年02月11日
    浏览(22)
  • 快来参与:2023全国大数据与计算智能挑战赛正在报名中

    快来参与:2023全国大数据与计算智能挑战赛正在报名中

    全国大数据与计算智能挑战赛是由 国防科技大学系统工程学院大数据与决策实验室 组织的年度赛事活动,旨在深入挖掘大数据应用实践中亟需破解的能力生成难题、选拔汇聚数据领域优势团队、促进大数据领域的技术创新和面向需求的成果生成、推动形成“集智众筹、联合

    2024年02月05日
    浏览(11)
  • 2023 数据安全产业人才能力挑战赛 --- math_exam wp

    题目 过程分析 本题考点主要是关于RSA的基础数论分析,通过各种等式变换得到关于 p 和 q 的等式,从而计算出 p 和 q 。 challenge 1 l e a k ≡ ( n + p )   m o d   ( q − 1 ) leak equiv (n+p) space mod space (q-1) l e ak ≡ ( n + p )   m o d   ( q − 1 ) ∵ n = p ∗ q because n=p*q ∵ n = p ∗ q ∴ l e a

    2024年02月02日
    浏览(17)
  • 众智引领未来:2023中国高校计算机大赛——大数据挑战赛冠军揭晓

    众智引领未来:2023中国高校计算机大赛——大数据挑战赛冠军揭晓

    8月27日,由清华大学和大数据系统软件国家工程研究中心联合举办,云智慧协办的“2023中国高校计算机大赛——大数据挑战赛”(以下简称“大赛”)以“线下答辩+全球直播”的形式完美落幕。本次大赛从企业真实场景和实际数据出发,通过基于多源数据的IT系统故障发现赛

    2024年02月10日
    浏览(13)
  • 2023中国高校计算机大数据挑战赛:论文学科分类baseline|清华主办

    2023中国高校计算机大数据挑战赛:论文学科分类baseline|清华主办

    NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等 专栏详细介绍:NLP专栏简介:数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性

    2024年02月14日
    浏览(11)
  • 第三届2022MathorCup高校数学建模挑战赛大数据论文加代码(附详解)

    第三届2022MathorCup高校数学建模挑战赛大数据论文加代码(附详解)

       摘要         本题主要是一个研究预测模型,以中国移动通信集团北京公司为背景,让客户根据 自身在网络覆盖与信号强度方面的体验和语音通话过程中的整体体验来进行语音通话 整体满意度的打分,统计出客户语音业务体验中的影响因素,从而提升客户语音业务满 意

    2024年02月03日
    浏览(29)
  • 【数据挖掘竞赛】——科大讯飞:锂离子电池生产参数调控及生产温度预测挑战赛

    【数据挖掘竞赛】——科大讯飞:锂离子电池生产参数调控及生产温度预测挑战赛

    🤵‍♂️ 个人主页:@Lingxw_w的个人主页 ✍🏻作者简介:计算机科学与技术研究生在读 🐋 希望大家多多支持,我们一起进步!😄 如果文章对你有帮助的话, 欢迎评论 💬点赞👍🏻 收藏 📂加关注+  【科大讯飞】报名链接:https://challenge.xfyun.cn?invitaCode=GQTcFX  目录 一、赛

    2024年02月14日
    浏览(15)
  • 2022 年首届“钉钉杯”大学生大数据挑战赛B题:航班数据分析与预测——国奖论文代码分享

    2022 年首届“钉钉杯”大学生大数据挑战赛B题:航班数据分析与预测——国奖论文代码分享

            随着民航事业的迅速发展 , 飞机出行已成为未来发展的一种必然趋势,然而近年来, 航班延误现象频频发生,成为困扰机场和航空公司的难题。对航班延误做出合理评价是 分析航班延误总体水平、降低延误成本,以及制定相关处置预案的重要基础,有着重要 的现实

    2024年02月16日
    浏览(17)
  • 2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛B题解题思路

    2023年第四届MathorCup高校数学建模挑战赛——大数据竞赛B题解题思路

    比赛时长为期7天的妈杯大数据挑战赛如期开赛,为了帮助对B题有更深的理解,这里为大家带来B题的初步解题思路。 赛道B:电商零售商家需求预测及库存优化问题 由于妈杯竞赛分为初赛复赛,因此,对于B题大家仅仅看到了预测相关的问题,没有优化相关的问题。包括题干中

    2024年02月06日
    浏览(13)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包