PASCALVOC
VOC数据集是目标检测经常用的一个数据集,从05年到12年都会举办比赛(比赛有task:Classification 、Detection(将图片中所有的目标用bounding box框出来)、Segmentation(将图片中所有的目标分割出来)、Person Layout).
有VOC2007和VOC2012两个数据集。
包含约10,000张带有边界框的图片用于训练和验证。含有20个类别。具体包括
Person: person
Animal: bird, cat, cow, dog, horse,sheep
Vehicle: aeroplane, bicycle, boat,bus, car, motorbike, train
Indoor: bottle, chair, dining table,potted plant, sofa, tv/monitor
注:由于类别仅20个,因此被看成目标检测方向的一个基准数据集
关于数据集:
- 所有的标注图片都有Detection需要的label, 但只有部分数据有SegmentationLabel。
- VOC2007中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。
- VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)
- 对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。trainval有11540张图片共27450个物体。
数据集下载完后会有5个文件夹。Annotations、ImageSets、JPEGImages、SegmentationClass、SegmentationObject。
2.MSCOCO数据集:
是微软公司建立的数据集。对于目标检测任务,COCO包含80个类别,每年大赛的训练和和验证集包含120,000张图片,超过40,000张测试图片。下面是这个数据集中的80个类别:
Person#1:person
Vehicle#8:bicycle,car,motorcycle,airplane,bus,train,truck,boat
Outdoor#5:traffic light, firhydrant, stop sign, parking meter, bench
Animal#10:bird,cat, dog,horse, sheep, cow, elephant, bear, zebra, giraffe
Accessory#5:backpack, umbrella,handbag, tie, suitcase
Sport#10:frisbee, skis,snowboard, sports ball, kite, baseball bat , baseball glove, skateboard, surfboard, tennisracket
Kitchen#7:bottle, wine glass,cup, fork, knife, spoon, bowl
Food#10:banana, apple,sandwich, orange, broccoli, carrot, hot dog, pizza, donut, cake
Furniture#6: chair, couch, potted plant,bed, dining table, toilet
Electronic#6:tv, laptop, mouse,remote, keyboard, cell phone
Appliance#5:microwave, oven,toaster, sink, refrigerator
Indoor#7:book, clock, vase,scissors, teddy bear, hair drier, toothbrus
3.ImageNet数据集:
是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库,是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。ImageNet数据集是按照WordNet架构组织的大规模带标签图像数据集。大约1500万张图片,2.2万类,每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。
其中,包括边界框的目标检测数据集,训练数据集包括500,000张图片,属于200类物体。由于数据集太大,训练所需计算量很大;类别数较多;造成了很少使用和目标检测的难度也很大。
4. 其它更多分类数据集:
这里包括了以下种类的数据集:行动数据库,属性识别,自主驾驶
生物/医药,相机校准,脸和眼/虹膜数据库,指纹,一般图像,一般RGBD和深度数据集,一般视频,手,掌握,手动和手势数据库,图像,视频和形状数据库检索,对象数据库,人(静),人体姿势,人员检测和跟踪数据库(另见监控),遥感,场景或地点分割或分类,分割,同时本地化和映射,监视和跟踪(另见人物),纹理,城市数据集,其他收藏页,杂项主题
版权所有:大林机器视觉培训所有 备案号:苏ICP备14016686号-9
本站关键词:上位机培训 机器视觉软件开发培训 上位机运动控制培训 深度学习培训 网站标签