重庆C#与PLC监控培训_重庆3D机器视觉编程培训_重庆上位机与三菱PLC培训学校_重庆机器视觉与雷赛运动控制卡开发

PASCALVOC

VOC数据集是目标检测经常用的一个数据集，从05年到12年都会举办比赛（比赛有task：Classification 、Detection（将图片中所有的目标用bounding box框出来）、Segmentation（将图片中所有的目标分割出来）、Person Layout）.

有VOC2007和VOC2012两个数据集。

包含约10,000张带有边界框的图片用于训练和验证。含有20个类别。具体包括

Person: person

Animal: bird, cat, cow, dog, horse,sheep

Vehicle: aeroplane, bicycle, boat,bus, car, motorbike, train

Indoor: bottle, chair, dining table,potted plant, sofa, tv/monitor

注：由于类别仅20个，因此被看成目标检测方向的一个基准数据集

关于数据集：

- 所有的标注图片都有Detection需要的label，但只有部分数据有SegmentationLabel。

- VOC2007中包含9963张标注过的图片，由train/val/test三部分组成，共标注出24,640个物体。

- VOC2007的test数据label已经公布，之后的没有公布（只有图片，没有label）

- 对于检测任务，VOC2012的trainval/test包含08-11年的所有对应图片。trainval有11540张图片共27450个物体。

数据集下载完后会有5个文件夹。Annotations、ImageSets、JPEGImages、SegmentationClass、SegmentationObject。

2.MSCOCO数据集：

是微软公司建立的数据集。对于目标检测任务，COCO包含80个类别，每年大赛的训练和和验证集包含120,000张图片，超过40,000张测试图片。下面是这个数据集中的80个类别：

Person#1：person

Vehicle#8：bicycle,car,motorcycle,airplane,bus,train,truck,boat

Outdoor#5：traffic light, firhydrant, stop sign, parking meter, bench

Animal#10：bird,cat, dog,horse, sheep, cow, elephant, bear, zebra, giraffe

Accessory#5：backpack, umbrella,handbag, tie, suitcase

Sport#10：frisbee, skis,snowboard, sports ball, kite, baseball bat , baseball glove, skateboard, surfboard, tennisracket

Kitchen#7：bottle, wine glass,cup, fork, knife, spoon, bowl

Food#10：banana, apple,sandwich, orange, broccoli, carrot, hot dog, pizza, donut, cake

Furniture#6: chair, couch, potted plant,bed, dining table, toilet

Electronic#6：tv, laptop, mouse,remote, keyboard, cell phone

Appliance#5：microwave, oven,toaster, sink, refrigerator

Indoor#7：book, clock, vase,scissors, teddy bear, hair drier, toothbrus

3.ImageNet数据集：

是一个计算机视觉系统识别项目，是目前世界上图像识别最大的数据库，是美国斯坦福的计算机科学家，模拟人类的识别系统建立的。ImageNet数据集是按照WordNet架构组织的大规模带标签图像数据集。大约1500万张图片，2.2万类，每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。

其中，包括边界框的目标检测数据集，训练数据集包括500,000张图片，属于200类物体。由于数据集太大，训练所需计算量很大；类别数较多；造成了很少使用和目标检测的难度也很大。

4. 其它更多分类数据集：

这里包括了以下种类的数据集：行动数据库，属性识别，自主驾驶

生物/医药，相机校准，脸和眼/虹膜数据库，指纹，一般图像，一般RGBD和深度数据集，一般视频，手，掌握，手动和手势数据库，图像，视频和形状数据库检索，对象数据库，人（静），人体姿势，人员检测和跟踪数据库（另见监控），遥感，场景或地点分割或分类，分割，同时本地化和映射，监视和跟踪（另见人物），纹理，城市数据集，其他收藏页，杂项主题

上一条: 为什么机器人需要视觉系统，_苏州电工培训_苏州PLC培训_苏州机器视觉培训_苏州上位机培训_苏州工业机器人培训_苏州电工培训_苏州PLC培训_苏州机器视觉培训_苏州上位机培训_苏州工业机器人培训

下一条: 哪种厂牌PLC市场占有率高?_苏州西门子PLC培训_苏州三菱PLC培训_苏州机器视觉培训