如何选择合适的模型

YOLOv6 提供了一系列面向各种工业应用场景的模型,从模型大小方面来看,可分为微小型(Nano),小(Small),中(Medium),大模型(Large);从用户使用场景方面来看,可分为基础版(base),进阶版(advance),高精版(high-precision)。

为了更好地实现精度和速度权衡,这些模型的结构会根据模型大小而有所不同。此外,我们还引入了一些策略和技巧方法来进一步提高性能,例如自蒸馏和更多的训练轮次,这些策略和技巧并不会增加模型推理延时。

  • 下面将分别介绍各模型版本的优缺点及使用场景,同时给出相应的精度-速度指标。

模型特点

模型 优点 不足 使用场景
基础版 采用常规卷积和ReLU激活的统一网络结构,直接PTQ量化精度损失较小(↓0.3~0.4 AP) COCO数据集上精度稍低 适合刚入门或有快速迭代部署8位PTQ量化模型需求的用户
进阶版 精度和速度指标优于同规模的其他主流检测器 采用重参数化训练策略,训练资源要求稍高 适合精度速度权衡且侧重高精度的用户
高精版 采用1280分辨率训练,添加P6输出层,精度较高 速度相对进阶版较慢,但对比其他同规模的高精模型速度持平或超越 适合训练图片分辨率较大或对精度有更高要求的用户

模型性能指标

基础版模型

模型 输入尺寸 mAPval
0.5:0.95
mAPval
PTQ trt int8
速度T4
trt fp16 b1
(fps)
速度T4
trt fp16 b32
(fps)
Params
(M)
FLOPs
(G)
YOLOv6-N-base 640 35.6 35.3 832 1249 4.3 11.1
YOLOv6-S-base 640 43.8 43.4 373 531 11.5 27.6
YOLOv6-M-base 640 48.8 48.4 179 246 27.7 68.4
YOLOv6-L-base 640 51.0 50.7 115 153 58.5 144.0
  • 以上精度指标: N/S 基础版模型是在训练 400 epoch 的模型上测试得到,M/L 基础版模型是在采用自蒸馏训练的模型上测试得到的;

  • 以上速度指标: 在 T4 上测试,TensorRT 版本为 7.2;

进阶版模型

模型 输入尺寸 mAPval
0.5:0.95
速度T4
trt fp16 b1
(fps)
速度T4
trt fp16 b32
(fps)
Params
(M)
FLOPs
(G)
YOLOv6-N 640 37.5 779 1187 4.7 11.4
YOLOv6-S 640 45.0 339 484 18.5 45.3
YOLOv6-M 640 50.0 175 226 34.9 85.8
YOLOv6-L 640 52.8 98 116 59.6 150.7
  • 以上精度指标: 在采用自蒸馏训练的模型上测试得到的;

  • 以上速度指标: 在 T4 上测试,TensorRT 版本为 7.2;

高精版模型

模型 输入尺寸 mAPval
0.5:0.95
速度T4
trt fp16 b1
(fps)
速度T4
trt fp16 b32
(fps)
Params
(M)
FLOPs
(G)
YOLOv6-N6 1280 44.9 228 281 10.4 49.8
YOLOv6-S6 1280 50.3 98 108 41.4 198.0
YOLOv6-M6 1280 55.2 47 55 79.6 379.5
YOLOv6-L6 1280 57.2 26 29 140.4 673.4
  • 以上精度指标: N6/S6 高精版模型是在训练 300 epoch 的模型上测试得到,M6/L6 高精版模型是在采用自蒸馏训练的模型上测试得到的;

  • 以上速度指标: 在 T4 上测试,TensorRT 版本为 7.2;