如何选择合适的模型
YOLOv6 提供了一系列面向各种工业应用场景的模型,从模型大小方面来看,可分为微小型(Nano),小(Small),中(Medium),大模型(Large);从用户使用场景方面来看,可分为基础版(base),进阶版(advance),高精版(high-precision)。
为了更好地实现精度和速度权衡,这些模型的结构会根据模型大小而有所不同。此外,我们还引入了一些策略和技巧方法来进一步提高性能,例如自蒸馏和更多的训练轮次,这些策略和技巧并不会增加模型推理延时。
下面将分别介绍各模型版本的优缺点及使用场景,同时给出相应的精度-速度指标。
模型特点
模型 | 优点 | 不足 | 使用场景 |
---|---|---|---|
基础版 | 采用常规卷积和ReLU激活的统一网络结构,直接PTQ量化精度损失较小(↓0.3~0.4 AP) | COCO数据集上精度稍低 | 适合刚入门或有快速迭代部署8位PTQ量化模型需求的用户 |
进阶版 | 精度和速度指标优于同规模的其他主流检测器 | 采用重参数化训练策略,训练资源要求稍高 | 适合精度速度权衡且侧重高精度的用户 |
高精版 | 采用1280分辨率训练,添加P6输出层,精度较高 | 速度相对进阶版较慢,但对比其他同规模的高精模型速度持平或超越 | 适合训练图片分辨率较大或对精度有更高要求的用户 |
模型性能指标
基础版模型
模型 | 输入尺寸 | mAPval 0.5:0.95 |
mAPval PTQ trt int8 |
速度T4 trt fp16 b1 (fps) |
速度T4 trt fp16 b32 (fps) |
Params (M) |
FLOPs (G) |
---|---|---|---|---|---|---|---|
YOLOv6-N-base | 640 | 35.6 | 35.3 | 832 | 1249 | 4.3 | 11.1 |
YOLOv6-S-base | 640 | 43.8 | 43.4 | 373 | 531 | 11.5 | 27.6 |
YOLOv6-M-base | 640 | 48.8 | 48.4 | 179 | 246 | 27.7 | 68.4 |
YOLOv6-L-base | 640 | 51.0 | 50.7 | 115 | 153 | 58.5 | 144.0 |
以上精度指标: N/S 基础版模型是在训练 400 epoch 的模型上测试得到,M/L 基础版模型是在采用自蒸馏训练的模型上测试得到的;
以上速度指标: 在 T4 上测试,TensorRT 版本为 7.2;
进阶版模型
模型 | 输入尺寸 | mAPval 0.5:0.95 |
速度T4 trt fp16 b1 (fps) |
速度T4 trt fp16 b32 (fps) |
Params (M) |
FLOPs (G) |
---|---|---|---|---|---|---|
YOLOv6-N | 640 | 37.5 | 779 | 1187 | 4.7 | 11.4 |
YOLOv6-S | 640 | 45.0 | 339 | 484 | 18.5 | 45.3 |
YOLOv6-M | 640 | 50.0 | 175 | 226 | 34.9 | 85.8 |
YOLOv6-L | 640 | 52.8 | 98 | 116 | 59.6 | 150.7 |
以上精度指标: 在采用自蒸馏训练的模型上测试得到的;
以上速度指标: 在 T4 上测试,TensorRT 版本为 7.2;
高精版模型
模型 | 输入尺寸 | mAPval 0.5:0.95 |
速度T4 trt fp16 b1 (fps) |
速度T4 trt fp16 b32 (fps) |
Params (M) |
FLOPs (G) |
---|---|---|---|---|---|---|
YOLOv6-N6 | 1280 | 44.9 | 228 | 281 | 10.4 | 49.8 |
YOLOv6-S6 | 1280 | 50.3 | 98 | 108 | 41.4 | 198.0 |
YOLOv6-M6 | 1280 | 55.2 | 47 | 55 | 79.6 | 379.5 |
YOLOv6-L6 | 1280 | 57.2 | 26 | 29 | 140.4 | 673.4 |
以上精度指标: N6/S6 高精版模型是在训练 300 epoch 的模型上测试得到,M6/L6 高精版模型是在采用自蒸馏训练的模型上测试得到的;
以上速度指标: 在 T4 上测试,TensorRT 版本为 7.2;