admin管理员组

文章数量:1794759

YoloV8改进策略:Gold

在过去的几年中,YOLO系列模型已经成为实时目标检测领域的领先方法。许多研究通过修改结构、增加数据和设计新的损失,将基线推高到更高的水平。然而,我们发现以前的模型仍然存在信息融合问题,尽管特征金字塔网络(FPN)和路径聚合网络(PANet)缓解了这一问题。因此,本研究提供了一种先进的GD机制,该机制通过卷积和自注意力操作来实现。这种新设计的模型被命名为Gold-YOLO,它提高了多尺度特征融合能力,并在所有模型尺度上实现了延迟和准确性之间的理想平衡。此外,我们首次在YOLO系列中实现了MAE风格的预训练,使得YOLO系列模型可以从无监督的预训练中受益。Gold-YOLO-N在COCO val2017数据集上获得了39.9%的AP,在T4 GPU上获得了1030 FPS,比之前的SOTA型号YOLOv6-3.0-N的FPS高+2.4%。PyTorch代码可在,MindSpore代码可在。

改进文章链接:

代码语言:javascript代码运行次数:0运行复制
.2014.3001.5502

YoloV8官方测试结果

代码语言:javascript代码运行次数:0运行复制
YOLOv8l summary (fused): 268 layers, 43631280 parameters, 0 gradients, 165.0 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 29/29 [
                   all        230       1412      0.922      0.957      0.986      0.737
                   c17        230        131      0.973      0.992      0.995      0.825
                    c5        230         68      0.945          1      0.995      0.836
            helicopter        230         43       0.96      0.907      0.951      0.607
                  c130        230         85      0.984          1      0.995      0.655
                   f16        230         57      0.955      0.965      0.985      0.669
                    b2        230          2      0.704          1      0.995      0.722
                 other        230         86      0.903      0.942      0.963      0.534
                   b52        230         70       0.96      0.971      0.978      0.831
                  kc10        230         62      0.999      0.984       0.99      0.847
               command        230         40       0.97          1      0.995      0.811
                   f15        230        123      0.891          1      0.992      0.701
                 kc135        230         91      0.971      0.989      0.986      0.712
                   a10        230         27          1      0.555      0.899      0.456
                    b1        230         20      0.972          1      0.995      0.793
                   aew        230         25      0.945          1       0.99      0.784
                   f22        230         17      0.913          1      0.995      0.725
                    p3        230        105       0.99          1      0.995      0.801
                    p8        230          1      0.637          1      0.995      0.597
                   f35        230         32      0.939      0.938      0.978      0.574
                   f18        230        125      0.985      0.992      0.987      0.817
                   v22        230         41      0.983          1      0.995       0.69
                 su-27        230         31      0.925          1      0.995      0.859
                 il-38        230         27      0.972          1      0.995      0.811
                tu-134        230          1      0.663          1      0.995      0.895
                 su-33        230          2          1      0.611      0.995      0.796
                 an-70        230          2      0.766          1      0.995       0.73
                 tu-22        230         98      0.984          1      0.995      0.831
Speed: 0.2ms preprocess, 3.8ms inference, 0.0ms loss, 0.8ms postprocess per image

安装包

这里需要安装两个包,一个timm,另一个是mmcv,安装方法如下:

代码语言:javascript代码运行次数:0运行复制
pip install timm
pip install -U openmim
mim install 'mmcv==2.0.0rc3'

安装mmcv比较慢,需要耐心等待一下!

测试结果

代码语言:javascript代码运行次数:0运行复制
YOLOv8l summary: 420 layers, 73599536 parameters, 0 gradients, 196.3 GFLOPs
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95): 100%|██████████| 15/15 [00:02<00:00,  5.27it/s]
                   all        230       1412      0.956      0.932      0.985       0.73
                   c17        230        131      0.964      0.969      0.992      0.802
                    c5        230         68      0.952      0.985      0.988      0.815
            helicopter        230         43      0.975      0.917      0.979      0.598
                  c130        230         85      0.976      0.953      0.987       0.65
                   f16        230         57      0.937      0.912      0.952      0.646
                    b2        230          2      0.888          1      0.995      0.697
                 other        230         86      0.961      0.942      0.968       0.53
                   b52        230         70      0.948      0.943      0.965      0.808
                  kc10        230         62          1      0.973      0.988      0.827
               command        230         40      0.975      0.967      0.988      0.794
                   f15        230        123      0.975      0.955      0.982      0.664
                 kc135        230         91      0.972      0.945      0.984      0.686
                   a10        230         27       0.99      0.889      0.961      0.442
                    b1        230         20          1      0.981      0.995      0.683
                   aew        230         25      0.936          1      0.995      0.775
                   f22        230         17      0.921          1      0.979      0.706
                    p3        230        105      0.998      0.981      0.995      0.801
                    p8        230          1      0.811          1      0.995      0.697
                   f35        230         32      0.997      0.875      0.961      0.546
                   f18        230        125      0.976      0.973      0.988      0.808
                   v22        230         41      0.997          1      0.995      0.652
                 su-27        230         31      0.909          1      0.993      0.863
                 il-38        230         27      0.959          1      0.995      0.797
                tu-134        230          1      0.956          1      0.995      0.995
                 su-33        230          2          1          0      0.995      0.796
                 an-70        230          2      0.854          1      0.995      0.796
                 tu-22        230         98      0.993          1      0.995       0.83
Speed: 0.2ms preprocess, 6.3ms inference, 0.0ms loss, 0.9ms postprocess per image
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。原始发表:2023-12-14,如有侵权请联系 cloudcommunity@tencent 删除数据yolo测试模型设计

本文标签: YoloV8改进策略Gold