跳至内容

性能指标深度挖掘

导言

性能指标是评估物体检测模型准确性和效率的关键工具。它们可以揭示模型在图像中识别和定位物体的效率。此外,性能指标还有助于了解模型如何处理假阳性和假阴性。这些见解对于评估和提高模型性能至关重要。在本指南中,我们将探讨与YOLO11 相关的各种性能指标、它们的意义以及如何解释它们。



观看: Ultralytics YOLO11 性能指标 | MAP,F1 分数、 精度, IoU & Accuracy

物体检测指标

让我们先来讨论一些指标,它们不仅对YOLO11 重要,而且广泛适用于不同的物体检测模型。

  • 交集大于联合(IoU):IoU 是一种量化预测边界框与地面实况边界框之间重叠程度的指标。它在评估物体定位的准确性方面发挥着重要作用。

  • 平均精度 (AP):AP 计算精度-召回曲线下的面积,提供一个包含模型精度和召回性能的单一值。

  • 平均精度(mAP):mAP 通过计算多个对象类别的平均精度值,扩展了 AP 的概念。这在多类物体检测场景中非常有用,可以全面评估模型的性能。

  • 精确度和召回率:精度量化了所有阳性预测中的真阳性比例,评估模型避免假阳性的能力。另一方面,召回率计算的是真阳性预测在所有实际阳性预测中所占的比例,衡量的是模型检测出某类所有实例的能力。

  • F1 分数:F1 分数是精确度和召回率的调和平均值,在考虑假阳性和假阴性的同时对模型的性能进行均衡评估。

如何计算YOLO11 模型的指标

现在,我们可以探索YOLO11 的验证模式,该模式可用于计算上述讨论的评估指标。

使用验证模式非常简单。一旦有了训练有素的模型,就可以调用 model.val() 函数。该函数将处理验证数据集,并返回各种性能指标。但这些指标意味着什么?又该如何解释呢?

解读输出结果

让我们分解一下 model.val() 函数的输出,了解输出的每个部分。

按类别划分的指标

输出中的一个部分是按类划分的性能指标。当您想了解模型在每个特定类别中的表现时,尤其是在对象类别繁多的数据集中,这种细化信息非常有用。对于数据集中的每个类别,我们都会提供以下信息:

  • :表示对象类别的名称,如 "人"、"车 "或 "狗"。

  • 图像:该指标显示验证集中包含对象类别的图片数量。

  • 实例:这提供了该类在验证集所有图像中出现的次数。

  • Box(P、R、mAP50、mAP50-95):该指标可帮助我们深入了解模型在检测物体方面的性能:

    • P(精确度):检测物体的精确度,表示有多少检测是正确的。

    • R(召回率):模型识别图像中所有物体实例的能力。

    • mAP50:按 0.50 的交集大于联合(IoU)阈值计算的平均精度。这是仅考虑 "容易 "检测的模型精确度的衡量标准。

    • mAP50-95:在 0.50 至 0.95 之间的不同 IoU 门限下计算得出的平均精度的平均值。它全面反映了模型在不同检测难度下的表现。

速度指标

推理速度与准确性同样重要,尤其是在实时目标检测场景中。本节将对验证过程的各个阶段(从预处理到后处理)所需的时间进行细分。

COCO 指标评估

对于在 COCO 数据集上进行验证的用户,还可使用 COCO 评估脚本计算其他指标。这些指标可帮助用户深入了解不同 IoU 临界值和不同大小对象的精确度和召回率。

视觉输出

model.val() 函数除了生成数字指标外,还能生成可视化输出,让人更直观地了解模型的性能。下面是可视化输出的细目:

  • F1 分数曲线 (F1_curve.png):该曲线表示 F1 分数 在不同的阈值之间。通过解读这条曲线,可以深入了解模型在不同阈值下假阳性和假阴性之间的平衡。

  • 精度-召回曲线 (PR_curve.png):对于任何分类问题来说,这条曲线都是不可或缺的可视化图表,它展示了精确度与分类问题之间的权衡。 召回 在不同的阈值下。在处理不平衡类时,这一点变得尤为重要。

  • 精度曲线 (P_curve.png):不同阈值下精度值的图形表示。该曲线有助于了解精度如何随着阈值的变化而变化。

  • 召回曲线 (R_curve.png):相应地,该图说明了召回值在不同阈值下的变化情况。

  • 混淆矩阵 (confusion_matrix.png):混淆矩阵提供了结果的详细视图,展示了每个类别的真阳性、真阴性、假阳性和假阴性的计数。

  • 归一化混淆矩阵 (confusion_matrix_normalized.png):这种可视化是混淆矩阵的规范化版本。它以比例而非原始计数来表示数据。这种格式更便于比较不同类别的性能。

  • 验证批次标签 (val_batchX_labels.jpg):这些图像描述了验证数据集中不同批次的基本真实标签。根据数据集,这些图像可以清楚地显示对象及其各自的位置。

  • 验证批预测 (val_batchX_pred.jpg):与标签图像对比,这些视觉效果显示了YOLO11 模型对相应批次的预测结果。通过将这些图像与标签图像进行对比,您可以轻松评估模型对物体的检测和分类效果。

结果存储

结果会保存到一个目录中,通常名为 runs/detect/val,以备将来参考。

选择正确的衡量标准

选择正确的评估指标通常取决于具体的应用。

  • mAP:适用于对模型性能进行广泛评估。

  • IoU:在需要精确定位目标时必不可少。

  • 精确:当优先考虑尽量减少误检测时非常重要。

  • 召回:在需要检测对象的每个实例时非常重要。

  • F1 分数:在需要平衡精确度和召回率时非常有用。

对于实时应用而言,FPS(每秒帧数)和延迟等速度指标对于确保及时获得结果至关重要。

结果解释

了解这些指标非常重要。以下是一些常见的较低分数可能说明的问题:

  • 低 mAP:表示模型可能需要全面改进。

  • 低 IoU:模型可能难以准确定位物体。采用不同的边界框方法可能会有所帮助。

  • 精度低:模型可能检测到太多不存在的物体。调整置信度阈值可能会减少这种情况。

  • 召回率低:模型可能遗漏了真实物体。改进特征提取或使用更多数据可能会有所帮助。

  • F1 分数不平衡:精确度和召回率之间存在差距。

  • 针对具体班级的 AP:这里的低分可以凸显模型在某些方面的不足。

案例研究

真实世界的例子有助于阐明这些指标在实践中是如何发挥作用的。

案例 1

  • 情况:mAP 和 F1 分数都不理想,但召回率很高,精度却不高。

  • 解释与行动:错误检测可能太多。收紧置信度阈值可以减少错误检测,但也可能会略微降低召回率。

案例 2

  • 情况:MAP 和 Recall 可以接受,但 IoU 不足。

  • 解释与行动:模型能很好地检测物体,但可能无法精确定位。改进边界框预测可能会有所帮助。

案例 3

  • 情况:有些班级的 AP 比其他班级低得多,即使总的 mAP 还不错。

  • 解释与行动:这些类别对模型来说可能更具挑战性。在训练过程中为这些类别使用更多数据或调整类别权重可能会有所帮助。

连接与协作

利用爱好者和专家社区可以拓展您的YOLO11 之旅。以下是一些可以促进学习、故障排除和交流的途径。

与更广泛的社区互动

  • GitHub 问题: YOLO11 仓库在 GitHub 上有一个问题选项卡,您可以在这里提问、报告错误和建议新功能。这里的社区和维护者都很活跃,是解决具体问题的好地方。

  • Ultralytics Discord 服务器: Ultralytics 有一个Discord 服务器,您可以在这里与其他用户和开发人员互动。

官方文件和资源:

  • Ultralytics YOLO11 文档: 官方文档全面介绍了YOLO11 以及安装、使用和故障排除指南。

使用这些资源不仅能指导您应对任何挑战,还能让您了解YOLO11 社区的最新趋势和最佳实践。

结论

在本指南中,我们仔细研究了YOLO11 的基本性能指标。这些指标是了解模型性能好坏的关键,对于任何想要微调模型的人来说都至关重要。它们为改进模型提供了必要的见解,并确保模型在实际情况下有效运行。

请记住,YOLO11 和Ultralytics 社区是一笔宝贵的财富。与其他开发人员和专家交流,可以获得标准文档中找不到的见解和解决方案。在您进行对象检测的过程中,请保持学习精神,尝试新策略,并分享您的发现。这样,您就为社区的集体智慧做出了贡献,并确保了社区的发展。

快乐的物体探测

常见问题

平均精度(mAP) 在评估YOLO11 模型性能方面有何意义?

平均精度(mAP)对于评估YOLO11 模型至关重要,因为它提供了一个单一指标,囊括了多个类别的精度和召回率。mAP@0.50 在 IoU 阈值为 0.50 时测量精度,重点关注模型正确检测物体的能力。mAP@0.50:0.95 在一系列 IoU 阈值中平均精度,对检测性能进行全面评估。高 mAP 分数表明模型有效地平衡了精度和召回率,这对自动驾驶和监控等应用至关重要。

如何解释YOLO11 物体检测的 "交集大于联合"(IoU)值?

交集大于联合(IoU)衡量预测边界框与地面实况边界框之间的重叠程度。IoU 值从 0 到 1 不等,值越高表示定位精度越高。IoU 值为 1.0 表示完全对齐。通常情况下,IoU 的阈值为 0.50,用于定义 mAP 等指标中的真阳性。较低的 IoU 值表明模型在精确定位对象方面存在困难,可以通过改进边界框回归或提高注释准确性来改善。

为什么 F1 分数对评估YOLO11 物体检测模型非常重要?

F1 分数对于评估YOLO11 模型非常重要,因为它提供了精确度和召回率的调和平均值,平衡了误报和漏报。在处理不平衡数据集或应用时,如果仅靠精确度或召回率是不够的,那么 F1 分数就显得尤为重要。高 F1 分数表明该模型能有效地检测到物体,同时最大限度地减少漏检和误报,因此适合安全系统和医疗成像等关键应用。

使用Ultralytics YOLO11 进行实时物体检测的主要优势是什么?

Ultralytics YOLO11 为实时目标检测提供了多种优势:

  • 速度和效率:针对高速推理进行了优化,适合需要低延迟的应用。
  • 高精确度:先进的算法可确保较高的 mAP 和 IoU 分数,同时兼顾精确度和召回率。
  • 灵活性:支持各种任务,包括对象检测、分割和分类。
  • 易于使用:用户友好的界面、丰富的文档以及与Ultralytics HUB(HUB 快速启动)等平台的无缝集成。

这使得YOLO11 成为从自动驾驶汽车到智能城市解决方案等各种应用的理想选择。

YOLO11 中的验证指标如何帮助提高模型性能?

YOLO11 中的验证指标,如精确度、召回率、mAP 和 IoU,通过提供对检测不同方面的见解,有助于诊断和改进模型性能:

  • 精确:有助于识别并尽量减少误报。
  • 召回:确保检测到所有相关对象。
  • mAP:提供整体性能快照,指导总体改进。
  • IoU:帮助微调物体定位精度。

通过分析这些指标,可以找出具体的薄弱环节,例如调整置信度阈值以提高精确度,或收集更多样化的数据以提高召回率。有关这些指标的详细解释以及如何解读这些指标,请查看对象检测指标

📅创建于 1 年前 ✏️已更新 3 个月前

评论