Link to this sectionパフォーマンスメトリクスの詳細#

Link to this sectionはじめに#

Performance metrics are key tools to evaluate the accuracy and efficiency of object detection models. They shed light on how effectively a model can identify and localize objects within images. Additionally, they help in understanding the model's handling of false positives and false negatives. These insights are crucial for evaluating and enhancing the model's performance. In this guide, we will explore various performance metrics associated with YOLO26, their significance, and how to interpret them.

Watch: Ultralytics YOLO26 Performance Metrics | MAP, F1 Score, Precision, IoU & Accuracy

Link to this section物体検出メトリクス#

まずは、YOLO26だけでなく、さまざまな物体検出モデルに幅広く適用できる重要なメトリクスについて説明します。

Intersection over Union (IoU): IoUは、予測されたバウンディングボックスと正解のバウンディングボックスとの間の重なりを定量化する指標です。これは、物体特定（ローカライゼーション）の精度を評価する上で基本的な役割を果たします。
Average Precision (AP): APは、適合率-再現率（Precision-Recall）曲線の下の面積を計算し、モデルの適合率と再現率のパフォーマンスを単一の値に要約します。
Mean Average Precision (mAP): mAPは、複数のオブジェクトクラスにわたる平均AP値を計算することで、APの概念を拡張したものです。これは、マルチクラス物体検出のシナリオにおいて、モデルのパフォーマンスを包括的に評価するのに役立ちます。
適合率（Precision）と再現率（Recall）: 適合率は、すべての正予測のうち真陽性が占める割合を定量化し、モデルが誤検出を回避する能力を評価します。一方、再現率は、すべての実際の陽性のうち真陽性が占める割合を計算し、クラスのすべてのインスタンスを検出するモデルの能力を測定します。
F1 Score: F1 Scoreは、適合率と再現率の調和平均であり、偽陽性と偽陰性の両方を考慮しつつ、モデルのパフォーマンスをバランスよく評価します。

Link to this sectionYOLO26モデルのメトリクスを計算する方法#

ここでは、前述の評価メトリクスを計算するために使用できるYOLO26の検証モードについて説明します。

検証モード（validation mode）の使用はシンプルです。トレーニング済みのモデルがあれば、model.val()関数を呼び出すことができます。この関数が検証データセットを処理し、様々なパフォーマンスメトリクスを返します。しかし、これらのメトリクスは何を意味するのでしょうか？また、どのように解釈すべきでしょうか？

Link to this section出力の解釈#

model.val()関数の出力を分解し、各セグメントの内容を理解していきましょう。

Link to this sectionクラスごとのメトリクス#

出力の一部には、パフォーマンスメトリクスのクラスごとの内訳が含まれています。この詳細な情報は、特に多様なオブジェクトカテゴリを含むデータセットにおいて、モデルが各クラスに対してどの程度うまく機能しているかを理解しようとする際に役立ちます。データセット内の各クラスについて、以下の情報が提供されます。

Class: "person"（人）、"car"（車）、"dog"（犬）といったオブジェクトクラスの名前を示します。
Images: 検証セットの中でそのオブジェクトクラスを含む画像の数を示します。
Instances: 検証セットの全画像を通して、そのクラスが出現する合計回数を示します。
Box(P, R, mAP50, mAP50-95): このメトリクスは、モデルの物体検出パフォーマンスに関する洞察を提供します。
- P (Precision): 検出されたオブジェクトの精度を示し、何件の検出が正解であったかを表します。
- R (Recall): 画像内のすべてのオブジェクトインスタンスを特定するモデルの能力を表します。
- mAP50: Intersection over Union (IoU) しきい値 0.50 で計算された平均精度です。これは「簡単な」検出のみを考慮したモデルの精度尺度です。
- mAP50-95: 0.50 から 0.95 までのさまざまなIoUしきい値で計算された平均精度の平均値です。これは、異なる検出難易度レベルにわたるモデルのパフォーマンスを包括的に示します。

Link to this section速度メトリクス#

推論速度は、特にリアルタイムの物体検出シナリオでは精度と同じくらい重要になることがあります。このセクションでは、前処理から後処理に至るまで、検証プロセスの各段階にかかった時間を分解して示します。

Link to this sectionCOCOメトリクス評価#

COCOデータセットで検証を行うユーザー向けに、COCO評価スクリプトを使用して追加のメトリクスが計算されます。これらのメトリクスは、異なるIoUしきい値および異なるサイズのオブジェクトに対する適合率と再現率に関する洞察を提供します。

Link to this section視覚的出力#

model.val()関数は、数値的なメトリクスを作成するだけでなく、モデルのパフォーマンスをより直感的に理解できる視覚的な出力も生成します。以下に、予想される視覚的出力を分類します：

F1スコア曲線 (BoxF1_curve.png): この曲線は、さまざまな閾値におけるF1スコアを表します。この曲線を解釈することで、異なる閾値間におけるモデルの偽陽性と偽陰性のバランスに関する洞察を得ることができます。
適合率-再現率曲線 (BoxPR_curve.png): どのような分類問題においても不可欠なこの可視化手法は、さまざまな閾値における適合率と再現率のトレードオフを示します。これは、クラスの不均衡を扱う場合に特に重要となります。
適合率曲線 (BoxP_curve.png): 異なる閾値における適合率の値をグラフで示したものです。この曲線は、閾値の変化に伴って適合率がどのように変化するかを理解するのに役立ちます。
再現率曲線 (BoxR_curve.png): 同様に、このグラフは異なる閾値間で再現率の値がどのように変化するかを示します。
Confusion Matrix (confusion_matrix.png): 混同行列は、各クラスに対する真陽性、真陰性、偽陽性、および偽陰性の数を示し、結果の詳細なビューを提供します。
Normalized Confusion Matrix (confusion_matrix_normalized.png): この可視化は、混同行列の正規化バージョンです。生の値ではなく割合でデータを表します。この形式により、クラス間のパフォーマンス比較が容易になります。
Validation Batch Labels (val_batchX_labels.jpg): これらの画像は、検証データセットの個別のバッチに対する正解ラベルを描画しています。データセットに基づいたオブジェクトが何であり、その位置がどこであるかを明確に示します。
Validation Batch Predictions (val_batchX_pred.jpg): ラベル画像とは対照的に、これらのビジュアルはYOLO26モデルが行った各バッチの予測を表示します。これらをラベル画像と比較することで、モデルがオブジェクトをどれだけ適切に検出および分類できているかを視覚的に容易に評価できます。

検出、セグメンテーション、およびポーズ推定の各タスクにおいて、曲線プロットにはメトリックタイプに応じたプレフィックスが付きます。検出では Box* 曲線が書き出され、セグメンテーションでは Box* および Mask* の両方の曲線が、ポーズ推定では Box* および Pose* の両方の曲線が書き出されます。

Link to this section結果の保存#

後で参照できるように、結果は通常 runs/detect/val という名前のディレクトリに保存されます。

Link to this section適切なメトリクスの選択#

評価する適切なメトリクスの選択は、多くの場合、特定のアプリケーションに依存します。

mAP: モデルパフォーマンスの幅広い評価に適しています。
IoU: 正確なオブジェクトの位置特定が不可欠な場合に必須です。
Precision: 誤検出を最小限に抑えることが優先される場合に重要です。
Recall: オブジェクトのすべてのインスタンスを検出することが重要な場合に不可欠です。
F1 Score: 適合率と再現率のバランスが必要な場合に有用です。

リアルタイムアプリケーションでは、タイムリーな結果を保証するために、FPS（Frames Per Second）やレイテンシなどの速度メトリクスが不可欠です。

Link to this section結果の解釈#

メトリクスを理解することは重要です。よく見られる低いスコアが何を意味する可能性があるかを以下に示します。

Low mAP: モデルに全体的な調整が必要である可能性があります。
Low IoU: モデルがオブジェクトを正確に特定するのに苦戦している可能性があります。異なるバウンディングボックス手法が改善に役立つかもしれません。
Low Precision: モデルが実在しないオブジェクトを検出しすぎている可能性があります。信頼度しきい値を調整することで、これを減らせるかもしれません。
Low Recall: モデルが実際のオブジェクトを見逃している可能性があります。特徴抽出の改善や、より多くのデータの使用が役立つかもしれません。
Imbalanced F1 Score: 適合率と再現率の間に乖離があります。
Class-specific AP: ここでの低いスコアは、モデルが苦戦しているクラスを強調する可能性があります。

Link to this sectionユースケース#

実際の事例は、これらのメトリクスが実際にどのように機能するかを明らかにするのに役立ちます。

Link to this sectionケース 1#

状況: mAPとF1 Scoreが最適ではなく、再現率は良いが適合率が低い。
解釈とアクション: 誤検出が多すぎる可能性があります。信頼度しきい値を厳しくすることで誤検出を減らせる可能性がありますが、再現率がわずかに低下する可能性があります。

Link to this sectionケース 2#

状況: mAPと再現率は許容範囲だが、IoUが不足している。
解釈とアクション: モデルはオブジェクトを十分に検出できていますが、正確な位置特定ができていない可能性があります。バウンディングボックス予測の調整が役立つかもしれません。

Link to this sectionケース 3#

状況: 全体的なmAPはまずまずであるにもかかわらず、特定のクラスのAPが他より大幅に低い。
解釈とアクション: これらのクラスはモデルにとってより難易度が高い可能性があります。これらのクラスのデータを増やすことや、学習中にクラスの重みを調整することが有益かもしれません。

Link to this section接続とコラボレーション#

愛好家や専門家のコミュニティを活用することで、YOLO26での経験がより充実したものになります。学習、トラブルシューティング、ネットワーキングを促進するためのいくつかの方法を以下に示します。

Link to this sectionより広範なコミュニティとの交流#

GitHub Issues: GitHub上のYOLO26リポジトリにはIssuesタブがあり、そこで質問をしたり、バグを報告したり、新機能を提案したりできます。コミュニティやメンテナがここで活発に活動しており、具体的な問題の解決策を得るのに最適な場所です。
Ultralytics Discordサーバー: UltralyticsにはDiscordサーバーがあり、他のユーザーや開発者と交流することができます。

Link to this section公式ドキュメントとリソース:#

Ultralytics YOLO26 Docs: 公式ドキュメントでは、YOLO26の包括的な概要に加えて、インストール、使用方法、トラブルシューティングに関するガイドを提供しています。

これらのリソースを活用することは、課題の解決に役立つだけでなく、YOLO26コミュニティの最新トレンドやベストプラクティスを常に把握することにもつながります。

Link to this section結論#

本ガイドでは、YOLO26の必須パフォーマンスメトリクスを詳しく見てきました。これらのメトリクスは、モデルがどの程度機能しているかを理解する鍵であり、モデルの微調整を目指す人には不可欠です。それらは、改善に必要な洞察を提供し、実際の状況でモデルが確実に効果的に機能するようにします。

YOLO26およびUltralyticsコミュニティが貴重な資産であることを忘れないでください。他の開発者や専門家と交流することで、標準的なドキュメントにはない洞察や解決策への扉が開かれます。物体検出の探求を続ける中で、学習する精神を持ち続け、新しい戦略を試し、発見を共有してください。そうすることで、コミュニティの集合知に貢献し、その成長を確実にします。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionYOLO26モデルのパフォーマンス評価において、Mean Average Precision (mAP) の重要性は何ですか？#

Mean Average Precision (mAP) は、複数のクラスにわたる精度と再現率を包含する単一のメトリクスを提供するため、YOLO26モデルの評価において不可欠です。mAP@0.50はIoUしきい値0.50における精度を測定し、モデルが物体を正しく検出する能力に焦点を当てます。mAP@0.50:0.95は、IoUしきい値の範囲全体で精度を平均化し、検出パフォーマンスを包括的に評価します。高いmAPスコアは、モデルが精度と再現率のバランスを効果的に取れていることを示しており、自動運転や監視システムなど、正確な検出と最小限の誤警報の両方が不可欠なアプリケーションにおいて重要です。

Link to this sectionYOLO26物体検出のIntersection over Union (IoU) 値をどのように解釈すればよいですか？#

Intersection over Union (IoU) は、予測されたバウンディングボックスと正解のバウンディングボックスの間の重なりを測定します。IoU値は 0 から 1 の範囲で、値が高いほど位置特定精度が良いことを示します。IoUが 1.0 の場合は完全に一致していることを意味します。通常、mAPなどのメトリクスで真陽性を定義するために、0.50 のIoUしきい値が使用されます。IoU値が低いことは、モデルがオブジェクトの正確な位置特定に苦戦していることを示唆しており、バウンディングボックス回帰を調整するか、学習データセットのアノテーション精度を向上させることで改善できます。

Link to this section物体検出において、YOLO26モデルを評価する際、なぜF1 Scoreが重要なのですか？#

F1 Scoreは、精度と再現率の調和平均を提供し、偽陽性と偽陰性の両方のバランスを取るため、YOLO26モデルの評価において重要です。これは、不均衡なデータセットを扱う場合や、精度または再現率のどちらか一方だけでは不十分なアプリケーションにおいて特に有用です。高いF1 Scoreは、モデルが検出漏れと誤警報の両方を最小限に抑えながら物体を効果的に検出していることを示しており、セキュリティシステムや医療画像解析といった重要なアプリケーションに適しています。

Link to this sectionリアルタイム物体検出にUltralytics YOLO26を使用する主な利点は何ですか？#

Ultralytics YOLO26は、リアルタイム物体検出において複数の利点を提供します：

速度と効率: 高速推論に最適化されており、低レイテンシが求められるアプリケーションに適しています。
高精度: 高度なアルゴリズムが、適合率と再現率のバランスを取りながら、高いmAPおよびIoUスコアを保証します。
柔軟性: 物体検出、インスタンスセグメンテーション、セマンティックセグメンテーション、分類を含むさまざまなタスクをサポートしています。
使いやすさ: ユーザーフレンドリーなインターフェース、広範なドキュメント、およびUltralytics Platform (プラットフォームクイックスタート) などのツールとのシームレスな統合。

これにより、YOLO26は自動運転車からスマートシティソリューションまで、多様なアプリケーションに理想的です。

Link to this sectionYOLO26からの検証メトリクスは、どのようにモデルパフォーマンスの向上に役立ちますか？#

適合率、再現率、mAP、IoUといったYOLO26の検証メトリクスは、検出のさまざまな側面に関する洞察を提供することで、パフォーマンスの診断と向上を支援します：

Precision: 誤検出の特定と最小化を支援します。
Recall: 関連するすべてのオブジェクトが確実に検出されるようにします。
mAP: 全体的なパフォーマンスのスナップショットを提供し、一般的な改善の指針となります。
IoU: オブジェクトの位置特定精度を微調整するのに役立ちます。

これらのメトリクスを分析することで、適合率を向上させるための信頼度しきい値の調整や、再現率を高めるためのより多様なデータの収集など、特定の弱点をターゲットにすることができます。これらのメトリクスの詳細な説明および解釈方法については、物体検出メトリクスを確認し、モデルを最適化するためにハイパーパラメータチューニングを実施することを検討してください。

コントリビューター

GLglenn-jocher¹² RAraimbekovm² RIRizwanMunawar² MImiles-deans-ultralytics¹ PDpderrenger¹ Y-Y-T-G¹ WIWillieMaddox¹ LEleonnil¹

作成日 2023年11月12日更新日 2 週間前