コンテンツにスキップ

パフォーマンス指標の詳細

はじめに

パフォーマンス指標は、精度物体検出モデルの効率を評価するための重要なツールです。モデルが画像内の物体をどれだけ効果的に識別し、特定できるかを明らかにします。さらに、偽陽性および偽陰性のモデルの処理を理解するのに役立ちます。これらの洞察は、モデルのパフォーマンスを評価および向上させるために不可欠です。このガイドでは、YOLO11に関連するさまざまなパフォーマンス指標、その重要性、およびそれらを解釈する方法について説明します。



見る: Ultralytics YOLO11 パフォーマンス指標 | MAP、F1スコア 適合率、IoUと精度

物体検出の指標

YOLO11 にとって重要なだけでなく、さまざまなオブジェクト検出モデルに広く適用できるいくつかのメトリクスについて説明することから始めましょう。

  • Intersection over Union(IoU):IoUは、予測されたバウンディングボックスと正解のバウンディングボックスの間の重複を定量化する指標です。オブジェクトのローカリゼーションの精度を評価する上で基本的な役割を果たします。

  • 平均適合率 (AP): APは、適合率-再現率曲線の下の領域を計算し、モデルの適合率と再現率のパフォーマンスをカプセル化する単一の値を提供します。

  • Mean Average Precision (mAP): mAPは、複数のオブジェクトクラスにわたって平均AP値を計算することにより、APの概念を拡張します。これは、モデルのパフォーマンスを包括的に評価するために、マルチクラスオブジェクト検出シナリオで役立ちます。

  • 適合率と再現率: 適合率は、すべての陽性予測のうち真陽性の割合を定量化し、偽陽性を回避するモデルの能力を評価します。一方、再現率は、すべての実際の陽性例のうち真陽性の割合を計算し、クラスのすべてのインスタンスを検出するモデルの能力を測定します。

  • F1スコア: F1スコアは、適合率と再現率の調和平均であり、偽陽性と偽陰性の両方を考慮しながら、モデルのパフォーマンスのバランスの取れた評価を提供します。

YOLO11モデルのメトリクスを計算する方法

次に、上記で説明した評価指標を計算するために使用できるYOLO11の検証モードを調べることができます。

検証モードの使用は簡単です。学習済みモデルがあれば、model.val() 関数を呼び出すことができます。この関数は、検証データセットを処理し、さまざまなパフォーマンス指標を返します。しかし、これらの指標は何を意味するのでしょうか?また、どのように解釈すればよいのでしょうか?

出力の解釈

model.val() 関数の出力を分解し、出力の各セグメントを理解しましょう。

クラスごとのメトリクス

出力のセクションの1つは、パフォーマンスメトリックのクラスごとの内訳です。この詳細な情報は、特に多様なオブジェクトカテゴリを持つデータセットで、モデルが特定のクラスに対してどの程度うまく機能しているかを理解しようとする場合に役立ちます。データセット内の各クラスについて、以下が提供されます。

  • クラス: これは、「人」、「車」、「犬」などのオブジェクトクラスの名前を示します。

  • 画像: このメトリクスは、オブジェクトクラスを含む検証セット内の画像の数を示します。

  • インスタンス:これは、検証セット内のすべての画像にクラスが表示される回数を示します。

  • Box(P, R, mAP50, mAP50-95): この指標は、オブジェクトの検出におけるモデルのパフォーマンスに関する洞察を提供します。

    • P (適合率): 検出されたオブジェクトの精度。検出がどれだけ正しかったかを示します。

    • R (再現率): 画像内のオブジェクトのすべてのインスタンスを識別するモデルの能力。

    • mAP50: 0.50のIntersection over Union(IoU)閾値で計算された平均適合率。これは、「簡単な」検出のみを考慮したモデルの精度の尺度です。

    • mAP50-95: 0.50から0.95までのさまざまなIoU閾値で計算された平均適合率の平均。さまざまなレベルの検出難易度におけるモデルのパフォーマンスの包括的なビューを提供します。

速度の指標

推論の速度は、特にリアルタイムオブジェクト検出のシナリオでは、精度と同じくらい重要になる可能性があります。このセクションでは、プリプロセスからポストプロセスまで、検証プロセスのさまざまな段階にかかる時間を分析します。

COCOメトリクスの評価

COCOデータセットで検証するユーザーの場合、追加のメトリクスがCOCO評価スクリプトを使用して計算されます。これらのメトリクスは、異なるIoUしきい値および異なるサイズのオブジェクトに対する精度と再現率に関する洞察を提供します。

視覚的な出力

model.val() 関数は、数値メトリックを生成するだけでなく、モデルのパフォーマンスをより直感的に理解できる視覚的な出力も生成します。期待できる視覚的な出力の内訳は次のとおりです。

  • F1スコア曲線(F1_curve.png): この曲線は、以下を表しています。 F1スコア さまざまな閾値にわたって。この曲線を解釈することで、異なる閾値における偽陽性と偽陰性の間のモデルのバランスに関する洞察が得られます。

  • 適合率-再現率曲線 (PR_curve.png):あらゆる分類問題に対する積分視覚化であり、この曲線は適合率と再現率の間のトレードオフを示します。 再現率 さまざまな閾値で評価した場合。特に、不均衡なクラスを扱う場合に重要になります。

  • 適合率曲線 (P_curve.png):異なる閾値における適合率のグラフ表示。この曲線は、閾値が変化するにつれて適合率がどのように変化するかを理解するのに役立ちます。

  • 再現率曲線 (R_curve.png): 同様に、このグラフは、異なる閾値における再現率の値がどのように変化するかを示しています。

  • 混同行列 (confusion_matrix.png): 混同行列は、各クラスの真陽性、真陰性、偽陽性、偽陰性の数を示す、結果の詳細なビューを提供します。

  • 正規化された混同行列 (confusion_matrix_normalized.png): この視覚化は、混同行列の正規化されたバージョンです。生カウントではなく、比率でデータを表します。この形式により、クラス全体のパフォーマンスを簡単に比較できます。

  • 検証バッチラベル(val_batchX_labels.jpg): これらの画像は、検証データセットの個別のバッチに対する正解ラベルを示しています。データセットに従って、オブジェクトが何であるか、およびそれぞれの場所を明確に示しています。

  • 検証バッチ予測(val_batchX_pred.jpg):ラベル画像とは対照的に、これらのビジュアルは、それぞれのバッチに対してYOLO11モデルによって行われた予測を表示します。これらをラベル画像と比較することで、モデルがオブジェクトをどれだけうまく検出し、分類しているかを視覚的に簡単に評価できます。

結果の保存

参考として、結果は通常runs/detect/valという名前のディレクトリに保存されます。

適切な指標の選択

評価のために適切な指標を選ぶことは、多くの場合、特定のアプリケーションに依存します。

  • mAP: モデル性能の全体的な評価に適しています。

  • IoU: 正確なオブジェクトの位置が重要な場合に不可欠です。

  • 適合率: 誤検出を最小限に抑えることが優先される場合に重要です。

  • Recall(再現率): オブジェクトのすべてのインスタンスを検出することが重要な場合に不可欠です。

  • F1スコア: 適合率と再現率のバランスが必要な場合に役立ちます。

リアルタイムアプリケーションでは、FPS(Frames Per Second)やレイテンシなどの速度指標が、タイムリーな結果を保証するために重要です。

結果の解釈

メトリクスを理解することが重要です。一般的に観察される低いスコアが示唆する可能性のある内容は次のとおりです。

  • 低いmAP: モデルが全体的な改善を必要としている可能性があります。

  • 低いIoU: モデルがオブジェクトを正確に特定するのに苦労している可能性があります。異なるバウンディングボックスの手法が役立つ場合があります。

  • 低いPrecision: モデルが多すぎる非実在のオブジェクトを検出している可能性があります。信頼度閾値を調整すると、これを減らすことができます。

  • 低いRecall: モデルが実際のオブジェクトを見逃している可能性があります。特徴抽出を改善するか、より多くのデータを使用すると役立つ場合があります。

  • 不均衡なF1スコア: 適合率と再現率の間にずれがあります。

  • クラス固有のAP: ここで低いスコアは、モデルが苦戦しているクラスを強調表示できます。

ケーススタディ

実世界の例は、これらの指標が実際にどのように機能するかを明確にするのに役立ちます。

ケース1

  • 状況: mAPとF1スコアは最適ではありませんが、Recall(再現率)は良好ですが、Precision(精度)はそうではありません。

  • 解釈とアクション: 不正確な検出が多すぎる可能性があります。信頼度しきい値を厳しくすると、これらを減らすことができますが、再現率もわずかに低下する可能性があります。

ケース2

  • 状況: mAPとRecallは許容範囲内だが、IoUが不足している。

  • 解釈とアクション: モデルはオブジェクトをうまく検出していますが、正確にローカライズしていない可能性があります。バウンディングボックスの予測を改良すると役立つ場合があります。

ケース 3

  • 状況: 全体的なmAPは良好であるにもかかわらず、一部のクラスのAPが他のクラスよりも大幅に低い。

  • 解釈とアクション: これらのクラスは、モデルにとってより難しい場合があります。これらのクラスにより多くのデータを使用するか、トレーニング中にクラスの重みを調整すると有益な場合があります。

つながりとコラボレーション

熱心なファンや専門家のコミュニティに参加することで、YOLO11の理解を深めることができます。ここでは、学習、トラブルシューティング、ネットワーキングを促進するいくつかの方法を紹介します。

より広範なコミュニティとの連携

  • GitHub Issues: GitHubのYOLO11リポジトリには、質問、バグの報告、新機能の提案ができるIssuesタブがあります。コミュニティとメンテナーがここで活発に活動しており、特定の問題に関するヘルプを得るのに最適な場所です。

  • Ultralytics Discord Server: Ultralyticsには、他のユーザーや開発者と交流できるDiscordサーバーがあります。

公式ドキュメントとリソース:

  • Ultralytics YOLO11 Docs: 公式ドキュメントには、YOLO11の包括的な概要と、インストール、使用法、トラブルシューティングに関するガイドが記載されています。

これらのリソースを使用すると、あらゆる課題を乗り越えるだけでなく、YOLO11 コミュニティの最新トレンドやベストプラクティスを常に把握できます。

結論

このガイドでは、YOLO11の重要なパフォーマンス指標を詳しく見てきました。これらの指標は、モデルのパフォーマンスを理解するための鍵であり、モデルを微調整しようとするすべての人にとって不可欠です。改善に必要な洞察を提供し、モデルが実際の状況で効果的に機能することを保証します。

YOLO11とUltralyticsコミュニティは非常に貴重な資産であることを忘れないでください。仲間の開発者や専門家と交流することで、標準的なドキュメントにはない洞察や解決策への扉が開かれることがあります。オブジェクト検出の過程では、学習意欲を持ち続け、新しい戦略を試し、発見したことを共有してください。そうすることで、コミュニティの集合的な知恵に貢献し、その成長を確実なものとします。

オブジェクト検出をお楽しみください!

よくある質問

YOLO11モデルの性能を評価する上で、Mean Average Precision(mAP)の意義は何ですか?

平均適合率(mAP)は、複数のクラスにわたる適合率と再現率をカプセル化する単一の指標を提供するため、YOLO11モデルを評価する上で非常に重要です。mAP@0.50は、IoUの閾値0.50における適合率を測定し、モデルがオブジェクトを正しく検出する能力に焦点を当てています。mAP@0.50:0.95は、一連のIoU閾値における適合率を平均化し、検出性能の包括的な評価を提供します。高いmAPスコアは、モデルが適合率と再現率のバランスを効果的に取れていることを示しており、正確な検出と最小限の誤検出が重要な自律走行や監視システムなどのアプリケーションに不可欠です。

YOLO11オブジェクト検出におけるIntersection over Union(IoU)の値を解釈するにはどうすればよいですか?

Intersection over Union(IoU)は、予測されたバウンディングボックスと正解のバウンディングボックスの間の重複を測定します。IoU値の範囲は0から1で、値が高いほどローカリゼーションの精度が高いことを示します。IoUが1.0の場合、完全に整列していることを意味します。通常、mAPなどのメトリクスで真陽性を定義するために、0.50のIoUしきい値が使用されます。IoU値が低い場合は、モデルが正確なオブジェクトのローカリゼーションに苦労していることを示唆しており、バウンディングボックス回帰を改良するか、トレーニングデータセットのアノテーション精度を高めることで改善できます。

オブジェクト検出において、YOLO11モデルを評価するためにF1スコアが重要なのはなぜですか?

F1スコアは、適合率と再現率の調和平均を提供し、偽陽性と偽陰性の両方のバランスを取るため、YOLO11モデルを評価する上で重要です。これは、不均衡なデータセットや、適合率または再現率のいずれか一方だけでは不十分なアプリケーションを扱う場合に特に役立ちます。高いF1スコアは、モデルがオブジェクトを効果的に検出し、検出漏れと誤警報の両方を最小限に抑えていることを示しており、セキュリティシステム医療画像処理などの重要なアプリケーションに適しています。

リアルタイムオブジェクト検出にUltralytics YOLO11を使用する主な利点は何ですか?

Ultralytics YOLO11 は、リアルタイム物体検出において複数の利点を提供します。

  • 速度と効率: 高速推論に最適化されており、低遅延を必要とするアプリケーションに適しています。
  • 高精度:高度なアルゴリズムにより、高いmAPおよびIoUスコアが保証され、精度と再現率のバランスが取れています。
  • 柔軟性:物体検出、セグメンテーション、分類など、さまざまなタスクをサポートします。
  • 使いやすさ: ユーザーフレンドリーなインターフェース、豊富なドキュメント、およびUltralytics HUB(HUBクイックスタート)のようなプラットフォームとのシームレスな統合。

これにより、YOLO11 は、自動運転車からスマートシティソリューションまで、多様なアプリケーションに最適です。

YOLO11の検証指標は、モデルのパフォーマンス向上にどのように役立ちますか?

適合率、再現率、mAP、IoU などの YOLO11 の検証指標は、検出のさまざまな側面に関する洞察を提供することで、モデルのパフォーマンスを診断および改善するのに役立ちます。

  • 適合率: 偽陽性を特定し、最小限に抑えるのに役立ちます。
  • Recall(再現率): 関連するすべてのオブジェクトが確実に検出されます。
  • mAP: 全体的な性能を把握し、改善の方向性を示すのに役立ちます。
  • IoU:オブジェクトのローカリゼーション精度を微調整するのに役立ちます。

これらのメトリクスを分析することで、精度を向上させるために信頼度閾値を調整したり、リコールを強化するためにより多様なデータを収集するなど、特定の弱点をターゲットにすることができます。これらのメトリクスの詳細な説明と解釈方法については、物体検出メトリクスを確認し、モデルを最適化するためにハイパーパラメータチューニングの実装を検討してください。



📅 1年前に作成 ✏️ 2か月前に更新

コメント