コンテンツぞスキップ

モデルテストの手匕き

はじめに

モデルをトレヌニングし、評䟡したら、次はそれをテストする番です。モデルのテストでは、実際のシナリオでどの皋床うたく機胜するかを評䟡したす。テストでは、正確性、信頌性、公平性、モデルの決定を理解するのがいかに簡単か、ずいった芁玠を考慮したす。目暙は、モデルが意図したずおりに実行され、期埅された結果を提䟛し、アプリケヌションやプロゞェクトの党䜓的な目的に適合しおいるこずを確認するこずです。



芋るんだ How to Test Machine Learning Models | Avoid Data Leakage in Computer Vision 🚀

モデルテストはモデル評䟡ずよく䌌おいたすが、コンピュヌタビゞョンプロゞェクトでは2぀の異なるステップです。モデル評䟡には、モデルの粟床を評䟡するためのメトリクスずプロットが含たれたす。䞀方、モデルテストは、モデルの孊習された動䜜が予想ず同じかどうかをチェックしたす。このガむドでは、コンピュヌタビゞョンモデルをテストするための戊略を探りたす。

モデルテストずモデル評䟡モデル評䟡

たず、モデルの評䟡ずテストの違いを䟋を挙げお理解しよう。

犬猫を認識するコンピュヌタ・ビゞョン・モデルを蚓緎し、このモデルをペット・ショップに配備しお動物を監芖したいずしたす。モデルの評䟡段階では、ラベル付きデヌタセットを䜿甚しお、粟床、粟床、リコヌル、F1スコアなどのメトリクスを蚈算したす。䟋えば、モデルは、䞎えられたデヌタセットで猫ず犬を区別するのに98%の粟床を持぀かもしれたせん。

評䟡埌、ペットショップの画像を䜿っおモデルをテストし、より倚様で珟実的な条件䞋での犬猫の識別胜力を確認したす。猫や犬が動いおいるずき、照明条件が異なるずき、おもちゃや家具のような物䜓で郚分的に隠れおいるずきに、正しくラベル付けできるかどうかをチェックしたす。モデル・テストは、管理された評䟡環境の倖でもモデルが期埅通りに動䜜するかをチェックしたす。

モデルテストの準備

コンピュヌタ・ビゞョンのモデルは、パタヌンを怜出し、予枬を行い、その性胜を評䟡するこずによっお、デヌタセットから孊習する。これらのデヌタセットは通垞、実䞖界の状況をシミュレヌトするためにトレヌニングセットずテストセットに分けられる。トレヌニングデヌタはモデルを孊習させ、テストデヌタはその粟床を怜蚌する。

モデルをテストする前に心に留めおおくべき2぀のポむントがある

  • 珟実的な衚珟以前に芋たこずのないテストデヌタは、モデルがデプロむされたずきに扱わなければならないデヌタず類䌌しおいなければなりたせん。これは、モデルの胜力を珟実的に理解するのに圹立ちたす。
  • 十分なサむズテストデヌタセットのサむズは、モデルの性胜に぀いお信頌できる掞察を提䟛するのに十分な倧きさである必芁がありたす。

コンピュヌタ・ビゞョン・モデルのテスト

ここでは、コンピュヌタビゞョンモデルをテストし、その性胜を理解するための䞻なステップを玹介したす。

  • 予枬を実行するモデルを䜿っおテストデヌタセットの予枬を行う。
  • 予枬を比范するモデルの予枬が実際のラベルground truthずどの皋床䞀臎するかをチェックする。
  • パフォヌマンス指暙を蚈算するモデルの長所ず短所を理解するために、accuracy、precision、recall、F1スコアなどの指暙を蚈算する。テストでは、これらのメトリクスが実際のパフォヌマンスをどのように反映しおいるかに泚目したす。
  • 結果を芖芚化する混同行列やROC曲線のような芖芚的資料を䜜成する。これらは、実甚的なアプリケヌションでモデルがうたく機胜しない可胜性のある特定の領域を発芋するのに圹立ちたす。

次に、怜査結果を分析する

  • 誀分類された画像モデルが誀っお分類した画像を特定し、レビュヌするこずで、モデルがどこで間違っおいるのかを理解する。
  • ゚ラヌ分析゚ラヌの皮類䟋停陜性ず停陰性ずその朜圚的原因を理解するために、培底的な゚ラヌ分析を行う。
  • バむアスず公平性モデルの予枬に偏りがないかチェックする。特に人皮、性別、幎霢のようなセンシティブな属性が含たれる堎合、モデルがデヌタの異なるサブセットで同じようにうたく機胜するこずを確認する。

YOLO11 モデルのテスト

YOLO11 モデルをテストするには、怜蚌モヌドを䜿甚できたす。これは、モデルの長所ず改善が必芁な領域を理解する簡単な方法です。たた、テスト・デヌタセットをYOLO11 甚に正しくフォヌマットする必芁がありたす。怜蚌モヌドの䜿い方の詳现に぀いおは、モデル怜蚌のドキュメントペヌゞをご芧ください。

YOLO11 、耇数のテスト画像に぀いお予枬する。

フォルダに保存された耇数の画像に察しお、孊習したYOLO11 モデルをテストしたい堎合、䞀床に簡単にテストするこずができたす。通垞、怜蚌セットでのモデル・パフォヌマンスを評䟡し、詳现なメトリクスを提䟛するために䜿甚される怜蚌モヌドを䜿甚する代わりに、テスト・セット内のすべおの画像での予枬倀を確認したい堎合がありたす。この堎合、予枬モヌドを䜿甚するこずができたす。

怜蚌モヌドず予枬モヌドの違い

  • 怜蚌モヌド既知のラベルground truthに察する予枬を比范するこずで、モデルのパフォヌマンスを評䟡するために䜿甚されたす。正確床、粟床、再珟性、F1スコアなどの詳现なメトリクスを提䟛したす。
  • 予枬モヌド新しい未芋のデヌタに察しおモデルを実行し、予枬を生成するために䜿甚したす。詳现なパフォヌマンス・メトリクスは提䟛されたせんが、実際の画像に察するモデルのパフォヌマンスを確認するこずができたす。

カスタムトレヌニングなしでYOLO11 予枬を実行する

基本的なYOLO11 モデルをテストしお、カスタム・トレヌニングなしであなたのアプリケヌションに䜿甚できるかどうかを理解するこずに興味がある堎合は、予枬モヌドを䜿甚するこずができたす。モデルはCOCOのようなデヌタセットで事前にトレヌニングされおいたすが、あなた自身のデヌタセットで予枬を実行するこずで、あなたの特定のコンテキストでどの皋床うたく機胜するかを玠早く知るこずができたす。

機械孊習におけるオヌバヌフィットずアンダヌフィット

機械孊習モデルをテストするずき、特にコンピュヌタ・ビゞョンでは、オヌバヌフィッティングやアンダヌフィッティングに泚意するこずが重芁です。これらの問題は、新しいデヌタに察するモデルの動䜜に倧きく圱響したす。

オヌバヌフィット

オヌバヌフィッティングずは、モデルが孊習デヌタをうたく孊習しすぎるこずで、ノむズやディテヌルを含み、新しいデヌタに䞀般化されないこずです。コンピュヌタ・ビゞョンでは、これはモデルがトレヌニング画像ではうたくいっおも、新しい画像では苊戊するこずを意味したす。

オヌバヌフィッティングの兆候

  • トレヌニングの粟床が高く、怜蚌の粟床が䜎いトレヌニングデヌタでは非垞に良い結果を出しおいるのに、怜蚌デヌタやテストデヌタでは悪い結果を出しおいる堎合、オヌバヌフィッティングの可胜性がありたす。
  • 目芖怜査モデルが画像の些现な倉化や無関係な詳现に敏感すぎる堎合、オヌバヌフィッティングが芋られるこずがありたす。

アンダヌフィット

アンダヌフィッティングは、モデルがデヌタ内の根本的なパタヌンを捕捉できない堎合に起こりたす。コンピュヌタ・ビゞョンでは、アンダヌフィッティングのモデルは、トレヌニング画像内のオブゞェクトを正しく認識できないかもしれたせん。

アンダヌフィッティングの兆候

  • トレヌニング粟床が䜎いトレヌニングセットでモデルが高い粟床を達成できない堎合、アンダヌフィットしおいる可胜性がありたす。
  • Visual Mis-classification: Consistent failure to recognize obvious features or objects suggests underfitting.

オヌバヌフィットずアンダヌフィットのバランス

重芁なのは、オヌバヌフィットずアンダヌフィットのバランスを芋぀けるこずである。理想的には、モデルはトレヌニングデヌタセットず怜蚌デヌタセットの䞡方で良奜なパフォヌマンスを瀺すべきです。適切な戊略を適甚するずずもに、メトリクスず目芖怜査によっおモデルのパフォヌマンスを定期的に監芖するこずが、最良の結果を達成するのに圹立ちたす。

オヌバヌフィットずアンダヌフィットの抂芁

コンピュヌタ・ビゞョンにおけるデヌタ挏掩ずその回避方法

モデルをテストする際に泚意しなければならないのは、デヌタリヌクである。デヌタリヌクずは、孊習デヌタセット倖の情報が誀っおモデルの孊習に䜿われおしたうこずです。孊習䞭のモデルは非垞に正確に芋えるかもしれたせんが、デヌタリヌクが発生するず、新しい未芋のデヌタではうたく機胜しなくなりたす。

デヌタ挏掩はなぜ起こるのか

デヌタリヌクを発芋するのは難しいもので、倚くの堎合、トレヌニングデヌタに隠れたバむアスが原因です。ここでは、コンピュヌタ・ビゞョンで起こりうる䞀般的な方法をいく぀か玹介したす

  • カメラの偏りアングル、照明、圱、カメラの動きが異なるず、䞍芁なパタヌンが生じるこずがある。
  • オヌバヌレむ・バむアスロゎ、タむムスタンプ、その他のオヌバヌレむは、モデルを惑わす可胜性がある。
  • フォントずオブゞェクトのバむアス特定のクラスに頻繁に珟れる特定のフォントやオブゞェクトは、モデルの孊習を歪める可胜性がありたす。
  • 空間バむアス前景ず背景、バりンディングボックスの分垃、オブゞェクトの䜍眮のアンバランスは、トレヌニングに圱響を䞎える可胜性がある。
  • ラベルずドメむンの偏り誀ったラベルやデヌタ型のずれは、挏掩に぀ながる可胜性がある。

デヌタ挏掩の怜出

デヌタ挏掩を芋぀けるには

  • パフォヌマンスをチェックするモデルの結果が驚くほど良い堎合は、氎挏れしおいる可胜性がある。
  • 機胜の重芁床を芋るある機胜が他の機胜よりはるかに重芁な堎合、それは挏れを瀺しおいる可胜性がある。
  • 目芖怜査モデルの決定が盎感的に理解できるかどうかを再確認する。
  • デヌタ分割の確認凊理前にデヌタが正しく分割されおいるこずを確認する。

デヌタ挏掩の回避

デヌタ挏掩を防ぐには、異なるカメラや環境から撮圱された画像やビデオを含む倚様なデヌタセットを䜿甚する。デヌタを泚意深くレビュヌし、特定の時間垯に撮圱された陜性サンプルなど、隠れたバむアスがないこずを確認する。デヌタ挏れを防ぐこずは、コンピュヌタビゞョンモデルをより信頌性の高い、実䞖界で効果的なものにするのに圹立ちたす。

モデルテストの埌に来るもの

モデルをテストした埌、次のステップはその結果次第です。モデルがうたく機胜すれば、それを実際の環境に配備するこずができたす。結果が満足のいくものでなければ、改善を行う必芁がありたす。これには、゚ラヌの分析、より倚くのデヌタの収集、デヌタの質の向䞊、ハむパヌパラメヌタの調敎、モデルの再トレヌニングなどが含たれるかもしれたせん。

AIの䌚話に参加しよう

コンピュヌタビゞョン愛奜家のコミュニティの䞀員になるこずは、問題解決や効率的な孊習に圹立ちたす。ここでは、぀ながり、助けを求め、考えを共有する方法をいく぀か玹介したす。

地域資源

  • GitHub Issues YOLO11 GitHub リポゞトリを探玢し、Issues タブで質問、バグ報告、新機胜の提案を行っおください。コミュニティずメンテナヌはずおも掻発で、手助けする準備ができおいたす。
  • Ultralytics Discordサヌバヌ Ultralytics Discord サヌバヌに参加しお、他のナヌザヌや開発者ずチャットしたり、サポヌトを受けたり、経隓を共有したしょう。

公匏文曞

  • Ultralytics YOLO11 ドキュメント様々なコンピュヌタビゞョンプロゞェクトに関する詳现なガむドや圹立぀ヒントに぀いおは、 YOLO11 の公匏ドキュメントをご芧ください。

これらのリ゜ヌスは、コンピュヌタビゞョンコミュニティ内の課題をナビゲヌトし、最新のトレンドずプラクティスを維持するのに圹立ちたす。

たずめ

信頌できるコンピュヌタビゞョンモデルの構築は、厳密なモデルテストに䟝存しおいる。以前に芋たこずのないデヌタでモデルをテストするこずで、モデルを分析し、オヌバヌフィットやデヌタ挏掩などの匱点を発芋するこずができたす。展開前にこれらの問題に察凊するこずで、モデルが実䞖界のアプリケヌションで優れた性胜を発揮できるようになりたす。モデルのテストは、モデルの長期的な成功ず有効性を保蚌する䞊で、モデル評䟡ず同じくらい重芁であるこずを芚えおおくこずが重芁です。

よくあるご質問

コンピュヌタビゞョンにおけるモデル評䟡ずモデルテストの䞻な違いは䜕ですか

モデル評䟡ずモデルテストは、コンピュヌタビゞョンプロゞェクトにおける異なるステップです。モデル評䟡では、ラベル付けされたデヌタセットを䜿甚しお、粟床、粟床、リコヌル、F1スコアなどのメトリクスを蚈算し、制埡されたデヌタセットでのモデルのパフォヌマンスに関する掞察を提䟛したす。䞀方、モデルテストでは、新しい未知のデヌタにモデルを適甚するこずで、実䞖界のシナリオにおけるモデルのパフォヌマンスを評䟡し、モデルの孊習された動䜜が評䟡環境の倖での期埅倀ず䞀臎しおいるこずを確認したす。詳现なガむドに぀いおは、コンピュヌタビゞョンプロゞェクトのステップを参照しおください。

Ultralytics YOLO11 モデルを耇数の画像でテストするには

Ultralytics YOLO11 モデルを耇数の画像でテストするには、予枬モヌドを䜿甚できたす。このモヌドでは、新しい未芋のデヌタに察しおモデルを実行し、詳现なメトリクスを提䟛せずに予枬を生成するこずができたす。これは、フォルダに保存された倧芏暡な画像セットに察する実際のパフォヌマンス・テストに最適です。パフォヌマンス・メトリクスの評䟡には、代わりに怜蚌モヌドを䜿甚したす。

コンピュヌタビゞョンモデルにオヌバヌフィッティングやアンダヌフィッティングの兆候が芋られた堎合、どうすればよいでしょうか

オヌバヌフィッティングに察凊する

  • ドロップアりトのような正則化技術。
  • トレヌニングデヌタセットのサむズを倧きくする。
  • モデル・アヌキテクチャを単玔化する。

アンダヌフィットに察凊する

  • より耇雑なモデルを䜿う。
  • より適切な機胜を提䟛する。
  • トレヌニングの反埩回数たたぱポックを増やす。

誀分類された画像を芋盎し、培底的な゚ラヌ分析を行い、パフォヌマンス指暙を定期的に远跡しおバランスを保぀。これらの抂念の詳现に぀いおは、オヌバヌフィットずアンダヌフィットのセクションをご芧ください。

コンピュヌタ・ビゞョンにおけるデヌタ挏掩を怜出し、回避するには

デヌタ挏掩を怜知する

  • テストのパフォヌマンスが異垞に高くないこずを確認する。
  • 機胜の重芁性をチェックし、予期せぬ掞察を埗る。
  • モデルの決定を盎感的に芋盎す。
  • 凊理前に正しいデヌタ分割を確認する。

デヌタ挏掩を避けるため

  • 様々な環境の倚様なデヌタセットを䜿甚する。
  • 隠されたバむアスがないか、慎重にデヌタを芋盎す。
  • トレヌニングセットずテストセットで情報が重耇しないようにする。

デヌタ挏掩を防ぐための詳现な戊略に぀いおは、「コンピュヌタビゞョンにおけるデヌタ挏掩」のセクションを参照しおください。

コンピュヌタ・ビゞョン・モデルをテストした埌、どのようなステップを螏むべきでしょうか

テスト埌、モデルの性胜がプロゞェクト目暙を満たしおいれば、配備を進める。結果が満足のいくものでない堎合は、以䞋を怜蚎する

モデルテスト察モデル評䟡モデル評䟡のセクションから掞察を埗お、実䞖界のアプリケヌションにおけるモデルの有効性を改善し、向䞊させる。

カスタムトレヌニングなしでYOLO11 予枬を実行するには

事前にトレヌニングされたYOLO11 モデルを䜿甚しおデヌタセット䞊で予枬を実行し、アプリケヌションのニヌズに合っおいるかどうかを確認するこずができたす。予枬モヌドを利甚するこずで、カスタム・トレヌニングを行うこずなく、パフォヌマンス結果を玠早く把握するこずができたす。

📅䜜成6ヶ月前 ✏曎新 9日前

コメント