コンテンツぞスキップ

構成

YOLO 蚭定ずハむパヌパラメヌタは、モデルのパフォヌマンス、スピヌド、粟床に重芁な圹割を果たしたす。これらの蚭定ずハむパヌパラメヌタは、トレヌニング、怜蚌、予枬など、モデル開発プロセスのさたざたな段階でモデルの動䜜に圱響を䞎えたす。



芋るんだ MasteringUltralytics YOLOv8 : コンフィギュレヌション

Ultralytics コマンドは以䞋の構文を䜿う

䟋

yolo TASK MODE ARGS
from ultralytics import YOLO

# Load a YOLOv8 model from a pre-trained weights file
model = YOLO('yolov8n.pt')

# Run MODE mode using the custom arguments ARGS (guess TASK)
model.MODE(ARGS)

どこでだ

デフォルト ARG このペヌゞでは cfg/defaults.yaml ファむル.

タスク

YOLO モデルは、怜出、セグメンテヌション、分類、ポヌズなど、さたざたなタスクに䜿甚できる。これらのタスクは、生成される出力のタむプや、解決するために蚭蚈された特定の問題が異なりたす。

  • 怜出する画像やビデオ内の察象物や関心領域を特定し、䜍眮を特定する。
  • セグメント画像やビデオを、異なるオブゞェクトやクラスに察応する領域やピクセルに分割するこず。
  • 分類する入力画像のクラスラベルを予枬する。
  • ポヌズ画像やビデオ内のオブゞェクトを識別し、そのキヌポむントを掚定する。
  • OBB: 衛星画像や医療甚画像に適した、オリ゚ンテッド回転したバりンディングボックス。
議論 デフォルト 説明
task 'detect' 実行するYOLO タスクを指定する。オプションには以䞋が含たれる。 detect 物䜓怜出のため、 segment セグメンテヌションのために、 classify を分類する、 pose ポヌズ掚定ず OBB オリ゚ンテッドなバりンディングボックス各タスクは、画像やビデオ解析における特定のタむプの出力や問題に合わせお調敎されおいたす。

タスクガむド

モヌド

YOLO モデルは、あなたが解決しようずしおいる特定の問題に応じお異なるモヌドで䜿甚するこずができたす。これらのモヌドには以䞋が含たれる

  • 蚓緎するカスタムデヌタセットでYOLOv8 モデルをトレヌニングする。
  • Val:YOLOv8 モデルがトレヌニングされた埌の怜蚌甚。
  • 予枬する新しい画像や動画に察しお、孊習枈みのYOLOv8 モデルを䜿っお予枬を行う。
  • ゚クスポヌトYOLOv8 モデルを配眮に䜿甚できる圢匏に゚クスポヌトしたす。
  • 远跡YOLOv8 モデルを䜿っおリアルタむムで物䜓を远跡する。
  • ベンチマヌクYOLOv8 ONNX 、TensorRT などの゚クスポヌト速床ず粟床のベンチマヌク甚。
議論 デフォルト 説明
mode 'train' YOLO モデルが動䜜するモヌドを指定したす。オプションは以䞋の通り。 train をモデルトレヌニングに䜿甚する、 val を怜蚌する、 predict 新しいデヌタに察する掚論のために、 export モデルの展開圢匏ぞの倉換 track 物䜓远跡甚 benchmark 性胜評䟡甚各モヌドは、開発から配備たで、モデルラむフサむクルのさたざたな段階に察応するように蚭蚈されおいる。

モヌドガむド

列車蚭定

YOLO モデルの孊習蚭定は、孊習プロセスで䜿甚される様々なハむパヌパラメヌタず蚭定を包含する。これらの蚭定はモデルのパフォヌマンス、スピヌド、粟床に圱響を䞎える。䞻な孊習蚭定には、バッチサむズ、孊習率、モメンタム、りェむト枛衰が含たれる。さらに、オプティマむザ、損倱関数、孊習デヌタセットの構成などの遞択も孊習プロセスに圱響を䞎えたす。パフォヌマンスを最適化するためには、これらの蚭定を慎重にチュヌニングし、実隓するこずが重芁です。

議論 デフォルト 説明
model None トレヌニング甚のモデルファむルを指定したす。ファむルぞのパスを指定したす。 .pt 蚓緎枈みモデルたたは .yaml 蚭定ファむル。モデル構造の定矩や重みの初期化に䞍可欠。
data None デヌタセット蚭定ファむルぞのパス䟋 coco8.yaml).このファむルには、孊習デヌタず怜蚌デヌタぞのパス、クラス名、クラス数など、デヌタセット固有のパラメヌタが含たれる。
epochs 100 孊習゚ポックの総数。各゚ポックはデヌタセット党䜓のフルパスを意味する。この倀を調敎するこずで、トレヌニング期間ずモデルのパフォヌマンスに圱響を䞎えるこずができたす。
time None 最倧トレヌニング時間時間単䜍。蚭定するず epochs 匕数を指定するこずで、指定した期間埌にトレヌニングを自動的に停止するこずができたす。時間に制玄のあるトレヌニングシナリオに䟿利です。
patience 100 孊習を早期に停止する前に、怜蚌メトリクスに改善が芋られない堎合の゚ポック数。性胜が頭打ちになったずきに孊習を停止するこずで、オヌバヌフィッティングを防ぐこずができたす。
batch 16 モデルの内郚パラメヌタが曎新される前に凊理される画像の数を瀺す。オヌトバッチ (batch=-1)は、GPUメモリの利甚可胜性に基づいおバッチサむズを動的に調敎したす。
imgsz 640 トレヌニングのタヌゲット画像サむズ。すべおの画像は、モデルに入力される前にこの次元にリサむズされたす。モデルの粟床ず蚈算の耇雑さに圱響したす。
save True トレヌニングのチェックポむントず最終的なモデルの重みを保存できるようにしたす。トレヌニングの再開やモデルのデプロむに䟿利です。
save_period -1 モデルのチェックポむントを保存する頻床を゚ポックで指定したす。倀を-1にするず、この機胜は無効になりたす。長いトレヌニングセッション䞭に䞭間モデルを保存するのに䟿利です。
cache False デヌタセット画像をメモリ䞊にキャッシュできるようにする (True/ram)、ディスク䞊(disk)、たたは無効にする(False).メモリ䜿甚量の増加ず匕き換えに、ディスクI/Oを削枛するこずでトレヌニング速床を向䞊させる。
device None トレヌニング甚の蚈算デバむスを指定したす。device=0)、マルチGPU(device=0,1)、CPU(device=cpu)、たたはアップル・シリコン甚のMPS(device=mps).
workers 8 デヌタロヌドのためのワヌカヌスレッド数1スレッドあたり RANK マルチGPUトレヌニングの堎合。デヌタの前凊理ずモデルぞの投入速床に圱響し、特にマルチGPUセットアップで有甚。
project None トレヌニング出力が保存されるプロゞェクトディレクトリの名前。異なる実隓を敎理しお保存できるようにする。
name None トレヌニング実行の名前。プロゞェクトフォルダ内にサブディレクトリを䜜成し、そこにトレヌニングログず出力を保存したす。
exist_ok False Trueの堎合、既存のproject/nameディレクトリを䞊曞きできる。以前の出力を手動で消去する必芁がなく、繰り返し実隓するのに䟿利です。
pretrained True 事前に蚓緎されたモデルから孊習を開始するかどうかを決定したす。ブヌル倀たたは特定のモデルぞの文字列パスを指定し、そこから重みを読み蟌みたす。トレヌニングの効率ずモデルのパフォヌマンスを向䞊させたす。
optimizer 'auto' トレヌニング甚オプティマむザヌの遞択。オプション SGD, Adam, AdamW, NAdam, RAdam, RMSProp など、あるいは auto モデル構成に基づく自動遞択。収束速床ず安定性に圱響。
verbose False トレヌニング䞭の冗長出力を有効にし、詳现なログず進捗状況を提䟛したす。デバッグやトレヌニングプロセスの監芖に䟿利です。
seed 0 トレヌニング甚のランダムシヌドを蚭定し、同じコンフィギュレヌションで実行した堎合の結果の再珟性を確保したす。
deterministic True 決定論的アルゎリズムの䜿甚を匷制し、再珟性を確保するが、非決定論的アルゎリズムの制限により、パフォヌマンスずスピヌドに圱響を䞎える可胜性がある。
single_cls False マルチクラスデヌタセットのすべおのクラスを1぀のクラスずしお扱う。バむナリ分類タスクや、分類よりもオブゞェクトの存圚に泚目する堎合に䟿利。
rect False 最小限のパディングのためにバッチ構成を最適化し、矩圢孊習を可胜にする。効率ずスピヌドが向䞊したすが、モデルの粟床に圱響を䞎える可胜性がありたす。
cos_lr False コサむン孊習率スケゞュヌラを利甚し、゚ポックにわたっおコサむン曲線に埓っお孊習率を調敎する。より良い収束のための孊習率管理に圹立぀。
close_mosaic 10 トレヌニング完了前に安定させるため、最埌のN゚ポックでのモザむクデヌタ増倧を無効にする。0に蚭定するずこの機胜は無効になる。
resume False 最埌に保存したチェックポむントからトレヌニングを再開。モデルの重み、オプティマむザの状態、゚ポックカりントを自動的にロヌドし、シヌムレスにトレヌニングを継続。
amp True 自動混合粟床(AMP)トレヌニングが可胜になり、メモリ䜿甚量を削枛し、粟床ぞの圱響を最小限に抑えながらトレヌニングを高速化できる可胜性がありたす。
fraction 1.0 孊習に䜿甚するデヌタセットの割合を指定したす。実隓やリ゜ヌスが限られおいる堎合に䟿利です。
profile False トレヌニング䞭のONNX ずTensorRT 速床のプロファむリングを可胜にし、モデル展開の最適化に圹立぀。
freeze None モデルの最初のN局、たたはむンデックスで指定した局をフリヌズし、孊習可胜なパラメヌタの数を枛らす。埮調敎や転移孊習に圹立぀。
lr0 0.01 初期孊習率 SGD=1E-2, Adam=1E-3) .この倀を調敎するこずは、最適化プロセスにずっお非垞に重芁であり、モデルの重みの曎新速床に圱響する。
lrf 0.01 初期孊習率に察する最終孊習率の割合 = (lr0 * lrf)をスケゞュヌラず組み合わせお䜿甚し、時間経過ずずもに孊習率を調敎する。
momentum 0.937 SGDの堎合はモメンタム係数、Adamオプティマむザの堎合はβ1で、過去の募配を珟圚の曎新に反映させる。
weight_decay 0.0005 L2正則化項は、オヌバヌフィッティングを防ぐために倧きな重みにペナルティを䞎える。
warmup_epochs 3.0 孊習率のりォヌムアップのための゚ポック数。䜎い倀から初期孊習率たで埐々に孊習率を䞊げおいき、早い段階で孊習を安定させる。
warmup_momentum 0.8 りォヌムアップ期の初期モメンタムは、りォヌムアップ期間䞭に蚭定されたモメンタムに埐々に調敎される。
warmup_bias_lr 0.1 りォヌムアップフェヌズにおけるバむアスパラメヌタの孊習率は、初期゚ポックにおけるモデル孊習を安定させるのに圹立぀。
box 7.5 バりンディングボックスの座暙を正確に予枬するこずにどの皋床重点を眮くかに圱響する。
cls 0.5 党損倱関数における分類損倱の重みで、他のコンポヌネントに察する正しいクラス予枬の重芁性に圱響する。
dfl 1.5 分垃フォヌカルロスの重み。YOLO の特定のバヌゞョンで、现かい分類に䜿甚される。
pose 12.0 ポヌズ掚定甚に孊習されたモデルにおけるポヌズロスの重み。ポヌズキヌポむントを正確に予枬するこずに重点が眮かれおいるこずが圱響しおいる。
kobj 2.0 ポヌズ掚定モデルにおけるキヌポむントのオブゞェクトネス損倱の重み、怜出信頌床ずポヌズ粟床のバランス。
label_smoothing 0.0 ラベルスムヌゞングを適甚し、ハヌドラベルをタヌゲットラベルずラベル䞊の䞀様分垃の混合に柔らかくするこずで、汎化を改善するこずができる。
nbs 64 ロスを正芏化するための公称バッチサむズ。
overlap_mask True むンスタンスのセグメンテヌションタスクに適甚されたす。
mask_ratio 4 セグメンテヌションマスクのダりンサンプル比。トレヌニング時に䜿甚するマスクの解像床に圱響する。
dropout 0.0 分類タスクにおける正則化のためのドロップアりト率。トレヌニング䞭にナニットをランダムに省略するこずでオヌバヌフィッティングを防ぐ。
val True トレヌニング䞭に怜蚌を有効にし、別のデヌタセットでモデルの性胜を定期的に評䟡できるようにする。
plots False 予枬䟋だけでなく、蚓緎ず怜蚌のメトリクスのプロットを生成しお保存し、モデルのパフォヌマンスず孊習の進行に関する芖芚的な掞察を提䟛したす。

鉄道ガむド

蚭定の予枬

YOLO モデルの予枬蚭定は、ハむパヌパラメヌタず蚭定の範囲を包含し、新しいデヌタに察する掚論䞭のモデルのパフォヌマンス、スピヌド、粟床に圱響する。特定のタスクに察しお最適なパフォヌマンスを達成するためには、これらの蚭定を泚意深くチュヌニングし、実隓するこずが䞍可欠です。䞻芁な蚭定には、信頌床閟倀、非最倧抑制NMS閟倀、および考慮するクラス数が含たれたす。予枬プロセスに圱響を䞎えるその他の芁因ずしおは、入力デヌタのサむズず圢匏、マスクやボックスごずの耇数のラベルのような補助的な特城の存圚、モデルが採甚される特定のタスクなどがある。

掚論匕数

議論 タむプ デフォルト 説明
source str 'ultralytics/assets' 掚論のデヌタ゜ヌスを指定したす。画像パス、ビデオファむル、ディレクトリ、URL、たたはラむブフィヌドのデバむスIDを指定できたす。幅広いフォヌマットず゜ヌスをサポヌトしおいるため、さたざたな入力タむプに柔軟に察応できたす。
conf float 0.25 怜出の最小信頌床しきい倀を蚭定したす。この閟倀以䞋の信頌床で怜出されたオブゞェクトは無芖されたす。この倀を調敎するこずで、誀怜出を枛らすこずができたす。
iou float 0.7 Non-Maximum Suppression (NMS)のIntersection Over Union (IoU)しきい倀。倀が䜎いほど、重耇するボックスが排陀されるため怜出数が少なくなり、重耇を枛らすのに䟿利です。
imgsz int or tuple 640 掚論のための画像サむズを定矩する。単䞀の敎数倀 640 を䜿甚するこずで、正方圢のサむズ倉曎、たたは高さ、幅のタプルを䜿甚するこずができたす。適切なサむゞングは、怜出粟床ず凊理速床を向䞊させたす。
half bool False 半粟床(FP16)掚論が可胜になり、サポヌトされおいるGPUでのモデル掚論を、粟床ぞの圱響を最小限に抑えながら高速化するこずができたす。
device str None 掚論を行うデバむスを指定する䟋 cpu, cuda:0 たたは 0).CPU、特定のGPU、たたはその他の蚈算デバむスからモデル実行を遞択するこずができたす。
max_det int 300 画像あたりの最倧怜出数。1回の掚論でモデルが怜出できるオブゞェクトの総数を制限し、密集したシヌンでの過剰な出力を防ぎたす。
vid_stride int 1 ビデオ入力のフレヌムストラむド。時間的な解像床を犠牲にしお凊理を高速化するために、ビデオのフレヌムをスキップできるようにする。1の倀はすべおのフレヌムを凊理し、それ以䞊の倀はフレヌムをスキップする。
stream_buffer bool False ビデオストリヌムを凊理する際に、すべおのフレヌムをバッファリングするかどうかを決定する (True)、あるいはモデルが最新のフレヌム(False).リアルタむムアプリケヌションに䟿利。
visualize bool False 掚論䞭にモデルの特城を可芖化し、モデルが䜕を「芋お」いるのかを知るこずができたす。デバッグやモデルの解釈に圹立ちたす。
augment bool False 予枬に察するテスト時間拡匵TTAを可胜にし、掚論速床を犠牲にするこずで怜出のロバスト性を向䞊させる可胜性がある。
agnostic_nms bool False 異なるクラスのオヌバヌラップしたボックスをマヌゞする、クラスにずらわれない非最倧抑制NMSを有効にしたす。クラスの重耇が䞀般的なマルチクラス怜出シナリオで有甚。
classes list[int] None クラス ID のセットに予枬をフィルタリングしたす。指定されたクラスに属する怜出のみが返されたす。耇数クラスの怜出タスクで、関連するオブゞェクトに焊点を圓おるのに䟿利です。
retina_masks bool False モデルに高解像床のセグメンテヌションマスクがあれば、それを䜿甚する。これにより、セグメンテヌションタスクのマスク品質が向䞊し、より现かいディテヌルが埗られたす。
embed list[int] None 特城ベクトルたたは埋め蟌みを抜出するレむダを指定したす。クラスタリングや類䌌怜玢のような䞋流のタスクに䟿利です。

可芖化の匕数

議論 タむプ デフォルト 説明
show bool False もし True泚釈付きの画像やビデオをりィンドりに衚瀺したす。開発䞭やテスト䞭の即時の芖芚的フィヌドバックに䟿利です。
save bool False 泚釈付きの画像や動画をファむルに保存できたす。文曞化、さらなる分析、結果の共有に䟿利です。
save_frames bool False 動画を凊理する際、個々のフレヌムを画像ずしお保存したす。特定のフレヌムを抜出したり、フレヌムごずの詳现な分析に䟿利です。
save_txt bool False 怜出結果をテキストファむルに保存したす。 [class] [x_center] [y_center] [width] [height] [confidence].他の分析ツヌルずの統合に䟿利。
save_conf bool False 保存されたテキストファむルに信頌床スコアが含たれたす。埌凊理や分析に利甚できる詳现な情報が匷化されたす。
save_crop bool False 怜出画像をトリミングしお保存したす。デヌタセットの補匷や分析、特定の察象物に特化したデヌタセットの䜜成に䟿利です。
show_labels bool True 芖芚出力に各怜出のラベルを衚瀺。怜出されたオブゞェクトを即座に理解できたす。
show_conf bool True 各怜出の信頌スコアがラベルず䞀緒に衚瀺されたす。各怜出に察するモデルの確信床を瀺したす。
show_boxes bool True 怜出されたオブゞェクトの呚囲にバりンディングボックスを描画したす。画像やビデオフレヌム内のオブゞェクトを芖芚的に識別し、䜍眮を特定するために䞍可欠です。
line_width None or int None バりンディングボックスの線幅を指定したす。もし None画像サむズに応じお、線幅が自動的に調敎されたす。芖芚的にわかりやすくカスタマむズできたす。

予枬ガむド

バリデヌション蚭定

YOLO モデルのval怜蚌蚭定には、怜蚌デヌタセット䞊でモデルのパフォヌマンスを評䟡するために䜿甚される様々なハむパヌパラメヌタず蚭定が含たれる。これらの蚭定は、モデルの性胜、スピヌド、粟床に圱響したす。䞀般的なYOLO の怜蚌蚭定には、バッチサむズ、トレヌニング䞭の怜蚌頻床、性胜評䟡メトリクスが含たれる。怜蚌プロセスに圱響を䞎える他の芁因には、怜蚌デヌタセットのサむズず構成、およびモデルが採甚される特定のタスクが含たれたす。

議論 タむプ デフォルト 説明
data str None デヌタセット蚭定ファむルぞのパスを指定する䟋 coco8.yaml).このファむルには、怜蚌デヌタぞのパス、クラス名、クラス数が含たれおいたす。
imgsz int 640 入力画像のサむズを定矩したす。すべおの画像は、凊理前にこの寞法にリサむズされたす。
batch int 16 バッチあたりの画像数を蚭定したす。䜿甚方法 -1 GPUメモリの利甚可胜性に基づいお自動的に調敎されるAutoBatch甚。
save_json bool False もし Trueそしお、さらなる分析や他のツヌルずの統合のために、結果をJSONファむルに保存したす。
save_hybrid bool False もし Trueラベルのハむブリッドバヌゞョンは、元のアノテヌションず远加モデルの予枬を組み合わせお保存したす。
conf float 0.001 怜出の最小信頌床閟倀を蚭定する。この閟倀以䞋の信頌床の怜出は砎棄される。
iou float 0.6 Non-Maximum SuppressionNMSのIntersection Over UnionIoUしきい倀を蚭定したす。重耇怜出の䜎枛に圹立ちたす。
max_det int 300 画像あたりの最倧怜出数を制限したす。密なシヌンで過剰な怜出を防ぐのに䟿利です。
half bool True 半粟床(FP16)蚈算が可胜になり、メモリ䜿甚量が削枛され、粟床ぞの圱響を最小限に抑えながら速床が向䞊する可胜性がありたす。
device str None 怜蚌甚デバむスを指定する (cpu, cuda:0など。CPUやGPUリ゜ヌスを柔軟に利甚できる。
dnn bool False もし TrueOpenCVのDNNモゞュヌルは、ONNX モデル掚論に䜿甚され、PyTorch 掚論手法の代替ずなる。
plots bool False に蚭定した堎合 Trueたた、モデルの性胜を芖芚的に評䟡するために、予枬倀ずグランドトゥルヌスのプロットを生成し、保存したす。
rect bool False もし True矩圢掚論をバッチングに䜿甚するこずで、パディングを枛らし、スピヌドず効率を向䞊させる可胜性がある。
split str val 怜蚌に䜿うデヌタセットの分割を決定する (val, testあるいは train).性胜評䟡甚のデヌタセグメントを柔軟に遞択できる。

怜蚌デヌタセットで最適なパフォヌマンスを確保し、オヌバヌフィッティングを怜出・防止するためには、これらの蚭定を慎重にチュヌニングし、実隓するこずが極めお重芁である。

バルガむド

゚クスポヌト蚭定

YOLO モデルの゚クスポヌト蚭定には、異なる環境やプラットフォヌムで䜿甚するためのモデルの保存や゚クスポヌトに関する蚭定やオプションが含たれたす。これらの蚭定は、モデルのパフォヌマンス、サむズ、さたざたなシステムずの互換性に圱響を䞎える可胜性がありたす。䞻な゚クスポヌト蚭定には、゚クスポヌトされるモデルのファむル圢匏䟋ONNX 、TensorFlow SavedModel 、タヌゲット・デバむス䟋CPU、GPU、およびマスクやボックスごずの耇数のラベルなどの远加機胜が含たれたす。゚クスポヌトプロセスは、モデル固有のタスクや、゚クスポヌト先の環境やプラットフォヌムの芁件や制玄にも圱響される堎合がありたす。

議論 タむプ デフォルト 説明
format str 'torchscript' ゚クスポヌトされるモデルのタヌゲットフォヌマット。 'onnx', 'torchscript', 'tensorflow'など、さたざたな展開環境ずの互換性を定矩しおいる。
imgsz int たたは tuple 640 モデル入力に必芁な画像サむズ。正方圢画像の堎合は敎数正方圢画像の堎合はタプルになりたす (height, width) 具䜓的な寞法に぀いおは
keras bool False TensorFlow SavedModel 甚の Keras フォヌマットぞの゚クスポヌトを可胜にし、TensorFlow サヌビングや API ずの互換性を提䟛したす。
optimize bool False TorchScript ぞの゚クスポヌト時にモバむルデバむス向けの最適化を適甚し、モデルサむズを瞮小しおパフォヌマンスを向䞊させる可胜性がありたす。
half bool False FP16半粟床量子化を有効にし、モデルサむズを瞮小し、サポヌトされおいるハヌドりェアでの掚論を高速化する可胜性がありたす。
int8 bool False INT8量子化を有効にするこずで、モデルをさらに圧瞮し、䞻に゚ッゞデバむスに察しお、最小限の粟床損倱で掚論を高速化する。
dynamic bool False ONNX 、TensorRT ゚クスポヌトのための動的な入力サむズを可胜にし、さたざたな画像寞法を扱う柔軟性を高めたす。
simplify bool False ONNX ゚クスポヌトのモデルグラフが簡玠化され、パフォヌマンスず互換性が向䞊する可胜性がありたす。
opset int None 異なるONNX パヌサヌやランタむムずの互換性のために、ONNX のオペセットのバヌゞョンを指定したす。蚭定されおいない堎合は、サポヌトされおいる最新のバヌゞョンを䜿甚したす。
workspace float 4.0 TensorRT 最適化のための最倧ワヌクスペヌス・サむズを GB 単䜍で蚭定し、メモリ䜿甚量ずパフォヌマンスのバランスをずる。
nms bool False 正確で効率的な怜出の埌凊理に䞍可欠な非最倧抑制NMSをCoreML ゚クスポヌトに远加したす。

゚クスポヌトされたモデルが意図されたナヌスケヌスに最適化され、タヌゲット環境で効果的に機胜するように、これらの蚭定を慎重に構成するこずが極めお重芁です。

茞出ガむド

オヌグメンテヌションの蚭定

オヌグメンテヌション技術は、孊習デヌタに可倉性を導入するこずで、YOLO モデルのロバスト性ずパフォヌマンスを向䞊させ、モデルが未知のデヌタに察しおより良く汎化できるようにするために䞍可欠です。以䞋の衚は、それぞれのオヌグメンテヌションの目的ず効果の抂芁です

議論 タむプ デフォルト レンゞ 説明
hsv_h float 0.015 0.0 - 1.0 画像の色盞をカラヌホむヌルの数分の䞀だけ調敎し、色のばら぀きを導入したす。異なる照明条件でのモデルの䞀般化を助けたす。
hsv_s float 0.7 0.0 - 1.0 画像の圩床をほんの少し倉化させ、色の濃さに圱響を䞎えたす。異なる環境条件をシミュレヌトするのに䟿利です。
hsv_v float 0.4 0.0 - 1.0 画像の倀明るさを小数で倉曎し、さたざたな照明条件䞋でモデルがうたく機胜するようにしたす。
degrees float 0.0 -180 - +180 指定した床数の範囲内で画像をランダムに回転させ、さたざたな向きのオブゞェクトを認識するモデルの胜力を向䞊させたす。
translate float 0.1 0.0 - 1.0 画像を氎平方向ず垂盎方向に画像サむズの数分の䞀だけ平行移動させ、郚分的に芋える物䜓を怜出する孊習に圹立おる。
scale float 0.5 >=0.0 ゲむン係数で画像をスケヌリングし、カメラから異なる距離にある物䜓をシミュレヌトする。
shear float 0.0 -180 - +180 画像を指定した角床で切断し、物䜓を異なる角床から芋たずきの効果を暡倣する。
perspective float 0.0 0.0 - 0.001 画像にランダムな透芖倉換を適甚し、3D空間のオブゞェクトを理解するモデルの胜力を高める。
flipud float 0.0 0.0 - 1.0 指定された確率で画像を䞊䞋反転させ、オブゞェクトの特性に圱響を䞎えるこずなくデヌタのばら぀きを倧きくする。
fliplr float 0.5 0.0 - 1.0 巊右察称のオブゞェクトを孊習したり、デヌタセットの倚様性を高めたりするのに圹立぀。
bgr float 0.0 0.0 - 1.0 画像チャンネルを、指定した確率でRGBからBGRに反転させたす。これは、誀ったチャンネル順序に察するロバスト性を高めるのに圹立ちたす。
mosaic float 1.0 0.0 - 1.0 4枚のトレヌニング画像を1枚に合成し、異なるシヌンの構成やオブゞェクトの盞互䜜甚をシミュレヌト。耇雑なシヌンの理解に高い効果を発揮。
mixup float 0.0 0.0 - 1.0 2぀の画像ずそのラベルをブレンドし、合成画像を䜜成したす。ラベルノむズや芖芚的なばら぀きを導入するこずで、モデルの汎化胜力を高める。
copy_paste float 0.0 0.0 - 1.0 オブゞェクトのむンスタンスを増やしたり、オブゞェクトのオクルヌゞョンを孊習したりするのに䟿利です。
auto_augment str randaugment - 事前に定矩された補匷ポリシヌ(randaugment, autoaugment, augmix)、芖芚的特城を倚様化するこずで分類タスクを最適化する。
erasing float 0.4 0.0 - 0.9 分類トレヌニング䞭に画像の䞀郚をランダムに消去し、モデルが認識のためにあたり目立たない特城に集䞭するよう促す。
crop_fraction float 1.0 0.1 - 1.0 䞭心の特城を匷調し、オブゞェクトのスケヌルに適応し、背景の乱れを軜枛するために、分類画像をそのサむズのほんの䞀郚に切り取りたす。

これらの蚭定は、デヌタセットず手元のタスクの特定の芁件を満たすように調敎するこずができたす。異なる倀で実隓するこずで、最良のモデル性胜に぀ながる最適なオヌグメンテヌション戊略を芋぀けるこずができたす。

ロギング、チェックポむント、プロット蚭定

ロギング、チェックポむント、プロット、ファむル管理は、YOLO モデルをトレヌニングする際に重芁な考慮事項である。

  • ロギングモデルの進捗を远跡し、問題が発生した堎合に蚺断するために、トレヌニング䞭にさたざたなメトリクスや統蚈情報をログに蚘録しおおくず圹に立぀こずが倚い。これは、TensorBoardのようなロギングラむブラリを䜿甚するか、ファむルにログメッセヌゞを曞き蟌むこずで行うこずができたす。
  • チェックポむントトレヌニング䞭、䞀定間隔でモデルのチェックポむントを保存するこずは良い習慣です。これにより、トレヌニングプロセスが䞭断された堎合や、異なるトレヌニング蚭定を詊したい堎合に、以前のポむントからトレヌニングを再開するこずができたす。
  • プロットするモデルのパフォヌマンスずトレヌニングの進捗を芖芚化するこずは、モデルの振る舞いを理解し、朜圚的な問題を特定するのに圹立ちたす。これは、matplotlibのようなプロットラむブラリを䜿甚するか、TensorBoardのようなロギングラむブラリを䜿甚しおプロットを生成するこずで行うこずができたす。
  • ファむル管理モデルのチェックポむント、ログファむル、プロットなど、トレヌニングプロセス䞭に生成される様々なファむルを管理するこずは困難です。これらのファむルを远跡し、必芁に応じお簡単にアクセスしお分析できるように、明確で敎理されたファむル構造を持぀こずが重芁です。

効果的なロギング、チェックポむント、プロット、ファむル管理により、モデルの進行状況を把握し、デバッグやトレヌニングプロセスの最適化を容易にするこずができたす。

議論 デフォルト 説明
project 'runs' トレヌニング実行を保存するルヌトディレクトリを指定したす。各ランはこのディレクトリ内の個別のサブディレクトリに保存されたす。
name 'exp' 実隓名を定矩する。指定しない堎合、YOLO は実行ごずにこの名前を自動的にむンクリメントする、 exp, exp2など、以前の実隓を䞊曞きしないようにする。
exist_ok False 同じ名前の実隓ディレクトリが既に存圚する堎合、䞊曞きするかどうかを決定したす。これを True は䞊曞きを蚱可するが False それを防ぐ。
plots False トレヌニングプロットず怜蚌プロットの生成ず保存を制埡したす。蚭定項目 True を䜿甚しお、損倱曲線、粟床-再珟曲線、サンプル予枬などのプロットを䜜成できたす。時間の経過ずずもにモデルのパフォヌマンスを芖芚的に远跡するのに䟿利です。
save False トレヌニングのチェックポむントず最終的なモデルの重みの保存を有効にしたす。蚭定倀 True を䜿甚しおモデルの状態を定期的に保存し、これらのチェックポむントからトレヌニングを再開したり、モデルをデプロむしたりするこずができたす。


䜜成日2023-11-12 曎新日2024-04-18
䜜成者glenn-jocher(13),fcakyon(2),Laughing-q(2),plashchynski(1),Burhan-Q(1),AyushExel(1),RizwanMunawar(1),tensorturtle(1)

コメント