YOLO .YOLOv5:リアルタイム物体検出の深層分析
コンピュータビジョンの進化は、リアルタイム物体検出における継続的な革新によって特徴づけられてきた。今日、開発者や研究者はビジョンパイプラインを設計する際に無数のアーキテクチャ選択肢に直面している。この包括的な技術比較では、YOLOと Ultralytics YOLOv5の微妙な差異を明らかにし、それぞれのアーキテクチャ、トレーニング手法、性能指標、および理想的な導入シナリオを重点的に解説します。
YOLO入門
アリババグループが発表したYOLO 、検出速度と精度の限界を押し広げることを目的とした複数の新規技術をYOLO 。
- 著者: Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang、Xiuyu Sun
- 組織:Alibaba Group
- 日付: 2022年11月23日
- Arxiv:2211.15444v2
- GitHub:tinyvision/DAMO-YOLO
- ドキュメント:README.md
アーキテクチャの革新
YOLO ニューラルアーキテクチャ検索(NAS)を基盤としてYOLO 。著者らはMAE-NASを活用し、遅延と精度のバランスを取るバックボーンを自動設計した。 本モデルは効率的なRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)を導入し、異なるスケール間での特徴融合を改善する。YOLO 「ZeroHead」設計YOLO 、複雑な多枝予測ヘッドを排除。推論時に再パラメータ化を多用する、より簡素で効率的な構造を実現している。
トレーニングを改善するため、本モデルはラベル割り当てにAlignedOTAを採用し、大規模な「教師」モデルが小規模な「生徒」モデルを導くことで精度向上を図る重度の蒸留強化プロセスを採用している。
Ultralytics YOLOv5YOLOv5
Ultralytics YOLOv5 世界で最も広く採用されているビジョンアーキテクチャYOLOv5 、その安定性、使いやすさ、そして広範なデプロイメントエコシステムで知られています。
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020年6月26日
- GitHub:ultralytics/yolov5
- ドキュメント:YOLOv5 ドキュメント
エコシステム基準
YOLOv5 使いやすさの業界標準をYOLOv5 。 PyTorchにネイティブ実装され、高度に最適化されたCSPNetバックボーンとPANetネックを活用して堅牢な特徴量集約を実現します。後続モデルに見られるアンカーフリーの潮流に先駆ける存在でありながら、自動アンカー学習と組み合わせた高度に洗練されたアンカーベースのアプローチにより、優れた性能を即座に発揮します。
YOLOv5 真の強みは、そのよく整備されたエコシステム YOLOv5 。 Comet や Weights & Biasesなどのトラッキングツールとシームレスに連携し、 ONNX、 TensorRT、 CoreML。
YOLOv5入門
YOLOv5 カスタムデータセットでのトレーニングが驚くほどYOLOv5 。合理化されたAPIがプロトタイプから本番環境への移行障壁を低減し、アジャイルエンジニアリングチームの間で高い人気を博しています。
パフォーマンスとメトリクスの比較
これらのモデルを比較する際には、平均精度(mAP)、推論速度、パラメータ数のバランスを検討することが極めて重要である。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
トレードオフの分析
YOLO 、そのパラメータサイズに対してmAP YOLO 、その蒸留トレーニング段階から大きく恩恵を受けている。しかし、これはトレーニング効率を犠牲にして実現されている。多段階の蒸留プロセスでは、まず重い教師モデルをトレーニングする必要があり、これにより必要なGPU 時間とVRAMが大幅に増加する。
逆に、 YOLOv5 は優れたメモリ要件を提供します。Ultralytics YOLO 、複雑な蒸留パイプラインや RT-DETRといったトランスフォーマーベースのモデルと比較して、トレーニング時と推論時の両方で低いメモリ使用量で知られています。これにより、YOLOv5 コンシューマー向けハードウェアやGoogle アクセスしやすいクラウド環境で効率的にYOLOv5 。
実世界での応用と汎用性
適切なアーキテクチャの選択は、多くの場合、デプロイ環境によって決まります。
DAMO-YOLOが優れている点
YOLO 純粋な物体検出モデルYOLO 。学術研究、特にニューラルアーキテクチャ探索を研究するチームや、論文で詳述されたrepパラメータ化技術の再現を目指すチームにとって優れた選択肢となる。ディスティレーション訓練フェーズを実行するための豊富な計算リソースを有し、2Dバウンディングボックスの精度を限界まで引き出すことに専念するプロジェクトにおいては、YOLO 有力な候補YOLO 。
Ultralyticsの利点
実運用においては、Ultralytics 使いやすさと 汎用性 が高く評価され、最適な選択肢となっています。YOLOv5 物体検出や画像分類の定番YOLOv5 一方、Ultralytics 広範なUltralytics により、開発者はタスク間を容易に切り替えられます。
例えば、Ultralytics 最新バージョンでは、インスタンスセグメンテーション、姿勢推定、オリエンテッドバウンディングボックス(OBB)検出がネイティブにサポートされています。このマルチタスク機能により、チームは単一の統一されたPython を使用して、自動ナンバープレート認識と車両セグメンテーションの組み合わせなど、複雑なパイプラインを構築できます。
ユースケースと推奨事項
YOLOv5 、具体的なプロジェクト要件、デプロイメント上の制約、およびエコシステムの選好YOLOv5 。
DAMO-YOLOを選択するタイミング
YOLO 以下に最適YOLO :
- 高スループット動画解析:固定NVIDIA GPU 上で高FPS動画ストリームを処理し、バッチ1スループットを主要指標とする。
- 産業用製造ライン:専用ハードウェア上でGPU 厳しい制約があるシナリオ。例:組立ラインにおけるリアルタイム品質検査。
- ニューラルアーキテクチャ探索研究:自動化されたアーキテクチャ探索(MAE-NAS)と効率的な再パラメータ化バックボーンが検出性能に及ぼす影響の検討。
YOLOv5を選択すべき時
YOLOv5 以下に推奨YOLOv5 :
- 実績ある生産システム: YOLOv5 track 、豊富なドキュメント、大規模なコミュニティサポートが評価される既存の展開環境。
- リソース制約下でのトレーニング: GPU 限られた環境において、YOLOv5効率的なトレーニングパイプラインと低いメモリ要件が有利に働く。
- 幅広いエクスポート形式のサポート:複数の形式での展開を必要とするプロジェクトに対応 ONNX、 TensorRT、 CoreML、および TFLite。
Ultralytics YOLO26)を選択すべきタイミング
ほとんどの新規プロジェクトにおいて、Ultralytics パフォーマンスと開発者体験の最適な組み合わせを提供します:
- NMSデプロイメント:ノンマキシマムサプレッション(NMS)後処理の複雑さを伴わずに、一貫した低遅延推論を必要とするアプリケーション。
- CPU: GPU を持たないデバイスにおいて、YOLO26のCPU 決定的な優位性を提供する。
- 小型物体検出: ドローン航空写真やIoTセンサー解析といった困難なシナリオにおいて、ProgLossとSTALが微小物体の精度を大幅に向上させる。
未来:YOLO26への移行
YOLOv5 、YOLO 興味深い学術的知見YOLO 、最先端技術は進化を続けている。2026年1月にUltralytics 、ビジョンコミュニティにとって飛躍的な進歩を象徴する。
YOLO26は、エッジデプロイメントとトレーニングの不安定性という従来のボトルネックに対処します:
- エンドツーエンドNMS設計:YOLO26は非最大抑制(NMS)後処理をネイティブに排除します。この画期的な技術により、展開ロジックが簡素化され、レイテンシ変動が大幅に低減されるため、高速ロボティクスや自律システムに最適です。
- MuSGDオプティマイザー:LLMトレーニングの革新(Moonshot AIのKimi K2など)に着想を得たYOLO26は、MuSGDオプティマイザー(SGD ミューオンのハイブリッド)を採用しています。これにより、極めて安定したトレーニング実行と著しく高速な収束が保証されます。
- 最大43%高速CPU :分布焦点損失(DFL)を戦略的に除去することで、YOLO26はCPUやエッジデバイスにおいて、YOLO4などの従来モデルと比較して圧倒的に優れた速度を実現します。 YOLO11 や YOLOv8。
- ProgLoss + STAL:これらの高度な損失関数は、小型物体認識において顕著な改善をもたらす。これは、ドローン航空画像やIoTセンサーフィードの分析において極めて重要である。
コード例: 実践におけるシンプルさ
Ultralytics 、わずか数行のコードでモデルのトレーニングとデプロイが可能です。YOLOv5 する場合でもYOLOv5 推奨されるYOLO26にアップグレードYOLOv5 、インターフェースは一貫して直感的です。
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Export the model for edge deployment
model.export(format="onnx")
結論
YOLOv5 YOLO コンピュータビジョンの分野に大きくYOLOv5 。YOLO ニューラルアーキテクチャ探索とディスティレーションのYOLO 、研究者にとって興味深い研究対象となっている。しかし、 YOLOv5 は、パフォーマンスバランス、低メモリ要件、比類のない使いやすさにより、実用的な強力な選択肢であり続けています。
新規プロジェクトを開始する開発者には、Ultralytics を活用しYOLOv6を採用することを推奨します。これはYOLOv5 親しみやすいエコシステムYOLOv5 画期的なアーキテクチャ改良YOLOv5 融合し、クラウドとエッジAIアプリケーション双方において最高水準の精度と超高速推論を実現します。開発者は以下の効率的なモデルも検討すると良いでしょう YOLOv6やYOLOXなどの他の効率的なモデルを検討することも可能です。