コンテンツにスキップ

YOLOv8 .YOLOv6.0:リアルタイム物体検出の深層分析

コンピュータビジョンの分野は、急速な反復と競争によって特徴づけられる。この進化における二つの重要なマイルストーンは Ultralytics YOLOv8です。前者は2023年初頭にリリースされた汎用性の高い高性能モデル、YOLOv6による高スループット検出器です。両モデルともリアルタイム物体検出の問題解決を目指していますが、アーキテクチャ、使いやすさ、導入方法に関して異なる哲学でアプローチしています。

この比較では、これらのアーキテクチャの技術的な違いを探り、自律走行車から産業用検査まで、様々なアプリケーションに適したツールを選択する開発者を支援します。

パフォーマンス指標

モデルを生産用に選択する際、推論速度と平均精度(mAP)のトレードオフが決定要因となることが多い。以下の表は、物体検出の標準ベンチマークCOCO 両モデルの性能を比較したものである。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv6.0はGPU ハードウェア上で競争力のある性能を示す一方、 Ultralytics YOLOv8 は卓越した汎用性を示し、あらゆるスケールで高い精度を維持しながら、優れた使いやすさと幅広いハードウェア互換性を提供します。

Ultralytics YOLOv8: 多彩な標準

リリース元 Ultralytics 2023年1月にUltralyticsによってYOLOv8 、その前身モデルから大きなアーキテクチャの転換をYOLOv8 。単なる検出モデルとしてではなく、複数のビジョンタスクを同時に処理できる統合フレームワークとして設計された。

アーキテクチャのハイライト

YOLOv8 アンカーボックス不要の検出YOLOv8 。これにより、データセットの分布に基づいて手動でアンカーボックスを設定する必要がなくなり、学習プロセスが簡素化された。このため、カスタムデータセットへの汎化においてモデルの頑健性が向上する。

このアーキテクチャは、YOLOv5に採用されているC3モジュールに代わるC2fモジュール(クロスステージ部分ボトルネック、2つの畳み込みを含む)を特徴としています。C2fモジュールは勾配の流れを改善し、計算コストを大幅に増加させることなく、より豊かな特徴表現を学習することを可能にします。さらに、YOLOv8 オブジェクト検出、分類、回帰タスクを分離するデカップリングヘッド構造 YOLOv8 、これにより収束速度と精度の向上が実証されています。

エコシステムとユーザビリティ

YOLOv8 決定的な強みのひとつはYOLOv8 Ultralytics へのYOLOv8 。ユーザーはPython を使用してモデルのトレーニング、検証、デプロイが可能で、ハイパーパラメータチューニングと実験追跡が組み込みでサポートされています。

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=50)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

YOLOv8について詳しくはこちら

YOLOv6.0: 産業用スループット

美団ビジョンAI部門が開発したYOLOv6.YOLOv6、「産業用次世代物体検出器」と位置付けられている。NVIDIA などのハードウェアアクセラレータにおけるスループットの最大化に重点を置いている。

  • 著者: Chuyi Li、Lulu Li、Yifei Geng、他。
  • 組織: Meituan
  • 日付: 2023-01-13
  • Arxiv:2301.05586

建築の焦点

YOLOv6、特徴融合を改善するため、ネック部分に双方向連結(BiC)モジュールを採用している。また、アンカー補助学習(AAT)戦略を利用しており、学習フェーズではアンカーベースとアンカーフリーの両パラダイムの利点を組み合わせようとするが、推論フェーズではアンカーフリーのままである。

バックボーンはEfficientRepに基づいており、GPU ハードウェアフレンドリーに設計されています。この最適化により、YOLOv6 オフライン動画解析など、サーバーでのバッチ処理が可能なシナリオでYOLOv6 効果を発揮します。ただし、この特化設計は、汎用コンピューティング向けに最適化されたモデルと比較して、CPUのエッジデバイスではレイテンシが高くなる場合があります。

YOLOv6について詳しくはこちら

詳細な比較

1. 学習効率とメモリ

Ultralytics トレーニング効率を重視して設計されています。YOLOv8 、トランスフォーマーベースの代替モデルや旧式アーキテクチャと比較して、YOLOv8 CUDA 動作します。この効率性により、開発者はコンシューマー向けGPU(NVIDIA 3060や4090など)上で、より大規模なモデルのトレーニングや、より大きなバッチサイズの使用が可能となります。

一方、YOLOv6.YOLOv6トレーニングパイプラインは効果的ではあるものの、安定性を得るにはより厳密なハイパーパラメータ調整を必要とすることが多い。特定の初期化戦略への依存性により、新規ユーザーがカスタムデータセットに適応する際、広範な実験なしでは困難を伴う場合がある。

Ultralytics 統合

Ultralytics シームレスに統合されます Ultralytics (旧称HUB)とシームレスに連携します。このウェブベースのツールでは、データセットの可視化、トレーニングのリアルタイム監視、ワンクリックでのAndroid・エッジデバイスへのモデルデプロイが可能であり、従来のリポジトリと比較して機械学習ライフサイクルを大幅に効率化します。

2. タスクの汎用性

重要な差別化要因は、ネイティブでサポートされるタスクの範囲である。

  • YOLOv8 マルチタスクフレームワークです。以下の機能をサポートします:
  • YOLOv6.YOLOv6主に標準的な物体検出向けに設計されています。他のタスク向けの実験的リリースも存在しますが、それらのエコシステムサポートやドキュメントはYOLOv8向けに提供されているものほど包括的ではありません。

3. 展開と輸出

両モデルとも ONNX および TensorRTへのエクスポートをサポートしています。ただし、Ultralytics パイプラインは特に堅牢で、演算子サポートや動的軸といった複雑な処理を自動的に処理します。

例えば、YOLOv8 をモバイルデプロイメント向けにTensorFlow へエクスポートすることはネイティブ機能です:

# Export YOLOv8 to TFLite format for Android/iOS
yolo export model=yolov8n.pt format=tflite

この使いやすさは OpenVINO および CoreMLにも適用され、YOLOv8 クロスプラットフォーム展開における優れた選択肢としています。

将来を見据えた設計:YOLO26の必要性

YOLOv8 YOLOv6.YOLOv6依然として強力なツールですが、AI分野は急速に進化しています。今日新たなプロジェクトを始める開発者にとって、 Ultralytics は効率性と性能の頂点を体現しています。

2026年1月にリリースされたYOLO26は、YOLOv8 継承しつつYOLOv8 画期的な変更を導入しています:

  • エンドツーエンドNMS: 非最大抑制(NMS)の必要性を排除することで、YOLO26は推論遅延を低減し、デプロイメントパイプラインを簡素化します。
  • MuSGDオプティマイザ:LLMトレーニングに着想を得たこのオプティマイザは、トレーニング中の収束速度向上と安定性向上を実現します。
  • エッジ最適化: ディストリビューション・フォーカル・ロス(DFL)を除去したYOLO26は、CPU上で最大43%高速な推論を実現し、従来の高精度モデルの主要な制約を解消した。
  • 強化損失関数: ProgLossとSTALの統合により、小型物体の検出精度が大幅に向上し、ドローン画像やIoTセンサーにとって極めて重要な要件を満たす。

YOLO26についてさらに詳しく

結論

YOLOv6.YOLOv6、特にハードウェアが固定された標準的な検出タスクにおいて、産業環境におけるGPU 印象的なベンチマークとして機能しました。しかし、大多数の開発者や研究者にとって、 Ultralytics YOLOv8 はよりバランスの取れた、汎用性が高く、ユーザーフレンドリーな体験を提供します。セグメンテーション、姿勢推定、OBBへの対応に加え、堅牢なUltralytics との組み合わせにより、長期的な投資としてより安全な選択肢となります。

最先端を求める方には、v8の汎用性と次世代アーキテクチャの効率性を兼ね備えたYOLO26への移行をお勧めします。

参考資料

Ultralytics の他のモデルを探索してください:

  • YOLO11:YOLO26の強固な前身。
  • YOLOv9:プログラマブル勾配情報(PGI)で知られる。
  • YOLOv10: NMSアプローチの先駆者。

コメント