Link to this sectionYOLOv8 vs YOLOv6-3.0#

リアルタイムコンピュータビジョンの領域は、より高速で、より正確で、より汎用性の高いモデルへの需要によって絶えず進化しています。2023年初頭に登場した最も著名な2つのアーキテクチャは、Ultralytics YOLOv8とMeituanのYOLOv6-3.0です。どちらのモデルも最先端のパフォーマンスを押し広げていますが、開発哲学や展開シナリオがそれぞれ少しずつ異なります。

この包括的なガイドでは、両者のアーキテクチャ、パフォーマンスメトリクス、理想的なユースケースを詳細に分析し、機械学習エンジニアや研究者が次の物体検出プロジェクトに適したツールを選択できるよう支援します。

Link to this sectionモデルの系譜と詳細#

技術的な詳細に入る前に、両モデルの起源と主要な仕様を理解することが重要です。どちらのリポジトリも人気のあるPyTorchフレームワークを大いに活用していますが、エコシステムの統合方法は大きく異なります。

Link to this sectionYOLOv8の詳細#

Ultralytics YOLOv8アーキテクチャは、卓越した開発者エクスペリエンスと汎用性を実現するためにゼロから設計された、統一されたマルチタスクフレームワークです。これは長年の研究と、これまでの反復からのコミュニティからのフィードバックに基づいています。

著者：Glenn Jocher、Ayush Chaurasia、Jing Qiu
組織：Ultralytics
日付：2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント：https://docs.ultralytics.com/models/yolov8/

YOLOv8の詳細はこちら

Link to this sectionYOLOv6-3.0の詳細#

元々Meituanの産業用アプリケーション向けに導入されたYOLOv6は、バージョン3.0で大規模な「Full-Scale Reloading」アップデートを受けました。主に自己蒸留やRepOptimizerなどの手法を利用し、高度に最適化されたデプロイ環境をターゲットにしています。

著者：Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、およびXiangxiang Chu
組織: Meituan
日付：2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
ドキュメント: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0の詳細はこちら

合理化された管理

Ultralytics Platformを使用することで、データセットの管理、トレーニングセッション、モデルのデプロイが大幅に簡素化されます。MLOpsワークフローで通常必要とされるボイラープレートコードを最小限に抑える、エンドツーエンドのインターフェースを提供します。

Link to this sectionアーキテクチャとトレーニング手法#

Link to this sectionUltralytics YOLOv8アーキテクチャ#

YOLOv8は、高度に洗練されたアンカーフリーの検出ヘッドを導入しました。事前定義されたアンカーボックスを削除することで、モデルは多様なデータセットに対してより適切に汎用化され、後処理のヒューリスティックな処理が減少します。さらに、YOLOv8は比類のないパフォーマンスバランスを提供し、クラウドサーバーからリソースが制限されたエッジデバイスまで、多様な現実世界のデプロイシナリオに適した、速度と精度の良好なトレードオフを一貫して達成します。

YOLOv8の大きな利点は、そのメモリ要件です。トレーニング中、UltralyticsモデルはRT-DETRのような重量級のTransformerベースの代替手段と比較して、CUDAメモリの使用量が大幅に少なくなります。これにより、開発者は標準的なコンシューマーGPUでより大きなバッチサイズを使用でき、優れたトレーニング効率が得られます。

Link to this sectionYOLOv6-3.0アーキテクチャ#

YOLOv6-3.0は、双方向連結(BiC)モジュールとアンカー支援トレーニング(AAT)戦略を採用しています。より小さなモデル(NおよびS)にはEfficientRepバックボーンを使用し、より大きなモデル(MおよびL)にはCSPStackRepバックボーンに移行します。このアーキテクチャはNVIDIA TensorRT実行に対して高度に最適化されており、互換性のあるハードウェアにデプロイすると非常に高速に動作します。しかし、この特定のハードウェア最適化との密な結合は、Ultralytics固有の柔軟なONNXエクスポートワークフローと比較すると、クロスプラットフォームデプロイが少し硬直的になる場合があります。

Link to this sectionパフォーマンスの比較#

COCO検証データセットでモデルを評価する場合、両モデルとも驚くべきパフォーマンスを示します。以下の表は主要なメトリクスを強調しています。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv6-3.0は特定のTensorRTベンチマークでわずかに速度の利点がありますが、YOLOv8はより小さなカテゴリでパラメータ効率の高い設計を提供しており、モバイルや組み込みCPUを含む多様なハードウェア全体でより優れた柔軟性を発揮します。

Link to this sectionエコシステムと汎用性#

これら2つのモデルの最も顕著な対比は、そのエコシステムのサポートにあります。

YOLOv6は主にバウンディングボックス検出エンジンです。対照的に、YOLOv8はその汎用性で賞賛されています。単一の統一されたフレームワーク内で、YOLOv8はインスタンスセグメンテーション、画像分類、姿勢推定、および回転バウンディングボックス(OBB)検出をネイティブにサポートしています。

さらに、Ultralyticsエコシステムの使いやすさは比類のないものです。シンプルなPython APIを使用して、研究者は複雑なボイラープレートコードを書くことなく、トレーニングを開始し、結果を検証し、モデルを多数のフォーマットにエクスポートできます。十分に整備されたエコシステムは、アクティブな開発、頻繁なアップデート、および一般的な実験追跡ツールとのシームレスな統合を保証します。

Link to this sectionコード例: YOLOv8のトレーニング#

YOLOv8モデルのトレーニングは最小限のセットアップで済み、フレームワークのアクセシブルな設計を強調しています：

from ultralytics import YOLO

# Load a pretrained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model on the COCO8 dataset
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Utilize GPU for efficient training
    batch=32,
)

# Easily export to ONNX for cross-platform deployment
model.export(format="onnx")

Link to this sectionユースケースと推奨事項#

YOLOv8とYOLOv6のどちらを選択するかは、プロジェクト固有の要件、デプロイの制約、およびエコシステムの好みによって異なります。

Link to this sectionYOLOv8を選択すべき場合#

YOLOv8は、以下のようなケースに適した強力な選択肢です。

汎用的なマルチタスクデプロイメント: Ultralytics エコシステム内で検出、セグメンテーション、分類、姿勢推定のために実績のあるモデルを必要とするプロジェクト。
確立された運用システム: 既にYOLOv8アーキテクチャ上で構築され、安定してテストされたデプロイメントパイプラインを持つ既存の運用環境。
広範なコミュニティとエコシステムのサポート: YOLOv8の広範なチュートリアル、サードパーティ統合、アクティブなコミュニティリソースを活用できるアプリケーション。

Link to this sectionYOLOv6を選択すべき時#

YOLOv6が推奨されるケース:

産業用ハードウェア対応の展開： モデルのハードウェア認識設計と効率的な再パラメータ化が、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
高速なシングルステージ検出： 管理された環境でのリアルタイムビデオ処理において、GPU上の生の推論速度を優先するアプリケーション。
Meituanエコシステムの統合： すでにMeituanの技術スタックと展開インフラ内で作業しているチーム。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

NMSフリーのエッジ展開： Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
CPUのみの環境： GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
小さな物体の検出： aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section今後の展望: YOLO26へのアップグレード#

YOLOv8とYOLOv6-3.0は素晴らしい選択肢ですが、新しいプロジェクトを開始する開発者は、次世代のUltralytics YOLO26モデルを検討することを強くお勧めします。2026年1月にリリースされたYOLO26は、エッジファーストのビジョンAIの標準を再定義します。

YOLO26はエンドツーエンドのNMSフリー設計を導入しており、後処理中の非最大値抑制(NMS)の必要性を完全に排除しています。このネイティブでエンドツーエンドのアプローチは、特にエッジ環境において、より高速でシンプルなデプロイロジックを保証します。DFL除去(Distribution Focal Loss)と相まって、モデルヘッドは大幅に軽量化されており、CPU推論が最大43%高速化されています。

トレーニングの安定性と収束速度も、LLMトレーニング手法から着想を得たSGDとMuonのハイブリッドであるMuSGDオプティマイザーのおかげで大幅にアップグレードされました。さらに、ProgLoss + STALの導入により、ドローンの画像や高密度な産業検査に不可欠な小物体認識が大幅に向上しています。

YOLO26の詳細はこちら

検討すべきその他のモデル

特定の制約に応じて、高度にバランスの取れたレガシーワークフロー向けにYOLO11を検討したり、大規模な再トレーニングを必要としないゼロショットのオープンボキャブラリー検出タスク向けにYOLO-Worldを検討することもできます。

Link to this section結論#

YOLOv8とYOLOv6-3.0のどちらを選択するかは、最終的にはデプロイパイプラインの優先順位に依存します。YOLOv6-3.0は、生のGPU速度が絶対的に優先される厳格なTensorRT環境に適した非常に優れたモデルです。しかし、大多数のチームにとって、Ultralytics YOLOv8モデルがより優れた選択肢となります。より低いトレーニングメモリ要件、マルチタスクの汎用性、そしてUltralytics Platformによって提供される業界をリードするエコシステムの組み合わせにより、市場投入までの時間が大幅に短縮されます。

現代の効率性の究極を求める開発者にとって、YOLO26へのシームレスな移行は、あらゆるコンピュータビジョンアプリケーションを将来にわたって保証する、比類のないNMSフリーのエクスペリエンスを提供します。

貢献者

GLglenn-jocher¹²

作成日 2025年1月27日更新日 3 週間前