Ultralytics YOLOv8 YOLO11:アーキテクチャの進化と性能分析
物体検出アーキテクチャの進化は急速であり、各イテレーションで精度、速度、使いやすさが大幅に向上している。 Ultralytics YOLOv8は2023年初頭にリリースされ、コンピュータビジョンにおける汎用性と使いやすさの新たな基準を確立しました。2024年末には Ultralytics YOLO11 が登場し、より広範なタスクにおいてさらなる効率性と性能を実現するため、アーキテクチャを洗練させました。
この包括的なガイドでは、これら2つの強力なモデルを比較し、アーキテクチャ上の差異、性能指標、および理想的なユースケースを分析することで、次回のコンピュータビジョンプロジェクトに最適なツールを選択するお手伝いをします。
モデル概要
技術仕様の詳細に入る前に、各モデル開発の背景にある文脈と目的を理解することが不可欠です。両モデルとも、Ultralytics掲げる「最先端のビジョンAIを誰もが利用可能にする」という理念の結晶です。
Ultralytics YOLOv8
2023年1月にリリースされたYOLOv8 、検出、セグメンテーション、分類、姿勢推定、OBBといった複数のタスクを単一のユーザーフレンドリーなAPIで統合するという大きなマイルストーンYOLOv8 。新たなバックボーンとアンカーフリー検出ヘッドを導入したことで、多様なアプリケーションに対応する高い汎用性を実現しています。
主な詳細:
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023年1月10日
- ドキュメント:YOLOv8 ドキュメント
- GitHub:Ultralytics リポジトリ
Ultralytics YOLO11
2024年9月にリリースされたYOLO11 、YOLOv8堅固な基盤をYOLO11 。特徴抽出効率と処理速度の向上を目的としたアーキテクチャの改良に重点を置いており、より少ないパラメータで高い精度を実現するようYOLO11 これにより、リアルタイムのエッジアプリケーションにおいて特に効果を発揮します。
主な詳細:
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024年9月27日
- ドキュメント:YOLO11ドキュメント
- GitHub:Ultralytics リポジトリ
最新のイノベーション: YOLO26
YOLO11 YOLOv8大幅な進化YOLO11 、開発者が究極の先端技術を求めるなら YOLO26を検討すべきである。2026年にリリースされた本モデルは、NMSのエンドツーエンド設計、MuSGDオプティマイザ、最大43%高速CPU を導入し、実運用レベルのAIにおける新たなベンチマークを確立した。
アーキテクチャの違い
YOLOv8 からYOLO11 YOLOv8 移行には、計算コストと精度のトレードオフを最適化することを目的とした、いくつかの重要なアーキテクチャの変更YOLO11 。
バックボーンと特徴抽出
YOLOv8 、C2fモジュールを備えた改良版CSPDarknet53バックYOLOv8 。これは前世代のC3モジュールに取って代わったものである。この設計により勾配の流れと特徴の豊かさが向上した。
YOLO11 、バックボーン内のボトルネック構造と注意機構を洗練させることで、これをさらにYOLO11 。これらの変更により、モデルは計算オーバーヘッドを低減しながら、より複雑なパターンと空間的階層を捕捉できるようになります。これは、航空画像における小物体検出や製造品質管理といった困難なタスクにおいて特に有益です。
ヘッドアーキテクチャ
両モデルともアンカーフリーヘッドを採用しており、これにより学習プロセスが簡素化され、異なる物体形状に対する汎化性能が向上する。ただし、YOLO11 ネック部とヘッド部により高度な特徴融合技術をYOLO11 、YOLOv8位置特定精度とクラス分離性能が向上している。
パフォーマンス分析
モデルを生産用に選択する際には、平均精度(mAP)、推論速度、モデルサイズなどの指標が重要である。以下の表は、COCO 事前学習済み重みの詳細な比較を示している。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
主要なパフォーマンスのポイント
- 効率性: YOLO11 、YOLOv8 一貫して軽量(パラメータ数が少ない)かつ高速(レイテンシが低い)でありながら、より高い精度を達成します。例えば、CPU n CPU ONNX YOLOv8n 約22%高速 YOLOv8n より高いmAP誇ります。
- 演算性能: YOLO11 の削減されたFLOPsは、携帯電話や組み込みIoTセンサーなど、バッテリー駆動またはリソース制約のあるデバイスに最適な選択肢YOLO11 。
- 精度: YOLO11 mAP 、特に小型モデル(NanoおよびSmall)における改善は、重いハードウェアを必要とせずに高い信頼性を要求するアプリケーションにとって顕著である。
トレーニングと使いやすさ
Ultralytics 決定的な強みのひとつは、統一され簡素化されたユーザー体験である。YOLOv8 YOLO11 どちらも同じ直感的なAPIをYOLO11 、開発者はたった1行のコード変更でアーキテクチャを切り替えることができる。
Ultralyticsの利点
複雑なトランスフォーマーモデルは膨大なGPU 複雑な設定を必要とすることが多いが、Ultralytics 学習効率を最適化している。コンシューマー向けGPUでも効果的に学習でき、高性能AIへのアクセスを民主化する。
両モデルに共通する機能には以下が含まれます:
- Python :モデルを数分で読み込み、学習させ、デプロイできます。
- 堅牢なドキュメント: ハイパーパラメータ調整、データ拡張、デプロイに関する包括的なガイド。
- エコシステム統合:データセット管理、リモートトレーニング、ワンクリックモデルエクスポートを実現するUltralytics とのシームレスな互換性。
トレーニング例:
以下のコードは、YOLOv8 YOLO11 YOLOv8 トレーニングをいかに簡単に切り替えられるかを示しています。
from ultralytics import YOLO
# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Train YOLOv8
model_v8.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a YOLO11 model - Same API!
model_11 = YOLO("yolo11n.pt")
# Train YOLO11
model_11.train(data="coco8.yaml", epochs=100, imgsz=640)
理想的なユースケース
両モデルとも非常に高性能ですが、それぞれの強みにより異なる状況に適しています。
YOLOv8を選択すべき時
YOLOv8 、特に以下の用途において、堅牢で信頼性の高い選択肢YOLOv8 :
- レガシープロジェクト: YOLOv8 向けに最適化済みの既存パイプラインで、アーキテクチャの即時アップグレードを必要とせず安定性が求められるYOLOv8 。
- 広範なコミュニティリソース:市場での長い歴史により、YOLOv8 サードパーティによるチュートリアル、動画、コミュニティ実装の豊富なライブラリYOLOv8 。
- 汎用ビジョン:極端なエッジ最適化が主要な制約条件ではない標準的な物体検出タスクに最適です。
YOLO11を選択すべき時
YOLO11 、ほとんどの新規デプロイメント、特に以下の場合に推奨される選択肢YOLO11 :
- エッジコンピューティング:パラメータ数が少なく推論速度が速いため、ラズベリーパイ、Jetson Nano、モバイル展開に最適です。
- リアルタイムアプリケーション: 自律走行や高速製造ラインなど、遅延がミリ秒単位で重大な影響を及ぼすタスクにおいて不可欠である。
- 複雑なタスク:アーキテクチャの改良により、スポーツ分析における姿勢推定や医療画像におけるインスタンスセグメンテーションといった困難なシナリオでの性能が向上します。
タスクを横断する汎用性
YOLOv8 YOLO11 YOLOv8 単純な境界ボックス検出を超えた幅広いタスクYOLO11 。これにはインスタンスセグメンテーション、姿勢推定、オリエンテッドバウンディングボックス(OBB)、分類が含まれます。この汎用性により、開発者は単一のフレームワークを用いて多面的な問題を解決できます。
結論
YOLOv8 YOLO11 YOLOv8 、効率的なコンピュータビジョンの頂点をYOLO11 。 YOLOv8 は、世界中の無数のAIアプリケーションを支える、汎用性が高くユーザーフレンドリーな基準を確立しました。 YOLO11 はこの遺産をさらに洗練させ、エッジデバイスで実現可能な限界を押し広げる、合理化され、より高速で、より正確なアーキテクチャを提供します。
今日、新たなプロジェクトを始める開発者にとって、 YOLO11 は速度と精度の優れたバランスを提供します。ただし、エンドツーエンドのNMS検出や最適化された損失関数など、最新のイノベーションを絶対的に求める方には、新たにリリースされた YOLO26の検討を強く推奨します。これはリアルタイムビジョンAIの未来を体現するものです。
参考資料
その他の検討すべきモデル
- YOLO26:Ultralytics による最新鋭モデルUltralytics 2026年1月発表)、NMS設計を採用。
- RT-DETR: 速度がそれほど重要でないシナリオにおいて高精度を提供するトランスフォーマーベースの検出器。
- SAM : Metaのセグメント・エニシング・モデル。ゼロショットセグメンテーションタスクに最適。