YOLO11 vs YOLOv8:詳細な比較
特に物体検出のためにコンピュータビジョンモデルを選択する場合、異なるアーキテクチャの長所と短所を理解することが不可欠です。このページでは、Ultralytics YOLO11とUltralytics YOLOv8の間の詳細な技術比較を提供します。これらは、物体検出およびその他のビジョンタスク用に設計された2つの最先端モデルです。アーキテクチャのニュアンス、パフォーマンスベンチマーク、および適切なアプリケーションを分析して、次のAIプロジェクトで情報に基づいた意思決定を行うのに役立てます。
Ultralytics YOLO11
著者: Glenn Jocher、Jing Qiu
所属: Ultralytics
日付: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11は、YOLOシリーズにおける最新の進化を代表し、強化された精度と効率を実現するように設計されています。以前のYOLOモデルの堅牢な基盤を基に構築されたYOLO11は、卓越したリアルタイムパフォーマンスを維持しながら、検出精度を向上させることを目的としたアーキテクチャの改良を導入しています。これは、インスタンスセグメンテーション、画像分類、ポーズ推定、および傾斜バウンディングボックス(OBB)を含む、幅広いタスクをサポートする、非常に汎用性の高いモデルです。
アーキテクチャと主な機能
YOLO11は、特徴抽出と処理を最適化するために、ネットワーク構造の進歩を取り入れています。以下のパフォーマンステーブルに示すように、YOLOv8のような前モデルと比較して、より少ないパラメータとFLOPでより高い精度を達成します。この効率は、より高速な推論速度と削減された計算需要につながり、エッジデバイスから強力なクラウドインフラストラクチャまで、多様なプラットフォームへの展開に適しています。YOLO11の主な利点は、適切にメンテナンスされたUltralyticsエコシステムへのシームレスな統合であり、効率的なトレーニングプロセス、すぐに利用できる事前トレーニング済みの重み、および他の多くのモデルタイプと比較してより低いメモリ使用量を提供します。
長所
- 優れた精度: 最先端のmAPスコアを達成し、同様のモデルサイズでYOLOv8を一貫して上回っています。
- 高効率な推論: 特に CPU 上で、大幅に高速な処理速度を提供します。これは、リソースが限られた環境でのリアルタイムアプリケーションにとって重要です。
- マルチタスクの汎用性: 単一の統合フレームワークが複数のコンピュータビジョンタスクをサポートし、開発ワークフローを簡素化します。
- 最適化とスケーラビリティ: 効率的なメモリ使用量とより小さな計算フットプリントで、さまざまなハードウェアで優れたパフォーマンスを発揮します。
- 使いやすさ: 合理化されたUltralytics API、充実したドキュメント、およびGitHubとDiscordでの活発なコミュニティサポートの恩恵を受けられます。
弱点
- より新しいモデルとして、すでに確立されているYOLOv8と比較して、サードパーティの統合が最初は少ない可能性があります。
- 最大のモデル(例えば、YOLO11x)は、依然としてかなりの計算リソースを必要としますが、これは高精度な検出器に共通する特徴です。
ユースケース
YOLO11は、精度と効率のバランスが優れているため、以下のような、正確かつ高速な物体検出を必要とするアプリケーションに最適です。
- ロボティクス: 自律システムのために、動的な環境におけるナビゲーションと物体とのインタラクションを可能にします。
- セキュリティシステム: 侵入検知とリアルタイム監視のための高度なセキュリティシステムを強化します。
- 小売分析: 小売におけるAIのための在庫管理と顧客行動分析の改善。
- 産業オートメーション:製造における品質管理と欠陥検出をサポート。
Ultralytics YOLOv8
著者: Glenn Jocher, Ayush Chaurasia, and Jing Qiu
所属: Ultralytics
日付: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
ドキュメント: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8は、リリース時にリアルタイム物体検出の新たな標準を確立し、瞬く間に世界で最も人気のあるビジョンモデルの1つになりました。アンカーフリーの検出ヘッドやC2fバックボーンモジュールなど、主要なアーキテクチャの変更を導入し、以前のバージョンと比較して性能が大幅に向上しました。YOLO11と同様に、YOLOv8は汎用性の高いマルチタスクモデルであり、数え切れないほどの実際のアプリケーションで広範囲に検証されています。
アーキテクチャと主な機能
YOLOv8の設計は、速度と精度の強力なバランスに重点を置いています。アンカーフリーのアプローチにより、ボックス予測の数が減少し、後処理のパイプラインが簡素化され、推論速度が向上します。このモデルは高度にスケーラブルであり、モバイルおよびエッジAI向けの軽量な「n」(ナノ)バージョンから、最大の精度を実現する強力な「x」(特大)バージョンまで、さまざまなバリエーションがあります。YOLOv8はUltralyticsエコシステムに完全に統合されており、シンプルなAPI、包括的なガイド、およびノーコードのトレーニングとデプロイメントのためのUltralytics HUBなどのツールを利用できます。
長所
- 実績ある性能: 信頼性が高く、広く採用されているモデルであり、サポートされているすべてのタスクで優れた結果を提供します。
- 優れた速度と精度のトレードオフ: 幅広いアプリケーションで頼りになる選択肢となる、素晴らしいバランスを提供します。
- 成熟したエコシステム: リリース以来、広範なコミュニティサポート、チュートリアル、およびサードパーティの統合から恩恵を受けています。
- 多様性: YOLO11と同様に幅広い種類の画像処理タスクをサポートしており、強力なオールインワンソリューションとなっています。
弱点
- 依然としてトップパフォーマーですが、一般的に、すべてのモデルサイズにおいて、精度とCPU推論速度の両方でYOLO11に上回られています。
- より大きなモデルは、YOLO11の対応するものと比較して、パラメータとFLOPカウントが高く、計算要件がより高くなります。
ユースケース
YOLOv8は、広く導入・テストされてきたアプリケーションにおいて優れた性能を発揮し、依然として強力で非常に有用なモデルです。
- 農業:スマート農業における作物の監視、害虫の検出、および収量予測に利用されます。
- Healthcare: 細胞や異常の検出などのタスクのために、医療画像解析を支援します。
- 環境モニタリング:野生生物の追跡や環境変化の監視に活用されています。
- スマートシティ: 交通管理や公共安全監視などのアプリケーションを強化します。
性能の直接対決:YOLO11 vs. YOLOv8
YOLO11とYOLOv8の主な違いは、そのパフォーマンス指標にあります。YOLO11は、より効率的なアーキテクチャにより、一貫してより高い精度(mAP)を実現し、パラメータとFLOPsを削減します。このアーキテクチャの最適化は、CPU推論速度で特に顕著であり、YOLO11モデルはYOLOv8の同等モデルよりも大幅に高速です。YOLOv8nはGPUレイテンシでわずかに優位性がありますが、「s」から「x」までのYOLO11モデルもGPU上で高速であるため、YOLO11はほとんどの新規プロジェクトにとって優れた選択肢となります。
モデル | サイズ (ピクセル) |
mAPval 50-95 |
速度 CPU ONNX (ms) |
速度 T4 TensorRT10 (ms) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
アーキテクチャの進化とエコシステム
YOLO11は、YOLOv8の直接的な進化であり、その成功した設計原則に基づいて、ターゲットを絞った最適化を導入しています。両方のモデルは、高速、高精度、使いやすさという同じコア哲学を共有しています。これらは、統一されたUltralyticsリポジトリ内で開発およびメンテナンスされており、一貫性のある効率化されたユーザーエクスペリエンスを保証します。
この共有エコシステムは、開発者にとって大きな利点です。YOLOv8からYOLO11へのプロジェクトの移行は簡単で、チームは最小限のコード変更で新しいモデルのパフォーマンス向上を活用できます。このエコシステムは以下を提供します。
- シンプルで一貫性のあるAPIにより、学習、検証、および予測が可能です。
- 多数のガイドと例が記載された豊富なドキュメント。
- Efficient training workflows: COCO などのデータセットで、すぐに利用できる事前学習済みの重みを使用できます。
- メモリ要件が低い:Transformersのような他のモデルタイプと比較して、トレーニングおよび推論中のメモリ要件が低くなります。
- サポートとコラボレーションのための活気あるオープンソースコミュニティ。
結論: どのモデルを選ぶべきか?
新しいプロジェクトや、可能な限り最高の性能を必要とするプロジェクトにとって、YOLO11が明確な選択肢です。より効率的なアーキテクチャにより、特にCPU上で、優れた精度とより高速な推論速度を提供します。その進歩により、リアルタイム物体検出の新たな最先端技術となっています。
YOLOv8は、依然として優れた、信頼性の高いモデルです。そのアーキテクチャ向けにすでに最適化されている既存のプロジェクトや、その豊富な実績と多数のサードパーティ統合が重要な考慮事項となるシナリオに適しています。
結局のところ、どちらのモデルもリアルタイム物体検出の頂点を表しており、どちらを選択するかは、特定のプロジェクトのニーズによって異なります。しかし、明確な性能上の利点とUltralyticsエコシステムへのシームレスな統合により、YOLO11は開発者や研究者にとって新たな標準となるでしょう。
その他のモデルを見る
YOLO11 と YOLOv8 は主要な選択肢ですが、コンピュータビジョンの分野は常に進化しています。Ultralytics エコシステムで利用可能な他の強力なモデル(YOLOv10、YOLOv9、およびトランスフォーマーベースの RT-DETR など)との比較にも興味があるかもしれません。プロジェクトに最適なモデルを見つけるために、モデル比較の全範囲をご覧ください。