Link to this sectionYOLOv5 vs YOLO11#
新しいプロジェクトに適したコンピュータビジョンのアーキテクチャを選択する際には、最先端モデルの進化を理解することが不可欠です。初期のアーキテクチャから現代の統合型フレームワークへの進展は、アルゴリズムの効率性と開発者体験の両面において重要な飛躍を示しています。本ガイドでは、Ultralyticsによって開発された2つの画期的なモデル、先駆的なYOLOv5と高度に洗練されたYOLO11について、詳細な技術的比較を提供します。
Link to this sectionモデルの紹介#
これら両方のアーキテクチャはリアルタイム物体検出の分野における重要なマイルストーンであり、展開環境やレガシー要件に応じてそれぞれ異なる利点を提供します。
Link to this sectionYOLOv5: 業界の主力製品#
2020年夏にリリースされたYOLOv5は、ネイティブなPyTorch実装により、すぐに業界標準となりました。これにより、学習と展開の参入障壁が大幅に引き下げられました。これは、前身の複雑なDarknet Cフレームワークから脱却し、Pythonらしいモデル構築アプローチを提供したものです。
- 著者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020-06-26
- GitHub: ultralytics/yolov5
- ドキュメント: YOLOv5ドキュメント
YOLOv5は使いやすさの強力な基準を確立し、高度なモザイクデータ拡張や自動アンカー設定など、強力な学習手法を導入しました。十分に文書化され、広範囲にテストされたコードベースを構築する研究者の間で、依然として絶大な人気を誇っています。
Link to this sectionYOLO11: 統合型ビジョンフレームワーク#
長年のフィードバックとアーキテクチャ研究に基づいて構築されたYOLO11は、複数のビジョンタスクをネイティブに処理できる統合フレームワークの一部として導入されました。バウンディングボックスの枠を超え、最大限の汎用性と効率性を実現するためにゼロから設計されました。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: ultralytics/ultralytics
- ドキュメント: YOLO11ドキュメント
YOLO11はultralytics Pythonパッケージを通じて合理化されたユーザー体験を提供し、物体検出、インスタンスセグメンテーション、分類、姿勢推定、および指向性バウンディングボックス(OBB)を統合したシンプルなAPIを誇ります。速度と精度の間で非常に良好なトレードオフを達成しており、多様な実世界の展開シナリオに最適です。
どちらのモデルも、Ultralytics Platformが提供する適切にメンテナンスされたエコシステムの恩恵を受けています。この統合環境により、データセットのアノテーション、クラウド学習、およびさまざまなハードウェアターゲットへのモデルエクスポートが簡素化されます。
Link to this sectionパフォーマンスと指標の比較#
A direct comparison of these models reveals how architectural refinements translate to tangible performance gains. The table below illustrates the mean Average Precision (mAP) evaluated on the COCO dataset, alongside CPU and GPU inference speeds and parameter counts.
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this section結果の分析#
これらのメトリクスは、YOLO11が達成したパフォーマンスバランスの明確な飛躍を強調しています。例えば、YOLO11n(nano)モデルはYOLOv5nの28.0%と比較して39.5%のmAPを達成し、同時にONNX経由でエクスポートされた際のCPU推論時間を短縮しています。さらに、YOLO11は学習中のメモリ要件をTransformerベースの重量級モデルと比較して著しく低く抑えており、消費者向けハードウェアやエッジデバイスへの展開に適しています。
Link to this sectionアーキテクチャの違い#
YOLO11におけるパフォーマンスの向上は、いくつかの重要なアーキテクチャの進化に起因しています。YOLOv5はC3モジュールを備えた標準的なCSPNetバックボーンを採用していましたが、YOLO11ではC2fやその後のC3k2といったより効率的な特徴抽出ブロックが導入され、勾配フローの最適化と計算オーバーヘッドの削減が行われました。
YOLO11はまた、大幅に改良されたヘッドを備えています。古いモデルのアンカーベースの設計から脱却し、より新しいUltralyticsのアーキテクチャはアンカーフリーのアプローチを採用しています。これにより、ボックス予測の数が減り、後処理パイプラインが合理化され、さまざまなスケールやアスペクト比に対して汎用化するモデルの能力が向上しました。さらに、これらのモデルは優れた学習効率を誇り、微調整されたデータセットの収束を加速させる事前学習済み重みが容易に入手可能です。
Link to this section実装とコード例#
Ultralyticsエコシステムの際立った特徴の一つは、そのシンプルさです。YOLOv5は迅速な推論のためにtorch.hubの使用を普及させましたが、YOLO11は統一されたultralytics Pythonパッケージでこれをさらに一歩進めました。
Link to this sectionYOLO11での学習#
モデルのロード、学習、検証に必要なボイラープレートコードは最小限です。APIがハイパーパラメータの調整とモデル管理をシームレスに処理します。
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11s.pt")
# Train on a custom dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Easily export the model to TensorRT for hardware acceleration
model.export(format="engine")Link to this sectionYOLOv5によるレガシー推論#
古いパイプラインをメンテナンスしている場合、YOLOv5はPyTorchのネイティブなロードメカニズムと直接統合されるため、既存の推論スクリプトへの導入が容易です。
import torch
# Load a custom or pretrained YOLOv5 model from PyTorch Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s")
# Perform inference on an image URL
results = model("https://ultralytics.com/images/zidane.jpg")
# Print prediction details to the console
results.print()Both models support extensive export formats. Whether you are targeting an NVIDIA Jetson using TensorRT or an iOS application using CoreML, the deployment process is thoroughly documented and supported by the community.
Link to this section理想的なユースケース#
これらのモデルの選択は、プロジェクトのライフサイクル段階と特定の要件に大きく依存します。
Link to this sectionYOLOv5を選択すべき場合#
- レガシーコードベースのメンテナンス: 本番環境がYOLOv5リポジトリ構造や特定のハイパーパラメータ進化手法を中心に高度にカスタマイズされている場合。
- 学術的なベースライン: 2020~2022年の確立されたコンピュータビジョン標準との直接的なベンチマークを必要とする研究を発表する場合。
Link to this sectionYOLO11を選択すべき時#
- マルチタスクプロジェクト: アプリケーションが姿勢推定やインスタンスセグメンテーションなどの複数のタスクを単一の統合APIで実行する必要がある場合。
- エッジ展開: 特定の計算予算(FLOPs)に対して最大mAPを絞り出すことが不可欠なエッジコンピューティングのシナリオにおいて。
- 商用AIソリューション: Ultralytics Platformの堅牢なサポートを活用し、小売やセキュリティ分野のエンタープライズアプリケーションに最適です。
Link to this section次世代:Ultralytics YOLO26#
YOLO11は速度と精度の素晴らしいバランスを表現していますが、人工知能の分野は急速に進化しています。今日新しいプロジェクトを開始する開発者には、ビジョンAIの最新標準である**Ultralytics YOLO26**を探索することを強く推奨します。
2026年1月にリリースされたYOLO26は、現代の展開ニーズのために特別に設計されたパラダイムシフトとなる進歩を導入しています。
- エンドツーエンドのNMSフリー設計: YOLOv10で初めて開拓されたコンセプトに基づいて、YOLO26はネイティブにエンドツーエンドです。Non-Maximum Suppression (NMS)の後処理を不要にすることで、展開パイプラインを大幅に簡素化し、レイテンシを削減します。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のようなモデルのLLM学習の革新から着想を得たこのSGDとMuonのハイブリッドは、非常に安定した学習と劇的に高速な収束を保証します。
- かつてないCPU速度: Distribution Focal Loss (DFL)を排除することで、YOLO26は最大43%の高速なCPU推論を達成しており、専用GPUを持たないエッジデバイスや環境にとって絶対的な最良の選択肢となります。
- 高度な損失関数: ProgLossとSTALの統合により、ドローン解析、IoT、ロボティクスに不可欠な小物体認識において顕著な改善が得られます。
- タスク固有の強化: 姿勢推定のためのResidual Log-Likelihood Estimation (RLE)や、指向性バウンディングボックスのための特殊な角度損失など、専門的な最適化が導入されており、すべてのコンピュータビジョンタスクにおいて優れたパフォーマンスを保証します。
標準的な物体検出を超えた専門的なアーキテクチャに関心があるユーザーは、Transformerベースの検出のためのRT-DETRや、オープンボキャブラリーのトラッキングと検出のためのYOLO-Worldといったモデルも探索してみてください。これらの適切にメンテナンスされ、高度に最適化されたツールを採用することで、コンピュータビジョンのパイプラインは効率的かつスケーラブルであり、常に最先端を維持できます。