Link to this sectionYOLO11対YOLOv6-3.0#
コンピュータビジョンの分野は急速に進化しており、機械学習の専門家にとって適切なモデルアーキテクチャを選択することは重要な判断です。リアルタイム物体検出の進化における2つの重要なマイルストーンが、YOLO11とYOLOv6-3.0です。両モデルとも視覚データから洞察を引き出すための優れた機能を提供しますが、それぞれ異なる主要な目的と設計哲学に基づいて開発されました。
本ガイドでは、AIプロジェクトで情報に基づいた意思決定を行えるよう、両者のアーキテクチャ、パフォーマンス指標、および理想的なデプロイシナリオを比較する詳細な技術分析を提供します。
Link to this sectionモデルの概要#
技術的なベンチマークの詳細に入る前に、各モデルの起源と主要な焦点を理解することが役立ちます。
Link to this sectionUltralytics YOLO11#
Ultralyticsエコシステム内でネイティブに開発されたYOLO11は、シームレスなエンドツーエンドの開発体験を提供するために構築されました。単なる生の処理速度だけでなく、マルチタスクの汎用性、使いやすさ、および最新のデプロイパイプラインとの統合を重視しています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: Ultralytics リポジトリ
- ドキュメント: YOLO11ドキュメント
Link to this sectionMeituan YOLOv6-3.0#
YOLOv6-3.0は、専用のグラフィックスプロセッシングユニット (GPU)が利用可能な産業用アプリケーション向けに特別に調整されました。TensorRTデプロイに最適化されており、制御された環境下でのスループットを最大化することに重点を置いています。
- 著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
- 組織: Meituan
- 日付: 2023-01-13
- Arxiv: 2301.05586
- GitHub: Meituan YOLOv6 リポジトリ
- ドキュメント: YOLOv6 Documentation
Link to this sectionアーキテクチャの違い#
基礎となるアーキテクチャは、モデルがどのように学習しスケーリングするかを決定します。両フレームワークは、従来のYOLO方式に独自の強化を導入しています。
YOLO11 builds upon years of research to deliver an architecture that is incredibly parameter-efficient. It features an advanced backbone and a generalized head capable of handling diverse computer vision tasks—such as instance segmentation and pose estimation—without requiring massive structural overhauls. Furthermore, YOLO11 boasts exceptionally low CUDA memory requirements during training, setting it apart from bulkier transformer models like RT-DETR.
対照的に、YOLOv6-3.0は双方向連結(Bi-directional Concatenation: BiC)モジュールとアンカー支援トレーニング(Anchor-Aided Training: AAT)戦略を採用しています。これらのメカニズムはローカライゼーションの精度を向上させるように設計されています。アーキテクチャは主にデカップリング(分離)され、INT8モデル推論を優先するために大幅に量子化されており、レガシーなGPUスタックを運用する高速製造ラインにとって有力な候補となっています。
プロジェクトに迅速なプロトタイピング、多様なタスクのサポート(セグメンテーションや分類など)、および異なるハードウェア(CPU、Edge TPU、モバイル)へのデプロイが必要な場合、Ultralyticsフレームワークは開発者にとって大幅にスムーズな体験を提供します。
Link to this sectionパフォーマンスとメトリクス#
When evaluating models, mean Average Precision (mAP) and inference speed are paramount. The following table compares the performance of YOLO11 against YOLOv6-3.0 across various model scales. Best performing metrics are highlighted in bold.
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
示されているように、YOLO11は同等の階層において、より少ないパラメータ数とFLOPsで一貫して高い精度(mAP)を達成しています。このパラメータ効率は、モデルのトレーニング時と推論時の両方で、より低いメモリ要件に直接つながります。
Link to this sectionUltralyticsの利点#
モデルの選択は単なる指標の数値以上に、機械学習ライフサイクル全体に関わる問題です。Ultralyticsモデルは、開発者と研究者の双方に明確な利点を提供します。
- 使いやすさ: Ultralytics Python APIを使用すると、わずか数行のコードでモデルのトレーニング、検証、エクスポートが可能です。複雑な依存関係ツリーを手動で設定する必要はありません。
- 適切に管理されたエコシステム: Ultralyticsは頻繁な更新を受ける統合エコシステムを提供します。Ultralytics Platformを利用することで、開発者は共同データセットアノテーション、クラウドトレーニング、シームレスなモデル監視を利用できます。
- 汎用性: 主にバウンディングボックス検出器であるYOLOv6-3.0とは異なり、YOLO11は画像分類と指向性バウンディングボックス (OBB)をネイティブでサポートしており、テクノロジースタックを統合できます。
- トレーニングの効率性: 最新の最適化と自動バッチ処理を活用することで、YOLO11はコンシューマーグレードのハードウェアでも効率的にトレーニングでき、最先端のビジョンAIへのアクセスを民主化します。
Link to this sectionコード例: 学習と推論#
Ultralyticsモデルの扱いは非常に直感的です。以下は、Ultralyticsパッケージを使用してトレーニングと推論を実行する方法を示す、完全に実行可能な例です。
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image from the web
prediction = model("https://ultralytics.com/images/bus.jpg")
# Export the model to ONNX format for easy deployment
model.export(format="onnx")Link to this section理想的なユースケース#
各モデルがどこに優れているかを理解することで、目的に合った正しいツールを確実に選択できます。
When to choose YOLOv6-3.0: If you maintain a legacy industrial system built explicitly around specific TensorRT 7.x/8.x pipelines and your hardware consists entirely of dedicated NVIDIA T4 or A100 GPUs for high-speed manufacturing automation, YOLOv6 remains a viable, capable engine.
When to choose YOLO11: For nearly all modern applications, YOLO11 is the superior choice. Whether you are building smart manufacturing solutions, deploying edge AI on Raspberry Pi devices, or performing multi-task operations like detecting and segmenting medical imagery, YOLO11 provides the optimal balance of speed, accuracy, and deployment flexibility.
Link to this section今後の展望: 最先端のYOLO26#
YOLO11は大きな飛躍を遂げましたが、Ultralyticsは常にコンピュータビジョンの限界を押し広げています。2026年1月にリリースされた新しい**YOLO26**モデルシリーズは、絶対的な最先端であり、すべての新規プロジェクトに推奨されるモデルです。
YOLO26は、最新のデプロイの課題に対応するために特別に設計されたいくつかの画期的な機能を導入しています。
- エンドツーエンドのNMSフリー設計: YOLOv10によって先駆的に開拓された概念に基づき、YOLO26はネイティブなエンドツーエンドを実現しています。非最大値抑制(NMS)の後処理を完全に排除し、より高速で劇的にシンプルなデプロイパイプラインを実現します。
- DFLの削除: Distribution Focal Lossを削除することで、YOLO26はネットワークヘッドを簡素化し、低電力のモノのインターネット (IoT)デバイスやエッジデバイスとの互換性を大幅に強化しています。
- MuSGDオプティマイザ: 大規模言語モデル(LLM)のトレーニング革新(Moonshot AIのKimi K2など)に着想を得たYOLO26は、ハイブリッドなMuon-SGDオプティマイザを採用し、比類のないトレーニングの安定性とより高速な収束を保証します。
- 最大43%高速なCPU推論: 専用のGPUアクセラレータなしで実行されるアプリケーション向けに、YOLO26は生のCPUスループットに対して大幅な最適化が行われました。
- ProgLoss + STAL: これらの高度な損失関数は、ドローン画像や空中監視において重要となる、小物体認識の顕著な向上をもたらします。
- タスク固有の改善: YOLO26には、セグメンテーションのためのマルチスケールプロトタイピングや、姿勢推定のためのResidual Log-Likelihood Estimation (RLE) など、すべてのタスクにわたるカスタマイズされた強化が含まれています。
今日、新しいコンピュータビジョンの取り組みを開始する場合、Ultralytics Platformを活用してYOLO26モデルをトレーニングすることで、利用可能な中で最も効率的、正確、かつ将来を見据えたアーキテクチャでアプリケーションを構築できます。
オープンボキャブラリー検出を探求することに関心がある開発者は、YOLO-Worldに関するドキュメントも確認できます。