Link to this sectionYOLO11 vs YOLOv5:Ultralyticsアーキテクチャの包括的な技術比較#
適切なニューラルネットワークアーキテクチャの選択は、あらゆるコンピュータビジョンの取り組みにおいて極めて重要な決定事項です。人工知能の状況が進化するにつれ、開発者や研究者が利用できるツールも進化しています。この包括的なガイドでは、Ultralyticsエコシステムの2つの画期的なモデルである、広く称賛されているYOLOv5と高度なYOLO11について、詳細な技術的比較を提供します。
エッジAIアプリケーション向けの軽量モデルを展開する場合でも、クラウドGPUで高解像度ビデオストリームを処理する場合でも、これらのモデルのアーキテクチャのニュアンス、性能メトリクス、および理想的なユースケースを理解することで、特定の展開の制約に対してデータに基づいた選択を行うことができます。
Link to this sectionモデルの系譜と技術詳細#
両モデルとも、オープンソースのコラボレーション、堅牢なパフォーマンス、そして比類のない使いやすさに対するUltralyticsのコミットメントを反映しており、世界中の機械学習コミュニティから高く支持されています。
Link to this sectionYOLO11の詳細#
- 作成者:Glenn JocherおよびJing Qiu
- 組織:Ultralytics
- 日付:2024年9月27日
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLO11ドキュメント
Link to this sectionYOLOv5の詳細#
- 作成者:Glenn Jocher
- 組織:Ultralytics
- 日付:2020年6月26日
- GitHub:ultralytics/yolov5
- ドキュメント:YOLOv5ドキュメント
Link to this sectionアーキテクチャの違い#
YOLOv5からYOLO11への進化は、精度とパラメータ効率を最適化するために設計された、いくつかの重要なアーキテクチャの移行をもたらしました。
YOLOv5はPyTorchエコシステムの先駆者であり、高度に最適化されたCSPNet(Cross Stage Partial Network)バックボーンとPANet(Path Aggregation Network)ネックを導入しました。これはアンカーベースの検出に依存しており、オブジェクトの境界を予測するために事前に定義されたアンカーボックスが必要でした。非常に効果的ではありますが、カスタムのコンピュータビジョンデータセットに合わせてこれらのアンカーを調整するのは煩雑な作業になることがありました。
In contrast, YOLO11 transitions to a more modern, anchor-free detection paradigm. This eliminates the need for manual anchor box tuning, streamlining the training process and improving generalization across diverse datasets like the COCO dataset. Additionally, YOLO11 features a decoupled head, meaning classification and bounding box regression tasks are processed in separate branches. This separation significantly improves convergence speed and mean Average Precision (mAP), particularly for complex object detection scenarios.
Link to this sectionパフォーマンス指標とベンチマーク#
下の表は、さまざまなモデルサイズにおける主要な指標を比較しています。Ultralyticsのモデルはメモリ要件が低いことで有名であり、通常、重いTransformerベースの代替モデルと比較してトレーニング中のCUDAメモリ消費量が少なく、ハードウェア参入障壁を大幅に引き下げています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
観察されるように、YOLO11は非常に好ましいパフォーマンスバランスを達成しており、YOLOv5と同等のパラメータ数で一貫して高いmAPスコアを提供しています。
Link to this sectionトレーニング手法と使いやすさ#
Ultralyticsの哲学の核心は、手厚く管理されたエコシステムと広範なコミュニティサポートに支えられた、極めて高い使いやすさです。
YOLOv5は歴史的に、実行のために堅牢なコマンドラインインターフェース(CLI)スクリプト(train.py、detect.py)に依存していました。これらは強力ですが、これらのスクリプトをカスタムのPythonアプリケーションに直接統合するには、多くの場合、回避策が必要でした。
YOLO11は、合理化されたultralytics Pythonパッケージを導入することで、これを一変させました。この統合APIは、トレーニングからモデルの出力フォーマット(ONNX、OpenVINO、TensorRTなど)の変換まで、すべてをネイティブに処理します。
完全なノーコード体験を求める開発者は、Ultralyticsプラットフォームを利用して、データの注釈付け、クラウドでのモデルトレーニング、エッジデバイスへのシームレスな展開を行うことができます。
Link to this sectionコード比較#
今日のUltralyticsモデルのトレーニングは非常に効率的です。以下は、ネイティブのPython APIを使用してYOLO11をトレーニングする方法です。
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on custom data
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Export the model to ONNX for deployment
model.export(format="onnx")YOLOv5を利用するレガシーシステムの場合、CLIによるトレーニングは次のようになります。
# Clone the repository and run the training script
git clone https://github.com/ultralytics/yolov5
cd yolov5
pip install -r requirements.txt
python train.py --img 640 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5s.ptLink to this section理想的なユースケースと実世界のアプリケーション#
両モデルとも、異なる運用環境に合わせて調整された独自の強みを持っています。
Link to this sectionYOLOv5を利用する場合#
新世代のモデルが登場しても、YOLOv5は依然として強力です。以下のような場合に推奨されます。
- レガシーシステムの統合: YOLOv5特有のテンソル構造や、簡単にはリファクタリングできない展開パイプラインと深く統合された環境。
- 学術的なベースライン: 医療画像解析における再現可能な学術的研究のために、確立された長年のベースラインを必要とする研究者。
Link to this sectionYOLO11を利用する場合#
YOLO11は、その驚異的な汎用性により、現代のプロダクションパイプラインにおいて理想的な選択肢となります。
- マルチタスク環境: 主に検出器であるYOLOv5(後にセグメンテーションが追加されました)とは異なり、YOLO11はインスタンスセグメンテーション、画像分類、姿勢推定、およびOBB(指向性バウンディングボックス)検出を箱から出してすぐにサポートします。
- 高密度ビデオ分析: 複雑なシーンから最大限の精度を抽出することが不可欠な、高度な交通システムや小売在庫管理に最適です。
Link to this section未来に向けて:YOLO26アーキテクチャ#
YOLO11は優れた標準として存在していますが、コンピュータビジョンの最前線は急速に進歩し続けています。最高の効率を求める開発者は、最新のUltralytics YOLO26(2026年1月リリース)も検討すべきです。
YOLO26は大きな飛躍を遂げており、エッジの最適化とエンタープライズ規模の両方に向けて明示的に設計されています。主な革新点は以下の通りです。
- エンドツーエンドのNMSフリー設計: YOLO26はネイティブなエンドツーエンド設計であり、後処理の非最大値抑制(NMS)を排除して、より高速でシンプルな展開を実現します。
- DFLの削除: Distribution Focal Lossが削除され、モデル出力の簡素化と低電力デバイスでの互換性が強化されました。
- MuSGDオプティマイザ: SGDとMuonの画期的なハイブリッドであり、LLMのトレーニング安定性をコンピュータビジョンにもたらし、収束を高速化します。
- 最大43%高速なCPU推論: IoT展開や専用GPUのないデバイス向けに大幅に最適化されています。
- ProgLoss + STAL: 小さなオブジェクトの認識において著しい改善をもたらす損失関数。航空ドローンの画像において非常に重要です。
Link to this section要約#
YOLO11とYOLOv5のどちらを選択するかは、最終的にプロジェクトのライフサイクル段階に依存します。YOLOv5のレガシーは否定できず、極めて高い安定性と大規模なコミュニティのサポートを提供します。しかし、新規プロジェクトであれば、古い世代よりもYOLO11が強く推奨されます。最先端の精度、非常にエレガントなPython API、そしてトレーニング中のメモリオーバーヘッドの削減を兼ね備えており、AIイノベーションの最前線におけるUltralyticsの地位を強固なものにしています。さらに限界を押し広げたい場合は、Ultralyticsプラットフォームで最先端のYOLO26を試すことで、比類のない結果が得られるでしょう。