YOLOv5 YOLO11:物体検出におけるレガシーと革新の架け橋
YOLO You Only Look Once)アーキテクチャの進化は、コンピュータビジョン分野における決定的な歩みであった。YOLOv5 基盤となる信頼性からYOLO11高度なYOLOv5 、各イテレーションが速度と精度の限界を押し広げてきた。本ガイドは詳細な技術比較を提供し、開発者、研究者、エンジニアが特定の導入ニーズに最適なモデルを選択する手助けとなる。
モデル概要
YOLOv5:業界標準
グレン・ジョチャーと Ultralyticsによってリリースされた YOLOv5 は実用的な物体検出のゴールドスタンダードとして急速に認知されました。これはPyTorchでネイティブ実装された初のYOLO であり PyTorchで実装された最初のYOLOモデルであり、広範なAIコミュニティにとって非常にアクセスしやすいものとなりました。その使いやすさ、堅牢なトレーニングパイプライン、デプロイの柔軟性のバランスが、数千もの学術・産業アプリケーションにおける地位を確固たるものにしました。
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:ultralytics/yolov5
YOLO11:洗練された後継機
YOLO112024年にリリースされたYOLO11は、Ultralytics 大きな飛躍を遂げたモデルです。YOLOv8アーキテクチャ的進歩を基盤としつつ、優れた特徴抽出と効率性を実現するために設計された洗練されたバックボーンとヘッド構造を導入しています。YOLO11 精度と計算量の比率を最大化することにYOLO11 、先行モデルと比較してより少ないパラメータでより高い平均精度(mAP)を実現します。
- 著者: Glenn Jocher、Jing Qiu
- 組織:Ultralytics
- 日付: 2024-09-27
- GitHub:ultralytics/ultralytics
最新のおすすめ
YOLO11 YOLOv5大幅な改善YOLO11 、2026年に新規プロジェクトを開始する開発者はYOLO26の評価も検討すべきです。ネイティブのエンドツーエンド設計(NMS排除)、革新的なMuSGDオプティマイザ、最大43%高速CPU 備え、現代的なエッジデプロイメントにおける最良の選択肢となっています。
技術アーキテクチャの比較
バックボーンと特徴抽出
YOLOv5 CSPDarknetバックボーンを採用しています。このクロスステージ部分ネットワーク設計は、豊富な勾配の流れを維持しながら計算上の冗長性を削減する点で画期的でした。深さと幅の効果的なバランスにより、パラメータ数が爆発することなく複雑な特徴を学習できます。
YOLO11 この概念を進化させ、強化されたCSPバックボーン(C3k2)を採用し、改良された空間的注意機構を導入しています。アーキテクチャは特に微細な詳細を捉えるよう調整されており、これにより小型物体検出の性能が大幅に向上します。この洗練された設計により、YOLO11 より小さなモデルサイズで高い精度YOLO11
検出ヘッド
検出ヘッド YOLOv5 はアンカーベースであり、事前に定義されたアンカーボックスに依存して物体の位置を予測します。この手法は効果的ですが、カスタムデータセットではアンカーの寸法を慎重にハイパーパラメータ調整する必要があります。
YOLO11 アンカーフリー検出ヘッドを採用している。この最新の手法は、物体の中心位置と寸法を直接予測することでトレーニングプロセスを簡素化し、アンカーボックスの計算を不要とする。これによりトレーニングパイプラインが効率化されるだけでなく、多様な物体の形状やアスペクト比に対する汎化性能も向上する。
パフォーマンス指標
以下の表は、YOLO11性能差を比較したものです。重要な観察点は、速度と精度のトレードオフです。YOLO11 、GPU において、競争力のある、あるいは優れた推論速度を維持しながら、YOLO11 mAP を達成しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 1.9 | 4.5 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 7.2 | 16.5 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 21.2 | 49.0 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 46.5 | 109.1 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 86.7 | 205.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
分析:
- 精度:YOLO11n(Nano)は39.mAPを達成し、YOLOv5nの28.0%を大幅に上回っています。これにより、高精度を必要とする軽量アプリケーションにおいては、YOLO11 となります。
- CPU : YOLO11 、 ONNX 形式でより高速なCPU推論速度を実現し、GPU への展開において極めて重要です。
- 効率性: YOLO11 、同等あるいは多くの場合より少ないパラメータ数(例:YOLO11x対YOLOv5x)でこれらの性能向上YOLO11 、そのアーキテクチャ最適化の効率性を示している。
トレーニングとエコシステム
使いやすさ
両モデルとも、開発者体験を優先する著名なUltralytics エコシステムの恩恵を受けています。
- YOLOv5 直感的な構造と標準的なライブラリへの依存により、「5分でトレーニングを開始」の基準を確立 PyTorch データローダーへの依存により、「5分でトレーニングを開始する」という基準を確立しました。
- YOLO11 シームレスに統合される
ultralyticsPython 。このパッケージはすべてのタスクに対して一貫したAPIを提供します。つまり、 検出 宛先 インスタンスセグメンテーション または 姿勢推定 単一の文字列引数のみを変更する必要がある。
トレーニング効率
YOLO11 、収束を早めることが多い最適化されたトレーニング手順YOLO11 。モザイク拡張などの機能が洗練され、アンカーフリー設計によりYOLOv5に見られる自動アンカー進化の前処理ステップが不要になりました。さらに、両モデルともトレーニング中のメモリ使用量が、Transformerベースの検出器と比較して大幅に低減されています。 RT-DETRなどのトランスフォーマーベースの検出器と比較して、トレーニング中のメモリ使用量が大幅に低減され、コンシューマーGPUでのより大きなバッチサイズが可能となります。
Ultralytics を使用したトレーニング
Python を使用すれば、YOLO11 トレーニングは非常にYOLO11 。同じ構文がYOLOv5 にも適用されますYOLOv5 ultralytics パッケージを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
汎用性
YOLOv5 ライフサイクルの後半でセグメンテーションと分類のサポートYOLOv5 に対し、YOLO11 最初からマルチタスク学習器として設計YOLO11 。ネイティブにサポートするのは以下の機能です:
- 物体検出
- インスタンスセグメンテーション
- 画像分類
- 姿勢推定
- Oriented Bounding Box (obb)
これにより、YOLO11 複数の分析タイプが同時に必要となる複雑なコンピュータビジョンパイプラインにおいて、より汎用性の高い「万能ツール」となります。
理想的なユースケース
YOLOv5を選択すべき時
- レガシーシステム: 既存のYYOLOv5 フォーマットに特化した生産パイプラインをお持ちの場合、または
requirements.txtYOLOv5 継続して使用することで安定性がYOLOv5 。 - 特定のハードウェア制約:非常に古いハードウェアや特定のFPGA実装では、YOLOv5 よりシンプルなアーキテクチャ向けに最適化されたビットストリームが既に存在するYOLOv5 。
- 研究再現:2020年から2023年にかけて発表された学術論文を再現するため、YOLOv5 使用した。
YOLO11を選択すべき時
- エッジAIの展開:優れた速度と精度のバランスにより、YOLO11 NVIDIA やRaspberry PiなどのデバイスにYOLO11 、特にリアルタイム動画処理において効果を発揮します。
- 高精度要件: mAP 数値が1パーセント単位でmAP 医療画像診断や欠陥検出などの応用分野。
- マルチタスクアプリケーション:姿勢推定(例:スポーツ分析)や回転バウンディングボックス(例:航空測量)を必要とするプロジェクトは、YOLO11ネイティブサポートの恩恵を受けます。
- クラウドトレーニング: Ultralytics を活用した効率的なデータセット管理とモデルトレーニング
結論
YOLO11 、Ultralyticsオープンソースへの卓越した取り組みを証明するYOLO11 。 YOLOv5 は信頼性が高く、実戦で鍛えられた主力ツールであり続けています。しかし、 YOLO11 は、アーキテクチャの改良、優れた精度、幅広いタスクサポートにより、魅力的なアップグレードパスを提供します。
未来を見据える開発者にとって、選択は明らかです:YOLO11 現代的なアプリケーションに必要な性能上の優位性をYOLO11 。最先端を求める方には、さらにシンプルな導入を実現するエンドツーエンドNMS検出を導入したYOLO26の検討も強く推奨します。
ご興味のあるその他のモデルには以下が含まれます YOLOv10 リアルタイム性能研究向け、またはYOLOオープンボキャブラリ検出向けです。