YOLOv5 YOLO11:包括的な技術比較
急速に進化するコンピュータビジョンにおいて、適切な物体検出モデルを選択することはプロジェクトの成功に不可欠です。この分野で最も重要なマイルストーンは次の2つです。 YOLOv5と、最近リリースされた YOLO11.YOLOv5 使いやすさとスピードで伝説的な基準を確立したのに対し、YOLO11 長年の研究開発を生かし、精度と効率の限界に挑戦している。
本ガイドは、開発者、研究者、エンジニアがAIアプリケーションのために十分な情報を得た上で決断できるよう、これら2つのアーキテクチャの詳細な技術的分析を提供する。
Ultralytics YOLOv5:信頼できる主力製品
2020年にリリースされたYOLOv5 5は、物体検出のアクセシビリティに革命をもたらした。これは、PyTorchでネイティブに実装された最初の "You Only Look Once "モデルである。 PyTorchでネイティブに実装された最初の「You Only Look Once」モデルであり、開発者にとって学習とデプロイが驚くほど簡単になりました。その速度と精度のバランスにより、工業検査から自律走行車まで、あらゆる分野で選ばれるようになりました。
技術詳細:
- 著者: Glenn Jocher
- 組織Ultralytics
- Date: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- ドキュメントhttps://docs.ultralytics.com/models/yolov5/
主な機能とアーキテクチャ
YOLOv5 5はアンカーベースのアーキテクチャを採用している。CSPDarknetバックボーンを導入することで、勾配フローが大幅に改善され、以前の反復と比較して計算コストが削減された。このモデルは情報フローを向上させるためにパス集約ネットワーク(PANet)ネックを採用し、学習中にモザイクデータ増強を統合している。
長所
YOLOv5 5はその安定性と成熟度で有名です。長年のコミュニティ・テストにより、チュートリアル、サードパーティとの統合、デプロイメント・ガイドのエコシステムは膨大だ。YOLOv5は、レガシー・システムやエッジ・デバイスに最適であり、そのアーキテクチャのために特定のハードウェア最適化がすでに行われている。
Ultralytics YOLO11:最先端の進化
2024年後半に始動 YOLO11はビジョンAIの最先端を行く。YOLOv5 8から学んだ教訓を基に開発されている。 YOLOv8より速く、より正確で、より計算効率の高いモデルを提供する。
技術詳細:
- 著者: Glenn Jocher、Jing Qiu
- 組織Ultralytics
- 日付: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- ドキュメントhttps://docs.ultralytics.com/models/yolo11/
アーキテクチャと主な機能
YOLO11 、C3k2ブロックやC2PSA(Cross-Stage Partial with Spatial Attention)モジュールなど、アーキテクチャが大幅に改良されました。YOLO11 、YOLOv5異なり、アンカー・フリーの検出ヘッドを採用しているため、アンカー・ボックスを手動で計算する必要がなく、学習プロセスが簡素化されている。この設計の転換により、汎化が強化され、モデルが多様なデータセットによりよく適応できるようになった。
比類なき汎用性
YOLO11 特徴の一つは、単一のフレームワークで複数のコンピュータ・ビジョン・タスクをネイティブにサポートしていることである。YOLOv5 主に検出(後にセグメンテーションもサポート)に重点を置いていたのに対し、YOLO11 処理するために一から構築された:
この汎用性により、開発者はフレームワークを切り替えることなく、複雑なロボット工学や解析の問題に取り組むことができる。
パフォーマンス比較
YOLOv5 YOLO11 移行により、パフォーマンスが大幅に向上した。このメトリクスは、YOLO11 速度と精度の間で優れたトレードオフを提供していることを示している。
精度と効率の比較
YOLO11 、同規模のYOLOv5 モデルと比較して、COCO データセットで一貫して高い平均精度(mAP)を達成しています。例えば、YOLO11mモデルは、数分の一のパラメータ(20.1M対97.2M)で動作しながら、精度ではるかに大きなYOLOv5xを上回っています(51.5対50.7mAP)。このモデル・サイズの大幅な縮小は、学習と推論の両方で必要なメモリの削減につながり、リソースに制約のあるエッジAIハードウェアに展開する上で重要な要素となります。
推論速度
最適化されたアーキテクチャの選択により、YOLO11 CPU 推論速度で輝きを放ちます。YOLO11nモデルは、リアルタイム・アプリケーションの新たなベンチマークとなり、ONNX使用した場合、CPU 上でわずか56.1msを記録し、前モデルより大幅に高速化されました。
メモリ効率
Ultralytics YOLO11 モデルは、最適なメモリ使用量を実現するように設計されています。のようなトランスベースの検出器と比較して RT-DETRのような変換器ベースの検出器と比較して、YOLO11 トレーニング中に必要なCUDA メモリを大幅に削減し、標準的なコンシューマー向けGPUを使用する開発者がアクセスできるようにしています。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
トレーニングと開発者の経験
どちらのモデルも、「使いやすさ」で知られる包括的なUltralytics エコシステムの恩恵を受けている。
シームレスな統合
YOLO11 11は現代に溶け込んでいる ultralytics Python パッケージは、すべてのタスクをシンプルなAPIの下に統合する。これにより、わずか数行のコードでトレーニング、検証、デプロイが可能になる。
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
YOLOv5 専用のリポジトリがありますが、PyTorch Hub経由で簡単にロードすることもできますし、特定のタスクのために新しいエコシステムの中で利用することもできます。どちらのモデルもドキュメントがしっかりしているので、ハイパーパラメータのチューニングを行う場合でも、あるいは OpenVINOにエクスポートする場合でも、プロセスは合理化されています。
エコシステムの利点
Ultralytics モデルを選択することは、整備されたツール群へのアクセスを得ることを意味します。実験追跡のための Comet統合からシームレスなデータセット管理まで、エコシステムはMLOpsのライフサイクル全体をサポートします。この積極的な開発により、セキュリティパッチやパフォーマンスの改善が定期的に提供されます。
理想的なユースケース
YOLOv5選ぶとき
- レガシー・ハードウェア: YOLOv5 アーキテクチャに最適化されたパイプラインを持つ既存のエッジ・デバイス(古いRaspberry Pisなど)をお持ちの場合。
- 確立されたワークフロー:コアモデルアーキテクチャの更新に多大なリファクタリングコストがかかるような、メンテナンスモードが深いプロジェクトの場合。
- 特定のGPU 最適化:特定のTensorRT エンジンが、YOLOv55の正確なレイヤ構造用に大きくチューニングされているまれなケース。
YOLO11選ぶとき
- 新しい開発:事実上すべての新規プロジェクトにおいて、YOLO11 11は、その優れた精度対計算比により、出発点として推奨される。
- リアルタイムCPU アプリケーション:ラップトップやクラウドインスタンスなど、標準的なプロセッサーで実行されるアプリケーションは、YOLO11 CPU スピード最適化の恩恵を大いに受ける。
- 複雑なタスク:検出と同時にインスタンスのセグメンテーションや ポーズ推定を必要とするプロジェクト。
- 高精度の要件: 医療画像や 衛星画像解析のように、小さな物体を高精度で検出することが最も重要な分野。
結論
YOLOv5 、効率的で利用しやすいAI設計の証であり続け、過去数年間に数え切れないほどのイノベーションを生み出してきた。しかし、YOLO11 11は未来を象徴している。先進的なアンカーフリーアーキテクチャ、優れたmAP スコア、強化された汎用性により、開発者は現代のコンピュータービジョンの課題を解決するための、より強力なツールセットを手に入れることができます。
YOLO11採用することで、パフォーマンスを向上させるだけでなく、Ultralytics エコシステムの中でアプリケーションの将来性を確保することができます。
その他のモデルを見る
これらのアーキテクチャーと他の主要モデルとの比較にご興味のある方は、詳細な比較をご覧ください: