物体検出の進化:YOLOv5 .YOLOv7
コンピュータビジョンの分野は、より高速で正確なリアルタイム物体検出の必要性により、ここ数年で急速に進化してきた。コンピュータビジョンプロジェクトに適したアーキテクチャを選択する際には、人気モデル間の微妙な違いを理解することが重要である。例えば Ultralytics YOLOv5YOLOv7 極めてYOLOv7 。本技術比較では、各モデルのアーキテクチャ、トレーニング手法、性能指標、最適な導入シナリオを詳細に分析し、情報に基づいた意思決定を支援します。
一目でわかる:モデルの起源
これらのモデルの背景にある起源と設計思想を理解することは、そのアーキテクチャ上の選択の文脈を提供する。
YOLOv5 :
- 著者: Glenn Jocher
- 組織:Ultralytics
- 日付: 2020-06-26
- GitHub:YOLOv5 リポジトリ
- ドキュメント:YOLOv5 ドキュメント
YOLOv7の詳細:
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織:台湾中央研究院情報科学研究所
- 日付: 2022-07-06
- Arxiv:YOLOv7論文
- GitHub:YOLOv7 リポジトリ
- ドキュメント:YOLOv7 ドキュメント
さらに多くのアーキテクチャを探索する
これらのモデルが他と比べてどうなのか気になりますか?YOLOv5 YOLO11やYOLOv7 EfficientDetなどの比較記事をチェックして、物体検出エコシステムへの理解を深めましょう。
建築的革新と差異
YOLOv5: アクセシビリティの標準
Ultralytics 導入されたYOLOv5 、ネイティブに PyTorch フレームワークをネイティブに活用することでパラダイムシフトをもたらし、研究者や開発者の参入障壁を大幅に低下させました。そのアーキテクチャは改良版CSPDarknet53バックボーンを基盤とし、クロスステージ部分結合(CSP)ネットワークを統合することで、勾配の流れを維持しながらパラメータ数を削減しています。
その最大の強みのひとつはメモリ要件である。従来の二段式検出器や RT-DETRなどの重たいトランスフォーマーモデルと比較して、YOLOv5 トレーニング中にCUDA 大幅に少なく、標準的なコンシューマー向けGPUでもより大きなバッチサイズを扱えます。さらに、ネイティブに統合された汎用性により、画像分類、物体検出、画像セグメンテーションをシームレスにサポートします。
YOLOv7:リアルタイム精度の限界に挑戦
2022年半ばに発表されたYOLOv7 、MSCOCO におけるリアルタイム検出の最先端技術の限界を押し広げることにYOLOv7 。著者らは拡張効率的層集約ネットワーク(E-ELAN)を導入し、元の勾配経路を破壊することなくネットワークの学習能力を向上させた。
YOLOv7 「トレーニング可能なフリービーの袋」でもYOLOv7 、特にトレーニング中の再パラメータ化技術が特徴的である。これは複数のモジュールを推論用に単一の畳み込み層に変換し、精度を損なうことなく速度を向上させる。しかし、この複雑なトレーニング手法は、Ultralytics 、学習曲線が急峻になり、エクスポートパイプラインが直感的でない結果を招くことが多い。
パフォーマンス比較
これらのモデルを評価する際には、速度、精度、計算コストの間の性能バランスが最も重要である。以下に、MSCOCO データセットに基づく性能指標の詳細な比較を示す。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv7 より大規模なバリエーションで絶対的なmAP YOLOv7 一方、YOLOv5 比類のないモデル群YOLOv5 ——極限のエッジデバイス向け超軽量Nano(YOLOv5n)から、クラウド推論向け超大型(YOLOv5x)まで。
Ultralyticsエコシステムの利点
モデルの有用性は、その純粋なアーキテクチャを超えて広がります。モデルを取り巻くエコシステムが、本番環境への展開速度を決定づけるのです。Ultralytics 発揮されます。
- 使いやすさ: Ultralytics Python 、合理化されたユーザー体験、シンプルな構文、そして充実したドキュメントを提供します。カスタムデータセットのトレーニングには、一切の定型コードが不要です。
- 健全なエコシステム: Ultralytics 活発な開発、頻繁なアップデート、強力なコミュニティサポートのUltralytics 。Comet Biasesなどのツールとの統合により、 Weights & Biases との連携機能は最初から組み込まれています。
- トレーニング効率:データローダー、スマートキャッシュ、GPU により、Ultralytics 極めて効率的です。すぐに利用可能な事前学習済み重みにより、転移学習が劇的に加速されます。
コード例:はじめに
Ultralytics、モデルをデプロイするのに必要なコードはわずか数行です。Python 、推奨される方法でモデルの読み込み、トレーニング、推論の実行がいかに簡単かを示しています。 ultralytics パッケージを参照してください。
from ultralytics import YOLO
# Load a pretrained YOLOv5s model
model = YOLO("yolov5s.pt")
# Train the model on the COCO8 example dataset
# Ultralytics automatically handles data downloading and augmentation
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the predictions
predictions[0].show()
対照的に、YOLOv7 を利用するには、一般的に複雑なリポジトリのクローン作成、依存関係の手動管理、そして長いコマンドライン引数の使用が必要となる。
実世界での応用例と理想的な使用事例
YOLOv7を選択すべき時
YOLOv7 、学術的なベンチマークや特定のレガシーGPU 、最大mAP 唯一の目的mAP 、システムが既にアンカーベースの出力テンソルに最適化されている場合に、有力な選択肢YOLOv7 。勾配経路解析を探求する研究者は、しばしばYOLOv7 利用する。
YOLOv5を選択すべき時
YOLOv5 はその卓越した安定性から、実稼働環境で非常にYOLOv5 。以下の用途において最適な選択肢です:
- モバイルおよびエッジコンピューティング: iOS へのYOLOv5niOS デプロイ CoreML またはAndroid TFLite。
- アジャイルスタートアップ:迅速な反復サイクルを必要とするチームは、データセット管理とクラウドトレーニングのためのシームレスなUltralytics 統合の恩恵を受けます。
- マルチタスク環境:同時に対象物検出、分類、セグメンテーションを必要とするシステム。
未来:YOLO26への移行
YOLOv5 YOLOv7 比較することは、ビジョンAIの進化を理解する上で優れた演習YOLOv7 、最先端技術は進化を続けている。2026年1月にリリースUltralytics 画期的な飛躍を遂げており、新規プロジェクトにおいて旧式アーキテクチャをほぼ時代遅れのものとしている。
最高のパフォーマンスを求める開発者にとって、YOLO26はYOLOv5 YOLOvYOLOv7に対して以下の画期的な利点を提供します:
- エンドツーエンドNMS:非最大抑制(NMS)後処理を排除することで、YOLO26は劇的に簡素化された展開と、高速かつ一貫したレイテンシを実現します。
- MuSGDオプティマイザ:Moonshot AIのLLM技術革新に着想を得たこのハイブリッドオプティマイザは、極めて安定したトレーニングと高速な収束を実現します。
- 前例のないエッジ処理速度:エッジ環境向けに特別に最適化されたnanoモデルは、ディストリビューション・フォーカル・ロス(DFL)を除去することで、 CPU 最大43%高速化します。
- 優れた精度: ProgLoss +STALなどの新しい損失関数は、小さな物体の認識を大幅に改善し、ドローン映像やロボティクスに最適です。
既存のYOLOv5 維持管理でも、最先端のYOLO26の実装を検討中でも、Ultralytics 現代のコンピュータビジョンで成功するために必要なすべてのツールを提供します。