コンテンツにスキップ

YOLOv7 YOLOv5:高精度と実用性の両立

適切な物体検出アーキテクチャの選択には、多くの場合、純粋な学術的性能と実用的な導入容易性の間のトレードオフを考慮する必要があります。この詳細な比較では、YOLO 二つの重要なマイルストーンを検証します: YOLOv7、いわゆる「フリービーの袋」アーキテクチャ最適化で知られるモデルと、 YOLOv5、その使いやすさ、速度、そして実稼働環境での大規模な採用で称賛される伝説的なUltralytics 。

概要

一方 YOLOv7 はE-ELANのような複雑なアーキテクチャ選択によりCOCO でより高いピーク精度(mAP)を達成する一方、 YOLOv5 は、より効率的なトレーニング体験、低いリソース消費、幅広いデプロイメントサポートを提供し、使いやすさの面で業界標準であり続けています。2026年に新規プロジェクトを開始する開発者にとって、議論はUltralytics 移行しています。これはv7の精度上の利点とv5の使いやすさを組み合わせ、さらにネイティブなエンドツーエンドNMS推論を実現しています。

性能指標の比較

以下の表は主要なバリエーション間の性能差を比較したものです。YOLOv7 GPU YOLOv7 一方、YOLOv5 モバイルデバイスからクラウドサーバーまであらゆる用途に適した細分化されたモデル群YOLOv5 。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOv7:アーキテクチャのパワーハウス

YOLOv4の著者たちにより2022年7月にリリースされた YOLOv7 は、リアルタイム物体検出の精度限界を押し広げることを目的とした複数の先進的な概念を導入した。

YOLOv7について詳しくはこちら

主要なアーキテクチャ機能

  1. E-ELAN(拡張効率的層集合ネットワーク):この構造は、最短および最長の勾配経路を制御することで、ネットワークがより多様な特徴を学習することを可能にします。元の勾配経路を破壊することなくネットワークの学習能力を向上させ、複雑なシーンにおける精度向上につながります。
  2. モデルスケーリング:標準的な複合スケーリングとは異なり、YOLOv7 ブロックの深度と幅を同時にYOLOv7 、異なるリソース制約(例:YOLOv7 対YOLOv7)に対して最適なアーキテクチャを確保します。
  3. 学習可能なフリービーの袋:本モデルは計画的再パラメータ化技術を採用しており、学習時にはモデル構造を最適化しつつ、推論時にはそれを簡素化することで、精度を損なうことなく効果的に速度を向上させる。

YOLOv7の理想的なユースケース

YOLOv7 、自動運転安全システムや高解像度製造画像における微小欠陥検出など、mAP 学術研究やハイエンド産業用途でYOLOv7 。

YOLOv5: 生産標準

YOLOv5Ultralyticsが開発したYOLOv5は、アーキテクチャだけでなく開発者体験を優先したことでこの分野に革命をもたらした。PyTorchネイティブ実装された初のYOLO であり、膨大なPython コミュニティが利用可能となった。

YOLOv5について詳しくはこちら

開発者がYOLOv5を選ぶ理由

  • 比類なき汎用性: YOLOv7 主に物体検出にYOLOv7 一方、YOLOv5 標準状態でインスタンスセグメンテーションと 画像分類 YOLOv5 。
  • 低メモリフットプリント: YOLOv5 CUDA を非常に効率的にYOLOv5 、トランスフォーマーベースのモデルやより重いアーキテクチャと比較して、コンシューマー向けハードウェア上でより大きなバッチサイズを実現します。
  • デプロイメントエコシステム: ONNX、CoreML、TFLite、TensorRTシームレスなエクスポートを提供し、モバイルアプリやNVIDIA などのエッジデバイスにおける最適な選択肢となっています。

Ultralyticsの利点: エコシステムとユーザビリティ

これらのモデルを比較する際、周辺環境はアーキテクチャ自体と同様に重要であることが多い。Ultralytics (YOLOv5 世代のYOLO26)は、統一された、よく管理されたプラットフォームの恩恵を受けている。

使いやすさとトレーニング効率

モデルのトレーニングにコンピュータサイエンスの博士号は必要ありません。Ultralytics ワークフローを標準化するPython 。YOLOv5 トレーニングから YOLO11 やYOLO26モデルへの切り替えも、単一の文字列引数を変更するだけで実現できます。

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolo26n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

統合プラットフォーム

Ultralytics ユーザーは、Ultralytics アクセスできます。これは、データセット管理、自動アノテーション、ワンクリックでのモデルデプロイメントを実現するウェブベースのハブです。このエコシステム統合により、生のリポジトリを管理する場合と比較して、コンピュータビジョン製品の市場投入までの時間を大幅に短縮できます。

YOLO26による将来を見据えた対策

YOLOv5 、コンピュータビジョン分野は急速に進化しています。新規プロジェクトにおいては、Ultralytics 両方の先行モデルに対して大きな優位性を提供します。

2026年1月にリリースされたYOLO26は、前世代の特定の制限に対処します:

  • エンドツーエンドNMS: YOLOv5 ノンマキシマムサプレッション(NMS)後処理を必要とするのに対し、YOLO26はネイティブにエンドツーエンドです。これにより、特にNMS ボトルネックNMS エッジデバイスにおいて、よりクリーンなコードと高速な推論が実現されます。
  • MuSGDオプティマイザ:LLMトレーニングの安定性に着想を得たこの新オプティマイザは、v5/v7SGD 標準的なSGD よりも高速な収束を保証します。
  • エッジ最適化:ディストリビューション焦点損失(DFL)を除去することで、YOLO26 CPU上で最大43%高速化しモバイル展開において優れた性能を発揮します。
  • 小型物体検出の強化:ProgLossとSTAL(アンカー学習を用いた自己学習)により、小型物体YOLOv7 を上回る性能を発揮。これはドローンや航空画像処理タスクにおける重要な要素である。

YOLO26についてさらに詳しく

結論

YOLOv7 は強力なアーキテクチャ上の成果であり、研究者や特定のハイGPU に対して高い精度を提供します。しかし、「bag-of-freebies」アプローチの複雑さに焦点を当てているため、Ultralytics 、変更や展開が困難になる場合があります。

YOLOv5 その性能バランス、使いやすさ、そして検出、セグメンテーション、分類といったタスクにおける驚異的な汎用性により、業界では今なお伝説的存在です。多くのレガシー生産システムにとって、安全で信頼性の高い選択肢となっています。

高精度と使いやすさの両方を求める方には、YOLO26をお勧めします。ユーザーフレンドリーなUltralytics と、NMSやMuSGD最適化といった最先端技術が融合し、アプリケーションの高速性・正確性・将来性を保証します。

参考資料


コメント