コンテンツにスキップ

YOLOv5 .YOLOv7:リアルタイム物体検出器の進化

適切な物体検出アーキテクチャの選択には、精度、推論速度、導入の容易さのバランスが求められます。本ガイドでは、 Ultralytics YOLOv5YOLOv7の2つの主要モデルについて詳細な技術比較を行います。アーキテクチャの違い、性能ベンチマーク、最適なユースケースを分析し、コンピュータビジョンプロジェクトにおける適切な選択を支援します。

概要

両モデルとも高性能ではあるが、 YOLOv5 は、使いやすさ、導入の柔軟性、コミュニティサポートにおいて業界標準であり続けています。成熟したエコシステムとUltralytics とのシームレスな統合により、本番環境での優れた選択肢となっています。 YOLOv7は後発ながら、GPU での高精度化を実現するE-ELANなどのアーキテクチャ革新を導入しましたが、Ultralytics が提供する広範なマルチタスク対応や効率的なツール群には及んでいません。

2026年に新規プロジェクトを開始する開発者には、 YOLO26を強く推奨します。このモデルは、ネイティブのエンドツーエンド設計とNMS設計により、速度と精度において両モデルを凌駕します。

Ultralytics YOLOv5: 生産環境の標準

YOLOv5 YOLOv5は、単なる数値的な指標だけでなく、開発者体験を優先することでこの分野に革命をもたらしました。PyTorchでネイティブ実装された最初のYOLO であり、 PyTorchにネイティブ実装された初のYOLOモデルであり、広大な研究者・エンジニアコミュニティに利用可能となりました。「訓練しやすく、導入しやすい」という理念により、自動運転車から産業用検査まで、実世界アプリケーションにおける定番ソリューションとしての地位を確立しました。

Author: Glenn Jocher
Organization:Ultralytics
Date: 2020-06-26
GitHub:ultralytics/yolov5
Docs:YOLOv5 Documentation

YOLOv5について詳しくはこちら

アーキテクチャと設計

YOLOv5 、情報を保持しつつ計算量を削減するため、Focus層(後に6x6畳み込みに置き換えられた)を備えたCSP-Darknet53バックボーンYOLOv5 。特徴融合とマルチスケール予測にはPath Aggregation Network(PANet)ネックを利用する。主なアーキテクチャの特徴は以下の通り:

  • モザイクデータ拡張:4枚の画像を1枚に統合する学習手法。これによりモデルのdetect 向上し、大規模なミニバッチの必要性が低減される。
  • 自動学習型バウンディングボックスアンカー:モデルはトレーニング中にカスタムデータセットの特定の形状に合わせてアンカーボックスを自動的に適応させます。
  • SiLU活性化: より滑らかな勾配伝播のためのシグモイド線形ユニット(SiLU)活性化関数の使用。

主な強み

  • 使いやすさ:簡素化されたAPIと充実したドキュメントにより、開発者はわずか数行のコードでカスタムモデルを学習させることができます。
  • デプロイの汎用性:ONNXTensorRT、CoreML、TFLite、OpenVINO エクOpenVINO 装備し、エッジからクラウドまでのあらゆるターゲットへのシームレスなデプロイOpenVINO 。
  • マルチタスク機能:検出機能に加え、YOLOv5 インスタンスセグメンテーション画像分類 YOLOv5 、多様なビジョンタスクに対応する包括的なツールキットを提供します。

YOLOv7:GPU 限界突破

YOLOv7GPU における速度と精度の限界を押し広げることを目的に設計されました。推論コストを増加させることなく精度を向上させる手法である「bag-of-freebies」戦略を複数導入しており、高性能コンピューティングシナリオにおける有力な選択肢となっています。

著者:王建耀、アレクセイ・ボチコフスキー、廖宏源・マーク・リャオ
所属機関:台湾中央研究院 情報科学研究所
日付:2022年7月6日
Arxiv:2207.02696
GitHub:WongKinYiu/yolov7
ドキュメント:YOLOv7

YOLOv7について詳しくはこちら

アーキテクチャとイノベーション

YOLOv7 効率的なアーキテクチャ設計とモデルの拡張性にYOLOv7 。その主な革新点は拡張効率的層集約ネットワーク(E-ELAN)であり、最短および最長の勾配経路を制御することで、モデルがより多様な特徴を学習できるようにする。

  • モデルスケーリング: YOLOv7 連結ベースのモデル向けに深度と幅を同時に変更する複合スケーリング手法をYOLOv7 、異なるハードウェア制約に対応したアーキテクチャの最適化を実現する。
  • 補助ヘッド(粗から細へ):学習プロセスを導く補助ヘッドを用いて学習を行い、推論時にはこれをメインヘッドへ再パラメータ化することで、デプロイ時の速度低下を防止する。
  • 計画的再パラメータ化:本アーキテクチャは速度と精度のバランスを戦略的に取るため、残差学習を損なう恒等接続を回避しつつ、再パラメータ化畳み込み(RepConv)を戦略的に採用する。

性能ベンチマーク比較

以下の表は、COCO YOLOv7 性能比較を示しています。GPU YOLOv7 GPU mAP YOLOv7 一方、YOLOv5 CPU競争力のある速度YOLOv5 、小型モデルではパラメータ数を大幅に削減しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

結果の分析

  • 効率性:YOLOv5n(Nano)は極めて軽量であり、メモリ容量が1メガバイト単位で重要な制約の厳しいエッジデバイスに最適です。
  • 精度:YOLOv7xはより高い精度を達成する mAP (53.1%)を達成し、YOLOv5x (50.7%)と比較して高いmAPを示した。これは、GPU タスクにおけるE-ELANアーキテクチャの利点を実証している。
  • デプロイメント: YOLOv5 CPU ONNX は十分にYOLOv5 、GPU においても信頼性の高いパフォーマンスを提供します。

エッジのための選択

ラズベリーパイやスマートフォンなどのエッジデバイスでは、メモリ使用量が少なく、TFLite 互換性が実証されているため、YOLOv5nやYOLOv5sが優れた選択肢となることが多い。

トレーニングとエコシステム

最も重要な差別化要因の一つは、モデルを取り巻くエコシステムです。Ultralytics YOLO 、機械学習運用(MLOps)のライフサイクル全体を簡素化する、継続的に維持されるプラットフォームの恩恵を受けています。

Ultralyticsエコシステムの利点

  • 統合プラットフォーム: Ultralytics 、ユーザーがウェブインターフェースからシームレスにデータセットの管理、トレーニング実行の可視化、モデルのデプロイを可能にします。
  • トレーニング効率: YOLOv5 効率的なデータローダーとスマートなキャッシュ機能 YOLOv5 、従来のアーキテクチャと比較してカスタムデータセットでのトレーニング時間を大幅に短縮します。
  • コミュニティサポート:GitHubやDiscord上で数千人の貢献者と活発な議論が行われているため、Ultralytics エッジケースへの解決策を迅速に見つけられます。

コード例:Ultralyticsを使用したトレーニング

Ultralytics バージョンを問わずUltralytics 。モデル名を変更するだけで、YOLOv5、YOLO11、および推奨されるYOLO26の間で切り替えることが可能です。

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model = YOLO("yolov5s.pt")

# Train the model on a custom dataset
# The API handles data downloading and configuration automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a new image
predictions = model("path/to/image.jpg")

未来:なぜYOLO26に移るのか?

YOLOv5 YOLOv7 比較はレガシーシステムを理解する上で価値YOLOv7 、最先端技術は著しく進歩している。2026年1月にリリースUltralytics 、物体検出におけるパラダイムシフトを体現している。

YOLO26についてさらに詳しく

  • ネイティブにエンドツーエンド: YOLOv5 YOLOv7ノンマキシマム抑制(NMS)の後処理を必要とするのとは異なり、YOLO26はネイティブにNMSです。これによりデプロイメントパイプラインが簡素化され、レイテンシの変動が減少します。
  • MuSGDオプティマイザ:LLMトレーニングの革新技術を活用し、多様なデータセットにおいてより安定した収束と堅牢な性能を保証します。
  • 高速化:YOLO26は前世代と比較して最大43%高速CPU を実現し、現代のエッジAIアプリケーションに最適な選択肢です。
  • 汎用性: オリエンテッドバウンディングボックス(OBB)、姿勢推定、セグメンテーションをネイティブにサポートし、ProgLossやSTALといった専用損失関数により小型物体検出性能を向上させます。

結論

YOLOv5 YOLOv7 YOLOv5 、どちらもコンピュータビジョンの歴史において重要な位置YOLOv7 。 YOLOv7 は特定のGPU mAP 最大化する強力な研究者向けツールである。しかし、 YOLOv5 は比類のない使いやすさ、安定性、幅広いデプロイメントサポートにより、多くのユーザーにとって実用的な選択肢であり続けています。

将来を見据えたプロジェクトにおいては、推奨事項は明確です:Ultralytics を採用してください。YOLOv5 ユーザーフレンドリーなエコシステムYOLOv5 速度・精度・簡便性のいずれにおいても先行モデルを凌駕するアーキテクチャ上の革新YOLOv5 融合したものです。

Ultralytics Hubにアクセスして、これらのアーキテクチャをさらに詳しく確認し、次のプロジェクト向けに事前学習済み重みをダウンロードしてください。


コメント