コンテンツにスキップ

YOLOv8 YOLOv7:包括的な技術比較

物体検出モデルの進化はめざましく、YOLO (You Only Look Once)ファミリーがリアルタイム性能の先頭を走っている。どちらを選ぶか YOLOv8YOLOv7とYOLOv7のどちらを選ぶかは、生のメトリクスだけでなく、それらを取り巻くアーキテクチャ哲学、開発者の経験、エコシステムのサポートを理解する必要がある。YOLOv7 リリース時に印象的なベンチマークを設定したのに対し、Ultralytics YOLOv8 使いやすさと汎用性においてパラダイムシフトを導入した。

このガイドは、開発者や研究者がコンピュータビジョンプロジェクトに適したツールを選択するための詳細な技術的分析を提供します。

パフォーマンス分析

パフォーマンスを比較する場合、推論スピードと検出精度のトレードオフを見ることが重要である (mAP).YOLOv8 一般的に優れたバランスを提供し、同程度のモデルサイズでより高い精度を実現し、最新のハードウェアでより速い推論速度を実現します。

次の表は、COCO データセットにおける性能の違いを強調したものである。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

主なポイント

  • 効率:その YOLOv8n(nano)モデルは驚異的な速度(GPU1.47 ms)を達成し、レイテンシが重要なエッジAIアプリケーションに最適です。
  • 精度YOLOv8xYOLOv7xを凌ぐ精度(53.9%対53.1%mAP)でありながら、競争力のあるパラメータ数を維持。
  • 最適化: YOLOv8 モデルは、より優れたパラメータ効率を示し、FLOPあたりの性能を向上させ、推論時のエネルギー消費を低減します。

Ultralytics YOLOv8:現代のスタンダード

2023年初頭にUltralytics リリース、 YOLOv8は、性能だけでなく、柔軟性と使いやすさにおいても最先端(SOTA)を目指して設計された。YOLOv8は、複数のコンピュータ・ビジョン・タスクを単一の合理化されたフレームワークに統合している。

建築とイノベーション

YOLOv8 、アンカーボックスの手動計算を不要にすることで、学習プロセスを簡素化するアンカーフリー検出メカニズムを導入。これにより、ボックス予測数が減少し、非最大抑制(NMS)が加速されます。

このアーキテクチャは、C2fモジュール(2つの畳み込みによるクロスステージ・パーシャルボトルネック)を特徴としており、高レベルの特徴と文脈情報を、以前の反復よりも効果的に組み合わせている。これにより、勾配の流れがより豊かになり、学習の収束が改善される。さらに、YOLOv8 、より高い精度を得るために、対象性、分類、回帰タスクを独立して処理する、非結合型ヘッドを採用している。

長所

YOLOv8の詳細について。

YOLOv7:効率性のベンチマーク

YOLOv7 、推論コストを増加させることなく精度を向上させるために、"bag-of-freebies"-メソッドに焦点を当てたアーキテクチャの最適化を導入し、リリースと同時に大きな波紋を呼んだ。

アーキテクチャとアプローチ

YOLOv7 E-ELAN(Extended Efficient Layer Aggregation Network)を利用し、ネットワークがより多くの特徴を効率的に学習できるよう、最短および最長の勾配パスを制御する。また、モデルのスケーリング(深さと幅を同時に変更)を重視し、推論中にレイヤーをマージするリパラメータ化技術を導入することで、学習精度を落とすことなくモデルの高速化を実現している。

強みと限界

YOLOv7 、特にGPU デバイス上で優れたスピード対精度比を提供するパワフルなモデルです。その "bag-of-freebies "アプローチにより、デプロイ中もモデルの軽量性が保たれる。しかし、YOLOv8比較すると、統合されたマルチタスクのサポートがすぐに利用できず、リポジトリのクローンや依存関係の管理を含む、より複雑なセットアップ手順を手動で行う必要がある。YOLOv8は主にオブジェクト検出のスペシャリストであり、他のタスクはしばしば別のブランチや実装を必要とする。

YOLOv7もっと知る

徹底的な技術比較

ユーザビリティとエコシステム

最も明確な違いの一つは、使いやすさにある。Ultralytics YOLOv8 標準的なPython ライブラリとしてパッケージ化されている。これは、開発者が最小限のコードで既存のパイプラインに統合できることを意味する。対照的に、YOLOv7 通常スタンドアロンのコードベースとして動作し、クローンして修正する必要がある。

デベロッパー経験

YOLOv8 、わずか3行のPython コードでモデルの学習を可能にします。この合理化されたユーザーエクスペリエンスにより、AIソリューションの市場投入までの時間が大幅に短縮されます。

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100)

タスクの多様性

最近のコンピュータ・ビジョンのプロジェクトでは、バウンディング・ボックス以上のものが必要とされることが多い。

  • YOLOv8: 真のマルチタスクモデル。検出から セグメンテーション または ポーズ推定 モデルウェイトファイルを変更するだけである、 yolov8n-seg.pt)。
  • YOLOv7:主に検出に重点を置いている。拡張機能は存在するものの、単一の統一されたフレームワークの中で緊密に統合・維持されているわけではない。

トレーニングの効率と記憶力

YOLOv8 トレーニング中のメモリ要件を最適化する。YOLOv8は、精度を向上させるためにトレーニングの終盤で停止するスマートなデータ増強戦略を実装している。さらに、Ultralytics フレームワークは様々なデータセット形式をサポートし、標準的なデータセットの自動ダウンロードに対応するため、学習効率が大幅に向上する。

Transformerベースのモデルは、しばしば膨大な量のCUDA メモリを必要とし、学習も遅い。それに比べて、YOLOv7 YOLOv8 どちらもCNNベースで効率的だが、YOLOv88の最新のアーキテクチャーの選択(C2fブロックなど)は、多くの場合、コンシューマーグレードのハードウェアで、より速い収束と優れたメモリー効率をもたらす。

実際のユースケース

小売および在庫管理

リテール分析ではスピードが最重要 YOLOv8nは、カメラやNVIDIA Jetsonモジュールのようなエッジデバイス上で動作し、在庫をリアルタイムでtrack ことができます。推論速度が速いため、動いている商品をラグなく正確にカウントすることができます。

自律システムとロボット工学

ロボットは正確な空間把握を必要とします。YOLOv88のセグメンテーション機能により、ロボットは単なるバウンディングボックスではなく、障害物の正確な形状を識別することができます。この汎用性により、ナビゲーションの安全性が向上する。YOLOv7 有能だが、セグメンテーションを実装するには、より多くの労力とバラバラのコードベースを必要とする。

農業

精密農業では、モデルが作物の病気をdetect したり、成長を監視したりする。Ultralytics 整備されたエコシステムは、研究者がこれらのニッチなデータセットに特化した訓練済みの重みとコミュニティのチュートリアルにアクセスできることを意味し、参入障壁を下げる。

結論

YOLOv7 コンピュータビジョンの歴史において尊敬に値する強力なアーキテクチャですが、Ultralytics YOLOv8 現代の開発においてより優れた選択肢です最先端のパフォーマンス、比類のない多用途性、そして開発者優先のエコシステムの組み合わせにより、学術研究にも企業展開にも最適なソリューションとなっています。

Ultralytics 、最新の効率性と洗練されたアーキテクチャを求める人々のために、次の製品もリリースしました。 YOLO11をリリースした。しかし、v7世代との直接比較では、YOLOv8 堅牢で信頼性が高く、使いやすい勝者として際立っている。

参考資料

YOLO 状況について理解を深めるために、他のモデルとの比較も検討してみてください:


コメント