YOLOv8 YOLOv7:包括的な技術比較
物体検出モデルの進化はめざましく、YOLO (You Only Look Once)ファミリーがリアルタイム性能の先頭を走っている。どちらを選ぶか YOLOv8と YOLOv7とYOLOv7のどちらを選ぶかは、生のメトリクスだけでなく、それらを取り巻くアーキテクチャ哲学、開発者の経験、エコシステムのサポートを理解する必要がある。YOLOv7 リリース時に印象的なベンチマークを設定したのに対し、Ultralytics YOLOv8 使いやすさと汎用性においてパラダイムシフトを導入した。
このガイドは、開発者や研究者がコンピュータビジョンプロジェクトに適したツールを選択するための詳細な技術的分析を提供します。
パフォーマンス分析
パフォーマンスを比較する場合、推論スピードと検出精度のトレードオフを見ることが重要である (mAP).YOLOv8 一般的に優れたバランスを提供し、同程度のモデルサイズでより高い精度を実現し、最新のハードウェアでより速い推論速度を実現します。
次の表は、COCO データセットにおける性能の違いを強調したものである。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
主なポイント
- 効率:その YOLOv8n(nano)モデルは驚異的な速度(GPU1.47 ms)を達成し、レイテンシが重要なエッジAIアプリケーションに最適です。
- 精度YOLOv8xYOLOv7xを凌ぐ精度(53.9%対53.1%mAP)でありながら、競争力のあるパラメータ数を維持。
- 最適化: YOLOv8 モデルは、より優れたパラメータ効率を示し、FLOPあたりの性能を向上させ、推論時のエネルギー消費を低減します。
Ultralytics YOLOv8:現代のスタンダード
2023年初頭にUltralytics リリース、 YOLOv8は、性能だけでなく、柔軟性と使いやすさにおいても最先端(SOTA)を目指して設計された。YOLOv8は、複数のコンピュータ・ビジョン・タスクを単一の合理化されたフレームワークに統合している。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織Ultralytics
- Date: 2023-01-10
- GitHubultralytics
- ドキュメントYOLOv8 ドキュメント
建築とイノベーション
YOLOv8 、アンカーボックスの手動計算を不要にすることで、学習プロセスを簡素化するアンカーフリー検出メカニズムを導入。これにより、ボックス予測数が減少し、非最大抑制(NMS)が加速されます。
このアーキテクチャは、C2fモジュール(2つの畳み込みによるクロスステージ・パーシャルボトルネック)を特徴としており、高レベルの特徴と文脈情報を、以前の反復よりも効果的に組み合わせている。これにより、勾配の流れがより豊かになり、学習の収束が改善される。さらに、YOLOv8 、より高い精度を得るために、対象性、分類、回帰タスクを独立して処理する、非結合型ヘッドを採用している。
長所
- エコシステムとの統合: Ultralytics エコシステムと完全に統合されているため、シンプルなPython APIまたはCLI、シームレスなモデルのトレーニング、検証、デプロイが可能です。
- 汎用性: オブジェクト検出、インスタンス分割、姿勢推定、画像分類、OBB(Oriented Bounding Boxes)をネイティブサポート。
- 開発者の経験: 設置は次のように簡単です。
pip install ultralyticsの広範なドキュメントと活発なコミュニティサポートがあります。 GitHub および Discord.
YOLOv7:効率性のベンチマーク
YOLOv7 、推論コストを増加させることなく精度を向上させるために、"bag-of-freebies"-メソッドに焦点を当てたアーキテクチャの最適化を導入し、リリースと同時に大きな波紋を呼んだ。
- 著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
- 組織中央研究院情報科学研究所
- Date: 2022-07-06
- Arxiv:YOLOv7:訓練可能なバッグ・オブ・フリービーズが新たな最先端を打ち立てる
- GitHubWongKinYiu/yolov7
アーキテクチャとアプローチ
YOLOv7 E-ELAN(Extended Efficient Layer Aggregation Network)を利用し、ネットワークがより多くの特徴を効率的に学習できるよう、最短および最長の勾配パスを制御する。また、モデルのスケーリング(深さと幅を同時に変更)を重視し、推論中にレイヤーをマージするリパラメータ化技術を導入することで、学習精度を落とすことなくモデルの高速化を実現している。
強みと限界
YOLOv7 、特にGPU デバイス上で優れたスピード対精度比を提供するパワフルなモデルです。その "bag-of-freebies "アプローチにより、デプロイ中もモデルの軽量性が保たれる。しかし、YOLOv8比較すると、統合されたマルチタスクのサポートがすぐに利用できず、リポジトリのクローンや依存関係の管理を含む、より複雑なセットアップ手順を手動で行う必要がある。YOLOv8は主にオブジェクト検出のスペシャリストであり、他のタスクはしばしば別のブランチや実装を必要とする。
徹底的な技術比較
ユーザビリティとエコシステム
最も明確な違いの一つは、使いやすさにある。Ultralytics YOLOv8 標準的なPython ライブラリとしてパッケージ化されている。これは、開発者が最小限のコードで既存のパイプラインに統合できることを意味する。対照的に、YOLOv7 通常スタンドアロンのコードベースとして動作し、クローンして修正する必要がある。
デベロッパー経験
YOLOv8 、わずか3行のPython コードでモデルの学習を可能にします。この合理化されたユーザーエクスペリエンスにより、AIソリューションの市場投入までの時間が大幅に短縮されます。
from ultralytics import YOLO
# Load a model
model = YOLO("yolov8n.pt") # load a pretrained model
# Train the model
results = model.train(data="coco8.yaml", epochs=100)
タスクの多様性
最近のコンピュータ・ビジョンのプロジェクトでは、バウンディング・ボックス以上のものが必要とされることが多い。
- YOLOv8: 真のマルチタスクモデル。検出から セグメンテーション または ポーズ推定 モデルウェイトファイルを変更するだけである、
yolov8n-seg.pt)。 - YOLOv7:主に検出に重点を置いている。拡張機能は存在するものの、単一の統一されたフレームワークの中で緊密に統合・維持されているわけではない。
トレーニングの効率と記憶力
YOLOv8 トレーニング中のメモリ要件を最適化する。YOLOv8は、精度を向上させるためにトレーニングの終盤で停止するスマートなデータ増強戦略を実装している。さらに、Ultralytics フレームワークは様々なデータセット形式をサポートし、標準的なデータセットの自動ダウンロードに対応するため、学習効率が大幅に向上する。
Transformerベースのモデルは、しばしば膨大な量のCUDA メモリを必要とし、学習も遅い。それに比べて、YOLOv7 YOLOv8 どちらもCNNベースで効率的だが、YOLOv88の最新のアーキテクチャーの選択(C2fブロックなど)は、多くの場合、コンシューマーグレードのハードウェアで、より速い収束と優れたメモリー効率をもたらす。
実際のユースケース
小売および在庫管理
リテール分析ではスピードが最重要 YOLOv8nは、カメラやNVIDIA Jetsonモジュールのようなエッジデバイス上で動作し、在庫をリアルタイムでtrack ことができます。推論速度が速いため、動いている商品をラグなく正確にカウントすることができます。
自律システムとロボット工学
ロボットは正確な空間把握を必要とします。YOLOv88のセグメンテーション機能により、ロボットは単なるバウンディングボックスではなく、障害物の正確な形状を識別することができます。この汎用性により、ナビゲーションの安全性が向上する。YOLOv7 有能だが、セグメンテーションを実装するには、より多くの労力とバラバラのコードベースを必要とする。
農業
精密農業では、モデルが作物の病気をdetect したり、成長を監視したりする。Ultralytics 整備されたエコシステムは、研究者がこれらのニッチなデータセットに特化した訓練済みの重みとコミュニティのチュートリアルにアクセスできることを意味し、参入障壁を下げる。
結論
YOLOv7 コンピュータビジョンの歴史において尊敬に値する強力なアーキテクチャですが、Ultralytics YOLOv8 現代の開発においてより優れた選択肢です。最先端のパフォーマンス、比類のない多用途性、そして開発者優先のエコシステムの組み合わせにより、学術研究にも企業展開にも最適なソリューションとなっています。
Ultralytics 、最新の効率性と洗練されたアーキテクチャを求める人々のために、次の製品もリリースしました。 YOLO11をリリースした。しかし、v7世代との直接比較では、YOLOv8 堅牢で信頼性が高く、使いやすい勝者として際立っている。
参考資料
YOLO 状況について理解を深めるために、他のモデルとの比較も検討してみてください:
- YOLO11 vsYOLOv8- 最新のイテレーションを比較。
- YOLOv5 vsYOLOv8- v5からのアーキテクチャの進化をご覧ください。
- YOLOv10 vsYOLOv8- 異なるアーキテクチャ・アプローチを分析。
- Ultralytics 用語集-mAP IoU重要な用語を理解しましょう。