YOLOv8 YOLOv7：包括的な技術比較

物体検出モデルの進化はめざましく、YOLO （You Only Look Once）ファミリーがリアルタイム性能の先頭を走っている。どちらを選ぶか YOLOv8と YOLOv7とYOLOv7のどちらを選ぶかは、生のメトリクスだけでなく、それらを取り巻くアーキテクチャ哲学、開発者の経験、エコシステムのサポートを理解する必要がある。YOLOv7 リリース時に印象的なベンチマークを設定したのに対し、Ultralytics YOLOv8 使いやすさと汎用性においてパラダイムシフトを導入した。

このガイドは、開発者や研究者がコンピュータビジョンプロジェクトに適したツールを選択するための詳細な技術的分析を提供します。

パフォーマンス分析

パフォーマンスを比較する場合、推論スピードと検出精度のトレードオフを見ることが重要である (mAP).YOLOv8 一般的に優れたバランスを提供し、同程度のモデルサイズでより高い精度を実現し、最新のハードウェアでより速い推論速度を実現します。

次の表は、COCO データセットにおける性能の違いを強調したものである。

モデル	サイズ ^{(ピクセル)}	mAP^値 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

主なポイント

効率：その YOLOv8n(nano）モデルは驚異的な速度（GPU1.47 ms）を達成し、レイテンシが重要なエッジAIアプリケーションに最適です。
精度：YOLOv8xは、競争力のあるパラメータ数を維持しながら、YOLOv7xよりも精度が高くなっています（53.9% vs 53.1% mAP）。
最適化： YOLOv8 モデルは、より優れたパラメータ効率を示し、FLOPあたりの性能を向上させ、推論時のエネルギー消費を低減します。

Ultralytics YOLOv8：現代のスタンダード

2023年初頭にUltralytics リリース、 YOLOv8は、性能だけでなく、柔軟性と使いやすさにおいても最先端（SOTA）を目指して設計された。YOLOv8は、複数のコンピュータ・ビジョン・タスクを単一の合理化されたフレームワークに統合している。

著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
組織Ultralytics
Date: 2023-01-10
GitHubultralytics
ドキュメントYOLOv8 ドキュメント

建築とイノベーション

YOLOv8 、アンカーボックスの手動計算を不要にすることで、学習プロセスを簡素化するアンカーフリー検出メカニズムを導入。これにより、ボックス予測数が減少し、非最大抑制（NMS）が加速されます。

このアーキテクチャは、C2fモジュール（2つの畳み込みによるクロスステージ・パーシャルボトルネック）を特徴としており、高レベルの特徴と文脈情報を、以前の反復よりも効果的に組み合わせている。これにより、勾配の流れがより豊かになり、学習の収束が改善される。さらに、YOLOv8 、より高い精度を得るために、対象性、分類、回帰タスクを独立して処理する、非結合型ヘッドを採用している。

長所

エコシステムとの統合： Ultralytics エコシステムと完全に統合されているため、シンプルなPython APIまたはCLI、シームレスなモデルのトレーニング、検証、デプロイが可能です。
汎用性： オブジェクト検出、インスタンス分割、姿勢推定、画像分類、OBB（Oriented Bounding Boxes）をネイティブサポート。
開発者の経験： 設置は次のように簡単です。 pip install ultralytics、広範なドキュメントと活発なコミュニティサポート GitHub および Discord.

YOLOv8の詳細について。

YOLOv7：効率性のベンチマーク

YOLOv7 、推論コストを増加させることなく精度を向上させるために、"bag-of-freebies"-メソッドに焦点を当てたアーキテクチャの最適化を導入し、リリースと同時に大きな波紋を呼んだ。

著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
組織中央研究院情報科学研究所
Date: 2022-07-06
Arxiv:YOLOv7: トレーナブルな無料のバッグが最新のステート・オブ・ジ・アートを実現
GitHubWongKinYiu/yolov7

アーキテクチャとアプローチ

YOLOv7 E-ELAN（Extended Efficient Layer Aggregation Network）を利用し、ネットワークがより多くの特徴を効率的に学習できるよう、最短および最長の勾配パスを制御する。また、モデルのスケーリング（深さと幅を同時に変更）を重視し、推論中にレイヤーをマージするリパラメータ化技術を導入することで、学習精度を落とすことなくモデルの高速化を実現している。

強みと限界

YOLOv7 、特にGPU デバイス上で優れたスピード対精度比を提供するパワフルなモデルです。その "bag-of-freebies "アプローチにより、デプロイ中もモデルの軽量性が保たれる。しかし、YOLOv8比較すると、統合されたマルチタスクのサポートがすぐに利用できず、リポジトリのクローンや依存関係の管理を含む、より複雑なセットアップ手順を手動で行う必要がある。YOLOv8は主にオブジェクト検出のスペシャリストであり、他のタスクはしばしば別のブランチや実装を必要とする。

YOLOv7もっと知る

徹底的な技術比較

ユーザビリティとエコシステム

最も明確な違いの一つは、使いやすさにある。Ultralytics YOLOv8 標準的なPython ライブラリとしてパッケージ化されている。これは、開発者が最小限のコードで既存のパイプラインに統合できることを意味する。対照的に、YOLOv7 通常スタンドアロンのコードベースとして動作し、クローンして修正する必要がある。

デベロッパー経験

YOLOv8 、わずか3行のPython コードでモデルの学習を可能にします。この合理化されたユーザーエクスペリエンスにより、AIソリューションの市場投入までの時間が大幅に短縮されます。

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100)

タスクの多様性

最近のコンピュータ・ビジョンのプロジェクトでは、バウンディング・ボックス以上のものが必要とされることが多い。

YOLOv8： 真のマルチタスクモデル。検出からセグメンテーションまたはポーズ推定モデルウェイトファイルを変更するだけである、 yolov8n-seg.pt)。
YOLOv7：主に検出に重点を置いている。拡張機能は存在するものの、単一の統一されたフレームワークの中で緊密に統合・維持されているわけではない。

トレーニングの効率と記憶力

YOLOv8 トレーニング中のメモリ要件を最適化する。YOLOv8は、精度を向上させるためにトレーニングの終盤で停止するスマートなデータ増強戦略を実装している。さらに、Ultralytics フレームワークは様々なデータセット形式をサポートし、標準的なデータセットの自動ダウンロードに対応するため、学習効率が大幅に向上する。

Transformerベースのモデルは、しばしば膨大な量のCUDA メモリを必要とし、学習も遅い。それに比べて、YOLOv7 YOLOv8 どちらもCNNベースで効率的だが、YOLOv88の最新のアーキテクチャーの選択（C2fブロックなど）は、多くの場合、コンシューマーグレードのハードウェアで、より速い収束と優れたメモリー効率をもたらす。

実際のユースケース

小売および在庫管理

リテール分析ではスピードが最重要 YOLOv8nは、カメラやNVIDIA Jetsonモジュールのようなエッジデバイス上で動作し、在庫をリアルタイムでtrack ことができます。推論速度が速いため、動いている商品をラグなく正確にカウントすることができます。

自律システムとロボット工学

ロボットは正確な空間把握を必要とします。YOLOv88のセグメンテーション機能により、ロボットは単なるバウンディングボックスではなく、障害物の正確な形状を識別することができます。この汎用性により、ナビゲーションの安全性が向上する。YOLOv7 有能だが、セグメンテーションを実装するには、より多くの労力とバラバラのコードベースを必要とする。

農業

精密農業では、モデルが作物の病気をdetect したり、成長を監視したりする。Ultralytics 整備されたエコシステムは、研究者がこれらのニッチなデータセットに特化した訓練済みの重みとコミュニティのチュートリアルにアクセスできることを意味し、参入障壁を下げる。

結論

YOLOv7 コンピュータビジョンの歴史において尊敬に値する強力なアーキテクチャですが、Ultralytics YOLOv8 現代の開発においてより優れた選択肢です。最先端のパフォーマンス、比類のない多用途性、そして開発者優先のエコシステムの組み合わせにより、学術研究にも企業展開にも最適なソリューションとなっています。

Ultralytics 、最新の効率性と洗練されたアーキテクチャを求める人々のために、次の製品もリリースしました。 YOLO11をリリースした。しかし、v7世代との直接比較では、YOLOv8 堅牢で信頼性が高く、使いやすい勝者として際立っている。

参考資料

YOLO 状況について理解を深めるために、他のモデルとの比較も検討してみてください：

YOLO11 vs YOLOv8 - 最新のイテレーションを比較します。
YOLOv5 vs YOLOv8 - アーキテクチャがv5からどのように進化したかをご覧ください。
YOLOv10 vs YOLOv8 - さまざまなアーキテクチャのアプローチを分析します。
Ultralytics Glossary - mAPやIoUなどの主要な用語を理解します。