YOLOv7 YOLOv9：包括的な技術比較

YOLO Only Look Once）ファミリーの進化は、ニューラルネットワークアーキテクチャの絶え間ない革新によって特徴付けられ、推論速度、精度、計算効率の間の重要なトレードオフのバランスを取ってきた。この比較では YOLOv72022年のマイルストーンリリースで、学習可能な「フリービーバッグ」で知られる YOLOv9ディープネットワークの情報ボトルネックを克服するためにプログラマブル勾配情報（PGI）を導入した2024年のアーキテクチャである。

パフォーマンスと効率の分析

YOLOv7 YOLOv9 移行は、パラメータ効率の大幅な飛躍を意味する。YOLOv7 、E-ELAN（Extended Efficient Layer Aggregation Networks）を使用したリアルタイム物体検出の限界に挑戦するために最適化されていたが、YOLOv9 、より少ないパラメータと浮動小数点演算（FLOPs）でより高い平均精度mAP）を達成することを可能にするアーキテクチャの変更を導入している。

エッジAIの展開に注力する開発者にとって、この効率性は極めて重要である。下表に示すように、YOLOv9eは 55.6%という圧倒的な mAP達成し、競争力のある計算フットプリントを維持しながら、大型のYOLOv7xを上回っている。逆に、小型のYOLOv9tは、YOLOv7 同じ粒度で明確にはターゲットにしていない層である、制約の多いデバイス向けの軽量ソリューションを提供しています。

モデル	サイズ ^{(ピクセル)}	mAP^値 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

YOLOv7：トレーニング可能なバッグ・オブ・フリービーズの最適化

2022年7月にリリースされたYOLOv7 、YOLO アーキテクチャにいくつかの構造改革を導入し、推論コストを増加させることなく学習プロセスを最適化することに焦点を当てた。

著者: Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao
組織台湾中央研究院情報科学研究所
Date: 2022-07-06
Arxiv:YOLOv7: トレーナブルな無料のバッグが最新のステート・オブ・ジ・アートを実現
GitHubWongKinYiu/yolov7

建築ハイライト

YOLOv7 E-ELAN（Extended Efficient Layer Aggregation Network）を利用し、ネットワークがより多くの特徴を効率的に学習できるように、最短および最長の勾配パスを制御する。また、連結ベースのモデルのスケーリングを普及させ、深さと幅を同時にスケーリングできるようにした。重要な革新は、計画された再パラメータ化された畳み込みで、推論中のモデル・アーキテクチャを合理化し、速度を向上させた。

レガシーステータス

YOLOv7 有能なモデルであることに変わりはないが、Ultralytics エコシステムで見られる新しい最適化のネイティブサポートが欠けている。開発者は、最新のMLOpsツールとの統合が、新しいバージョンと比較してより困難であると感じるかもしれない。

YOLOv7もっと知る

YOLOv9：情報のボトルネックを解消する

2024年初頭に発表されたYOLOv9、ディープラーニングにおける基本的な問題、すなわちデータが連続するレイヤーを通過する際の情報損失に対処している。

著者: Chien-Yao Wang and Hong-Yuan Mark Liao
組織台湾中央研究院情報科学研究所
Date: 2024-02-21
Arxiv:YOLOv9: PGIを使用して学びたいものを学習
GitHubWongKinYiu/yolov9

建築ハイライト

YOLOv9 革新的なコアは、プログラマブル勾配情報（PGI）である。ディープネットワークでは、フィードフォワードの過程で有用な情報が失われ、信頼性の低い勾配が生じることがある。PGIは補助的な監視フレームワークを提供し、重要な情報が損失関数に保存されるようにします。さらに、Generalized Efficient Layer Aggregation Network (GELAN)は、任意のブロッキングを可能にすることでELANの機能を拡張し、パラメータと計算リソースを最大限に活用する。

このアーキテクチャにより、YOLOv9 、乱雑な環境での小さな物体の検出や高解像度の航空画像解析など、複雑な検出タスクに非常に強くなっている。

YOLOv9もっと知る

Ultralytics YOLO11 &YOLOv8）が選ばれる理由

YOLOv7 YOLOv9 素晴らしい学術的業績である一方 Ultralytics YOLOシリーズは YOLOv8と最先端の YOLO11-は、実用的な実際のアプリケーション開発のために特別に設計されています。これらのモデルは、使いやすさ、エコシステムの統合、運用効率を最優先しており、ほとんどのエンジニアリングチームにとって優れた選択肢となっています。

合理化されたユーザー・エクスペリエンス

Ultralytics モデルは、トレーニングパイプラインの複雑さを抽象化する統一されたPython APIに包まれています。オブジェクト検出、インスタンス分割、ポーズ推定、OBB（Oriented bounding box）タスクを切り替えるには、引数を1つ変更するだけでよく、標準的なYOLOv7 YOLOv9 実装にはない汎用性があります。

from ultralytics import YOLO

# Load a model (YOLO11 automatically handles architecture)
model = YOLO("yolo11n.pt")  # Load a pretrained model

# Train the model with a single line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Perform inference on an image
results = model("path/to/image.jpg")

整備されたエコシステム

Ultralytics モデルを選択すると、堅牢なエコシステムへのアクセスが可能になります。これには、クラウドトレーニングとデータセット管理のためのUltralytics HUB（および今後のUltralytics Platform）とのシームレスな統合が含まれます。さらに、活発なコミュニティと頻繁なアップデートにより、次のような最新のハードウェアとの互換性が保証されています。 TensorRTまたは OpenVINOへのエクスポートなど、最新のハードウェアとの互換性を確保しています。

記憶力とトレーニング効率

Ultralytics モデルは、そのトレーニング効率の高さで知られている。変圧器ベースのモデル（例えば RT-DETRなど）とは異なり、Ultralytics YOLO モデルは、最適化されたデータローダーとMosaic拡張機能を利用することで、少ないCUDA メモリー要件で迅速なトレーニング時間を実現します。これにより、開発者はコンシューマーグレードのGPUで最先端のモデルをトレーニングすることができます。

YOLO11の詳細について。

理想的なユースケース

適切なモデルを選択するかどうかは、プロジェクト特有の制約に左右される。

YOLOv9実世界での応用例

研究とベンチマーク： COCO データセットで絶対的に高い報告精度を必要とする学術研究に最適です。
忠実度の高い監視： セキュリティアラームシステムのように、1～2％の精度向上が、より複雑な実装を正当化するシナリオ。

YOLOv77の実際のアプリケーション

レガシーシステム：コードベース全体をリファクタリングすることなく、安定した既知の量を必要とするプロジェクト。

Ultralytics 実世界応用YOLO11

スマートシティスピードと導入のしやすさが最優先される交通流解析にオブジェクトトラッキングを使用。
ヘルスケア：セグメンテーションと検出が同時に必要とされることが多い医療画像解析。
製造： NVIDIA JetsonやRaspberry Piのようなエッジデバイスに品質管理システムを展開し、TFLite ONNX簡単なエクスポートオプションの恩恵を受けています。

結論

YOLOv7 YOLOv9 、コンピュータ・ビジョンの歴史における重要なマイルストーンである。 YOLOv9は、そのPGIアーキテクチャーにより、v7を上回る魅力的なアップグレードを提供し、より優れた効率性と精度を実現している。しかし、多用途で使いやすく、十分なサポートが受けられるソリューションをお探しの開発者の方々には、YOLOv9の方がおすすめです、 Ultralytics YOLO11をお勧めします。その性能のバランス、包括的なドキュメント、マルチタスク機能detect、segment、classify、ポーズ）は、コンセプトから生産への最短経路を提供します。

その他のモデルを見る

特定のコンピュータ・ビジョン・タスクに完璧に適合するものを見つけるには、この他の比較を検討してください：

YOLOv8 YOLOv9比較 - 広く採用されているv8と研究に重点を置いたv9を比較。
YOLOv10 vs. YOLOv9 - エンドツーエンドのYOLOv10がどのように積み上げられているかをご覧ください。
YOLO11 vs. YOLOv8 - 最新のUltralyticsリリースの改善点について理解を深めます。
RT-DETR vs. YOLOv9 - TransformerベースのdetectionとCNNの比較。

YOLOv7 YOLOv9：包括的な技術比較

パフォーマンスと効率の分析

YOLOv7：トレーニング可能なバッグ・オブ・フリービーズの最適化

建築ハイライト

YOLOv9：情報のボトルネックを解消する

建築ハイライト

Ultralytics YOLO11 &YOLOv8）が選ばれる理由

合理化されたユーザー・エクスペリエンス

整備されたエコシステム

記憶力とトレーニング効率

理想的なユースケース

YOLOv9実世界での応用例

YOLOv77の実際のアプリケーション

Ultralytics 実世界応用YOLO11

結論

その他のモデルを見る

コメント