コンテンツにスキップ

YOLO26 vs. YOLOv7: リアルタイム物体検出の進化

コンピュータービジョンの状況は急速に進化しており、アプリケーションに適したモデルを選択することは、速度、精度、およびデプロイの容易さのバランスを取る上で重要です。このページでは、Ultralyticsの最新の最先端モデルであるYOLO26と、2022年にリリースされた高く評価されているレガシーモデルであるYOLOv7の技術的な比較を提供します。

YOLOv7はE-ELANのような重要なアーキテクチャ革新をもたらしましたが、YOLO26はエンドツーエンドの効率性、ネイティブなNMSフリー推論、シームレスなエッジ展開へのパラダイムシフトを象徴しています。以下では、それぞれのアーキテクチャ、パフォーマンス指標、理想的なユースケースを分析し、お客様のニーズに最適なフレームワークを決定するのに役立てます。

性能指標の比較

以下の表は、両アーキテクチャ間のパフォーマンスの違いを強調しています。YOLO26は、特に最適化された設計が際立つCPU環境において、優れた効率性を示します。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

YOLO26: 効率性の新基準

YOLO26は、Ultralyticsによって2026年1月にリリースされ、YOLO11のような以前のバージョンによって確立された堅牢なエコシステムを基盤としています。Glenn JocherとJing Qiuによって設計されたこのモデルは、機械学習オペレーション (MLOps)パイプラインの簡素化とエッジデバイスでの推論強化を目的とした、いくつかの画期的な技術を導入しています。

主要なアーキテクチャ革新

YOLO26の決定的な特徴は、そのエンドツーエンドNMSフリー設計です。Non-Maximum Suppression (NMS)を用いて重複するバウンディングボックスをフィルタリングする必要がある従来の検出器とは異なり、YOLO26は最終的なdetectionを直接出力するように学習されます。これにより、計算コストの高い後処理ステップが不要になり、レイテンシの低減と決定論的な推論時間が実現されます。

さらに、YOLO26はDFL除去を特徴としています。Distribution Focal Lossモジュールを削除することで、モデルアーキテクチャが簡素化されます。この変更はエクスポート互換性にとって重要であり、ONNXCoreMLのような形式にモデルをデプロイしてモバイルアプリケーションに利用することが格段に容易になります。

学習の安定性

YOLO26は、Moonshot AIによる大規模言語モデル(LLM)学習の革新に触発された、確率的勾配降下法とMuonを組み合わせたハイブリッドアプローチであるMuSGDオプティマイザを組み込んでいます。これにより、Transformer学習の安定性がコンピュータビジョンにもたらされます。

パフォーマンスとユースケース

以前の世代と比較して最大43%高速なCPU推論を実現するYOLO26は、Raspberry Piベースのセキュリティシステムやモバイル拡張現実など、強力なGPUを持たないアプリケーションにとって理想的な選択肢です。ProgLossとSTAL(小ターゲット認識型ラベル割り当て)の統合により、その速度にもかかわらず、ドローン画像や衛星分析で一般的な課題である小さなオブジェクトの検出に優れています。

YOLO26についてさらに詳しく

YOLOv7: 「Bag-of-Freebies」の遺産

Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liaoによって執筆されたYOLOv7は、2022年7月にリリースされました。その発表時、YOLOv7は速度と精度において新たなベンチマークを打ち立てました。オリジナルの研究は、彼らのArxiv論文で読むことができます。

アーキテクチャと手法

YOLOv7は、Extended Efficient Layer Aggregation Network (E-ELAN)を導入しました。このアーキテクチャは、最短および最長の勾配パスを制御することで、モデルがより多様な特徴を学習できるようにします。再パラメータ化や補助ヘッド学習など、推論コストを増加させることなく精度を向上させる学習手法である「bag-of-freebies」を多用しました。

現状

YOLOv7は依然として有能なモデルですが、アンカーベースの検出に依存しており、NMS後処理が必要です。現代のリアルタイム推論シナリオでは、これはレイテンシのオーバーヘッドを発生させますが、YOLO26のような新しいモデルではこれをうまく排除しています。さらに、Ultralyticsパッケージが提供するシームレスなツールと比較すると、そのエコシステムサポートの統合は不十分です。

YOLOv7について詳しくはこちら

詳細な技術比較

推論速度とリソース効率

最も重要な違いの1つは、メモリ要件と計算にあります。YOLO26はモデル量子化に最適化されており、最小限の精度損失でINT8デプロイメントをサポートします。DFLの削除とNMSフリーヘッドにより、YOLO26は推論中のメモリ消費量が少なく、産業用IoT (IIoT)デバイスにとって非常に汎用性が高くなります。

対照的に、YOLOv7がNMSに依存しているということは、シーン内のオブジェクト数に応じて推論時間が変動する可能性があることを意味します(NMSは検出数に比例するため)。一方、YOLO26はより一貫した決定論的なタイミングを提供します。

汎用性とタスクサポート

Ultralyticsエコシステムは、ユーザーがタスク間をシームレスに切り替えることを可能にします。YOLOv7は主に検出(一部のポーズブランチは個別の実装で利用可能)で知られていますが、YOLO26は統合されたフレームワークを提供します。

使いやすさとエコシステム

Ultralyticsは開発者エクスペリエンスを優先します。YOLO26モデルの学習には数行のPythonコードしか必要ありませんが、従来のモデルは複雑なシェルスクリプトや設定ファイルに依存することがよくあります。

from ultralytics import YOLO

# Load a pretrained YOLO26 model (recommended for new projects)
model = YOLO("yolo26n.pt")

# Train on a custom dataset with a single command
model.train(data="coco8.yaml", epochs=100)

この統合は、データ管理とクラウド学習を簡素化し、コミュニティによって常に更新されている広範なドキュメンテーションを備えたUltralytics Platformにまで及びます。

結論

YOLO26とYOLOv7を比較する際、選択はプロジェクトのライフサイクル段階によって異なります。2022年頃に構築されたレガシーコードベースを保守している場合は、YOLOv7が依然として有効な選択肢です。しかし、新しい開発においては、YOLO26が優れた選択肢となります。

YOLO26は、より高速で、より小さく、学習が容易な最新のアーキテクチャを提供します。そのNMSフリー設計は長年のデプロイメントの課題を解決し、MuSGDオプティマイザは堅牢な学習収束を保証します。Ultralyticsを選択することで、活発なエコシステムと、市場投入までの時間を短縮するツールも利用できます。

他の最新アーキテクチャの探索に関心のある開発者は、特定のオープンボキャブラリタスクのためにYOLO11またはYOLOEも検討するかもしれません。


コメント