Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 と YOLOv10#

コンピュータビジョンの分野は、ここ数年で目覚ましい進歩を遂げており、YOLO (You Only Look Once) シリーズのモデルがリアルタイム物体検出の最前線を牽引しています。コンピュータビジョンプロジェクトに適したアーキテクチャを選択するには、利用可能なオプションを深く理解する必要があります。この包括的な技術比較では、YOLOv7YOLOv10 という 2 つの画期的なアーキテクチャの主な違いを詳しく説明します。

Link to this sectionモデルの紹介#

どちらのモデルも人工知能の歴史における重要なマイルストーンですが、物体検出の課題解決に対しては根本的に異なるアプローチをとっています。

Link to this sectionYOLOv7: Bag-of-Freebies の先駆者#

中央研究院情報科学研究所の研究者である Chien-Yao Wang 氏、Alexey Bochkovskiy 氏、Hong-Yuan Mark Liao 氏によって 2022 年 7 月 6 日に発表された YOLOv7 は、ニューラルネットワークの最適化方法にパラダイムシフトをもたらしました。彼らの学術論文で詳述され、公式 GitHub リポジトリでホストされている元の研究は、アーキテクチャの再パラメータ化と学習可能な「bag-of-freebies」に重点を置いています。

YOLOv7 は E-ELAN (Extended Efficient Layer Aggregation Network) を活用して、元の勾配パスを破壊することなく、ネットワークが多様な特徴を学習できるように導きます。これにより、学術研究のベンチマークや、標準的なハイエンド GPU に大きく依存するシステムにとって堅牢な選択肢となっています。

YOLOv7の詳細はこちら

Link to this sectionYOLOv10: リアルタイムなエンドツーエンド検出#

清華大学の Ao Wang 氏と彼のチームによって開発された YOLOv10 は、2024 年 5 月 23 日にリリースされました。そのarXiv 出版物および清華大学の GitHub リポジトリで詳しく説明されているように、このモデルは物体検出における長年のボトルネックであった NMS (Non-Maximum Suppression) を排除しました。

YOLOv10 は、NMS を必要としないトレーニングのために一貫したデュアルアサインメントを導入し、後処理パイプラインを根本から変革しました。全体的な効率と精度を重視したモデル設計戦略を展開することで、YOLOv10 は計算の冗長性を削減しています。その結果、極めて低いレイテンシを必要とするエッジデバイスに最適化されたアーキテクチャが実現しました。

YOLOv10について詳しく知る

NMS フリーアーキテクチャ

YOLOv10 において NMS を削除したことで、モデル全体を単一の計算グラフとしてエクスポートできるようになりました。これにより、TensorRTOpenVINO などのランタイムを使用したデプロイメントが大幅に簡素化されます。

Link to this sectionパフォーマンスと指標の比較#

モデルのパフォーマンスを分析する際には、精度、速度、計算負荷の間のトレードオフを評価することが不可欠です。以下の表では、これらのモデルの異なるサイズがどのように比較されているかを示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionトレードオフの分析#

上記のメトリクスは、世代間の明白な格差を明らかにしています。YOLOv7x は 53.1% という非常に強力な mAPval を実現しますが、71.3M 個のパラメータと 189.9B 回の FLOPs を必要とします。対照的に、YOLOv10l はそれ以上の精度 (53.3% mAP) を達成しつつ、パラメータは半分以下 (29.5M)、FLOPs も大幅に少なく (120.3B) 抑えられています。さらに、高度に最適化された YOLOv10n は 1.56ms という驚異的な推論速度を提供し、リアルタイムのビデオ分析やモバイルアプリケーションに最適です。

Link to this section実際のユースケース#

これらのモデル間のアーキテクチャの違いによって、最適なユースケースが決定されます。

Link to this sectionYOLOv7 の活用#

YOLOv7 は、その豊かな特徴表現により、非常に複雑な環境で優れた性能を発揮します。人口密集地域の交通流の監視、衛星画像の分析、または製造自動化における欠陥の特定などのユースケースは、その堅牢な構造再パラメータ化の恩恵を受けています。また、特定の PyTorch 1.12 パイプラインに深く統合されたレガシー環境でも非常に好まれています。

Link to this sectionYOLOv10 の活用#

YOLOv10 の NMS フリーで軽量な設計は、制約のある環境でその真価を発揮します。NVIDIA Jetson Nano や Raspberry Pi などのエッジコンピューティングデバイスに強く推奨されます。その低レイテンシ性能により、スポーツ分析、自律型ドローンのナビゲーション、コンベアベルト上での高速ロボット仕分けといった動きの速いアプリケーションに最適です。

Link to this sectionUltralyticsエコシステムの利点#

両モデルとも強力な学術的ルーツを持っていますが、その真の可能性は、統合された Ultralytics Platform 内で使用されたときに発揮されます。コンピュータビジョンモデルをゼロから開発することは非常に困難ですが、Ultralytics エコシステムは機械学習エンジニアに比類のない体験を提供します。

  • 使いやすさ: Ultralytics Python API は統合されたインターフェースを提供します。わずか数行のコードでモデルのトレーニング、検証、エクスポートが可能であり、一般的な学術リポジトリに伴う複雑な依存関係の悪夢を回避できます。
  • 適切に保守されたエコシステム: Ultralytics は、基盤となるコードが活発に開発されていることを保証します。ユーザーは、ログ記録のための Weights & Biases や、高速な Web デモのための Hugging Face といった一般的な ML ツールとのシームレスな統合の恩恵を受けることができます。
  • メモリ要件: Transformer ベースの物体検出器は、トレーニング中に膨大な CUDA メモリを消費することがよくあります。対照的に、Ultralytics YOLO モデルは必要なメモリがはるかに少ないため、消費者向けのハードウェアでもより大きなバッチサイズを使用できます。
  • Versatility: The Ultralytics pipeline is not restricted to standard bounding boxes. It seamlessly supports pose estimation, instance segmentation, and oriented bounding boxes across supported model families like YOLO11 and YOLOv8.

Link to this section効率的なトレーニングの例#

Ultralytics でトレーニングパイプラインを実行するのは非常に簡単です。YOLOv7 の歴史的な堅牢性を活用する場合でも、YOLOv10 の NMS フリーな速度を活用する場合でも、構文は一貫しています。

from ultralytics import YOLO

# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to an edge-friendly format like ONNX
model.export(format="onnx")

Link to this sectionユースケースと推奨事項#

YOLOv7 と YOLOv10 のどちらを選択するかは、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの優先順位によって異なります。

Link to this sectionYOLOv7を選択すべき時#

YOLOv7 は以下の場合に強力な選択肢となります。

  • 学術的なベンチマーク: 2022年当時の最先端の結果を再現したり、E-ELANやtrainable bag-of-freebies技術の効果を研究したりする場合。
  • 再パラメータ化の研究: 計画的な再パラメータ化畳み込みや複合モデルスケーリング戦略を調査する場合。
  • 既存のカスタムパイプライン: YOLOv7固有のアーキテクチャを中心に構築され、容易にリファクタリングできない高度にカスタマイズされたパイプラインを持つプロジェクト。

Link to this sectionYOLOv10を選択すべき場合#

YOLOv10は以下の場合に推奨されます。

  • NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
  • バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
  • 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section未来:YOLO26 の紹介#

YOLOv7 と YOLOv10 は印象的なマイルストーンですが、AI の最前線は常に前進しています。2026 年 1 月にリリースされた Ultralytics YOLO26 は、すべてエッジおよびクラウドデプロイメントシナリオにおいて、効率性と精度の新たな基準を打ち立てました。

現在、新しいコンピュータビジョンプロジェクトを開始しようとしている場合、YOLO26 が推奨されるアーキテクチャです。これは前モデルのレガシーに基づき、いくつかの画期的なイノベーションを取り入れています。

  • エンドツーエンドの NMS フリー設計: YOLOv10 から着想を得た YOLO26 は、NMS 後処理をネイティブに排除し、決定論的なリアルタイムロボティクスのために超低レイテンシの推論を保証します。
  • 最大 43% 高速な CPU 推論: DFL (Distribution Focal Loss) モジュールを戦略的に削除することで、YOLO26 は GPU を搭載していないエッジコンピューティングハードウェア上での実行を劇的に加速させ、IoT デバイスにとって強力なエンジンとなります。
  • MuSGD オプティマイザー: 最近の大型言語モデルトレーニングの革新から着想を得て、YOLO26 は SGD と Muon のハイブリッドを組み込み、トレーニングパスを安定させ、より高速な収束を保証します。
  • ProgLoss + STAL: これらの高度な損失関数は、古い YOLO 世代の歴史的な弱点であった小物体認識において顕著な改善をもたらします。
  • 比類のない汎用性: YOLO26 は、ポーズトラッキング用の RLE (Residual Log-Likelihood Estimation) や、航空画像における正確な OBB 検出用の特殊な角度損失など、タスク固有の最適化をネイティブに備えています。

速度、精度、デプロイメントの簡素さの究極のバランスを求めるエンジニアにとって、レガシーモデルから YOLO26 への移行は、即座に測定可能な競争上の優位性をもたらします。

コントリビューター

コメント