Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10とYOLOv9の比較#

リアルタイムコンピュータビジョンの進化は、スピード、精度、アーキテクチャ効率における絶え間ない躍進によって特徴づけられます。次期デプロイメントに向けた最新ソリューションを評価する際、YOLOv10YOLOv9を比較することは、ディープラーニングのボトルネックを解決するための2つの異なるアプローチを知る上で興味深い洞察を与えてくれます。YOLOv9がトレーニング中の勾配情報フローの最大化に注力しているのに対し、YOLOv10は従来の後処理の課題を完全に取り除く、ネイティブなエンドツーエンド設計を切り拓きました。

本包括的ガイドでは、両者のアーキテクチャ上の革新、パフォーマンス指標、および理想的なユースケースを分析し、開発者や研究者が自身の特定のコンピュータビジョンタスクに最適なモデルを選択できるよう支援します。

Link to this sectionYOLOv10: NMS不要のエンドツーエンドパイオニア#

従来の物体検出器のレイテンシのボトルネックに対処するために開発されたYOLOv10は、Non-Maximum Suppression (NMS)の必要性をネイティブに排除する革新的なエンドツーエンドアーキテクチャを導入しています。

技術的詳細と系譜:

YOLOv10について詳しく知る

Link to this sectionアーキテクチャと強み#

YOLOv10のこの分野に対する最大の貢献は、NMS不要のトレーニングに向けた一貫した二重割り当て戦略にあります。NMSを排除することで、モデルは推論レイテンシを大幅に削減します。特に後処理がパイプライン全体のボトルネックとなり得るエッジデバイスにおいてその効果を発揮します。効率性と精度の両観点から様々なコンポーネントを最適化しており、その結果、速度とパラメータのトレードオフに優れたモデルが実現しました。例えば、YOLOv10-Sバリアントは非常に高速であり、高速なビデオ解析やリアルタイムのロボットナビゲーションに最適です。

Link to this section弱点#

NMS不要の設計はバウンディングボックス検出において画期的ですが、YOLOv10は主に純粋な物体検出器として最適化されています。インスタンスセグメンテーションポーズ推定をネイティブにサポートする新しいエコシステムのような、箱から出してすぐに使える多用途性は欠けています。さらに、初期の実装では、cv2のような操作が推論グラフから完全に最適化されていることを確認するために、慎重なエクスポート処理が必要でした。

YOLOv10のエクスポート

YOLOv10を本番環境向けに準備する際は、必ずTensorRTやONNXなどの最適化された形式にモデルをエクスポートしてください。生のPyTorchの重みをデプロイメントで使用すると、最適化されていないグラフ操作が原因で、期待よりも推論が遅くなる可能性があります。

Link to this sectionYOLOv9: プログラマブル勾配情報#

YOLOv10以前に、YOLOv9はディープニューラルネットワークに固有の情報ボトルネック問題を解決し、高度に効率的なパラメータ利用を可能にする新しいアーキテクチャのコンセプトを導入しました。

技術的詳細と系譜:

YOLOv9の詳細はこちら

Link to this sectionアーキテクチャと強み#

YOLOv9 introduces Programmable Gradient Information (PGI) alongside the Generalized Efficient Layer Aggregation Network (GELAN). PGI ensures that crucial target information is not lost as data passes through the network's deep layers, generating reliable gradients for weight updates. GELAN maximizes the efficiency of the network's parameters. Together, these innovations allow YOLOv9 to achieve incredibly high mean Average Precision (mAP) on the MS COCO dataset, often outperforming heavier models while using fewer FLOPs. It is an exceptional model for researchers focused on maximizing theoretical accuracy metrics.

Link to this section弱点#

高い精度にもかかわらず、YOLOv9は依然として標準的なNMS後処理に依存しています。つまり、ニューラルネットワークの動作は高速であっても、最終的なバウンディングボックスのフィルタリングはシーン内の物体の密度に応じて可変のレイテンシを引き起こす可能性があることを意味します。さらに、トレーニングプロセスは後のモデルと比較して非常にメモリを消費する場合があり、カスタムデータセットのファインチューニングには、より強力なGPUリソースが必要となります。

Link to this sectionパフォーマンスの比較#

以下の表は、両モデルのコア指標を示しています。YOLOv10は通常TensorRTを介して低レイテンシを達成する一方、YOLOv9はその最大構成で精度の限界を押し上げている点に注目してください。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Link to this section次世代: なぜYOLO26が究極の推奨モデルなのか#

YOLOv9とYOLOv10は素晴らしいマイルストーンですが、機械学習の世界は急速に変化しています。現代の本番環境では、開発者はUltralytics Platformの統合され、適切に維持管理されたエコシステムにますます依存するようになっています。2026年現在、研究と企業の両方にとっての明確な推奨事項は、新たにリリースされたYOLO26です。

YOLO26は、前身モデルの基本コンセプトを受け継ぎつつ、洗練されたユーザー体験、シンプルなAPI、そして巨大なTransformerベースのアーキテクチャと比較してトレーニング中のメモリ要件が格段に低い点を通じて、それらを高めています。

Link to this sectionYOLO26 における主な革新#

  • エンドツーエンドのNMS不要設計: YOLOv10の画期的な成果の上に構築されたYOLO26は、ネイティブなエンドツーエンドであり、NMS後処理を完全に排除することで、よりシンプルなデプロイメントと極めて決定論的なレイテンシプロファイルを実現します。
  • 最大43%高速なCPU推論: Edge AI向けに最適化されており、専用のGPUを持たない組み込みシステムに最適です。
  • MuSGDオプティマイザ: SGDとMuon(大規模言語モデルの最適化から着想を得た)の画期的なハイブリッドであり、非常に安定したトレーニングプロセスと驚異的に高速な収束時間を保証します。
  • DFLの削除: Distribution Focal Lossを削除することで、YOLO26はモデルのエクスポートプロセスを簡素化し、低電力デバイスや様々なエッジデプロイメントフレームワークとの互換性を劇的に向上させています。
  • タスク固有の拡張: 特化した単一タスクの検出器とは異なり、YOLO26は用途の広い強力なツールです。画素レベルの精度を洗練させるためのセマンティックセグメンテーション損失、完璧なポーズ推定のためのResidual Log-Likelihood Estimation (RLE)、そしてOBB(指向性バウンディングボックス)の境界問題を解決するための専用の角度損失を利用しています。
Ultralyticsエコシステムの利点

YOLO11やYOLO26のようなUltralyticsモデルを選択することで、他に類を見ない使いやすさを享受できます。アクティブな開発、活気あるコミュニティ、そしてモデルがOpenVINOやCoreMLといった最新の推論エンジンと常に互換性を保つための頻繁なアップデートへのアクセスが可能になります。

Link to this section実践的な実装#

これらのモデルのトレーニングとデプロイメントは、Python SDKを利用することで簡単に行えます。以下の例は、Ultralyticsエコシステムの非常に効率的なトレーニングプロセスを活用する方法を示しており、ハイパーパラメータのスケジューリングと最適なメモリ割り当てを自動的に処理します。

from ultralytics import YOLO

# Load the recommended state-of-the-art model
model = YOLO("yolo26n.pt")  # Also compatible with 'yolov10n.pt' or 'yolov9c.pt'

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0, batch=16)

# Run ultra-fast inference
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

Link to this sectionユースケースと推奨事項#

YOLOv10とYOLOv9のどちらを選択するかは、プロジェクト固有の要件、デプロイメントの制約、およびエコシステムの好みによって決まります。

Link to this sectionYOLOv10を選択すべき場合#

YOLOv10は以下の用途に最適です。

  • NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
  • バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
  • 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。

Link to this sectionYOLOv9を選択すべき場合#

YOLOv9は以下の場合に推奨されます:

  • 情報ボトルネック研究: Programmable Gradient Information (PGI)およびGeneralized Efficient Layer Aggregation Network (GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化の研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に重点を置いた研究。
  • 高精度検出ベンチマーク: アーキテクチャ比較の基準点として、YOLOv9の強力なCOCOベンチマークパフォーマンスが必要とされるシナリオ。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section結論#

YOLOv9とYOLOv10にはそれぞれ独自の利点があります。YOLOv9は、ネットワークのパラメータ効率と理論的な勾配フローを最大化する証明であり、トップクラスの精度をもたらします。一方、YOLOv10は、NMSによるレイテンシのペナルティを伴わないエンドツーエンドバウンディングボックス検出の学術的なパイオニアとしての役割を果たしています。

しかし、パフォーマンス、汎用性、使いやすさの完璧なバランスを求める開発者にとって、最新モデルへのアップグレードは最優先事項です。高度なMuSGDオプティマイザ、優れた小物体検出のためのProgLoss + STAL機能、そして包括的なマルチタスクサポートを備えたYOLO26は、あらゆる現実世界のコンピュータビジョンの課題に対する決定的な最先端ソリューションです。

コメント