YOLO . YOLO26:リアルタイム物体検出における技術対決
コンピュータビジョンの進化は、効率性、速度、精度の絶え間ない追求によって推進されてきた。この分野で特に注目されるのは、アリババグループが開発したYOLO、Ultralytics最新バージョンである最先端のYOLO26である。YOLO 2022年にニューラルアーキテクチャ検索(NAS)に画期的な革新YOLO 一方、YOLO26は2026年、エッジデプロイメントと生産スケーラビリティに特化したエンドツーエンドNMS設計により、この分野の新たな地平を切り開いた。
本ガイドでは、これら2つのモデルについて、アーキテクチャ、性能指標、実世界のアプリケーションへの適合性を比較しながら、詳細な技術分析を提供します。
YOLO: 神経アーキテクチャ探索の革新
アリババのDAMOアカデミーが開発YOLO(Distillation-Enhanced Neural Architecture Search-basedYOLO)は、特定の遅延制約下で性能を最大化するため、検出バックボーンの設計を自動化することに焦点を当てている。
主要なアーキテクチャ機能
YOLO 、いくつかの先進技術によって他社と差別化YOLO :
- ニューラルアーキテクチャ探索(NAS):手動設計されたバックボーン(CSPDarknetなど)とは異なり、YOLO MAE-NAS(効率的なニューラルアーキテクチャ探索の自動化手法)YOLO 最適な構造を発見する。これにより、浮動小数点演算(FLOPs)と精度のトレードオフに特化して調整されたネットワークトポロジーが実現される。
- RepGFPN:一般化特徴ピラミッドネットワーク(GFPN)と再パラメータ化を組み合わせたヘビーネック設計。これにより異なるスケール間での効率的な特徴融合が可能となり、様々なサイズの物体の検出精度が向上する。
- ZeroHead:推論時の計算負荷を軽減する簡素化された検出ヘッド。
- AlignedOTA: トレーニング中に分類タスクと回帰タスクの間のずれを解決する動的ラベル割り当て戦略。
性能と制限事項
YOLO 2022年に大きな飛躍をYOLO 、 YOLOv6 や YOLOv7 といった従来モデルを特定のベンチマークで上回りました。しかし、複雑なトレーニングパイプライン(特に大規模な教師モデルを用いた蒸留フェーズの必要性)への依存は、カスタムデータセットで迅速な反復開発を必要とする開発者にとって煩雑な作業となり得ます。さらに、そのRepGFPNは強力である一方、合理化された現代的なアーキテクチャと比較するとメモリ集約的である可能性があります。
DAMO-YOLOの詳細:
- 著者:徐賢哲、江一琪、陳偉華、黄一倫、張元、孫秀宇
- 組織:アリババグループ
- 日付: 2022年11月23日
- Arxiv:2211.15444v2
- GitHub:YOLO
Ultralytics :エンドツーエンドのエッジ革命
2026年1月にリリースされたUltralytics 、 YOLOv8 および YOLO11の遺産を継承しつつ、検出処理の方法に根本的な変革をもたらします。高いベンチマークスコアだけでなく、クラウドサーバーからリソース制約のあるIoTデバイスに至るまで、あらゆる環境での実用的かつシームレスな展開を目的に設計されています。
画期的な建築
YOLO26は、従来のアンカーベースまたはアンカーフリー検出器とは一線を画す、いくつかの最先端の進歩を取り入れています:
- NMS:おそらく最も重要な変更点は、非最大抑制(NMS)の廃止である。学習中に1対1対応戦略を採用することで( YOLOv10)で先駆的に採用された1対1マッチング戦略を採用することで、モデルは最終予測を直接出力します。これにより、混雑したシーンではボトルネックとなることがNMS による遅延のばらつきが解消されます。
- MuSGDオプティマイザー:Moonshot AIのKimi K2のような大規模言語モデル(LLM)トレーニングの革新に着想を得たYOLO26は、SGD 組み合わせたハイブリッドオプティマイザーを採用しています。これによりコンピュータビジョン訓練に前例のない安定性がもたらされ、収束が加速します。
- DFL除去:ディストリビューション焦点損失を除去することで、出力層が簡素化されます。これにより、 ONNX や TensorRT へのエクスポートが大幅に簡潔になり、エッジデバイスや低消費電力マイクロコントローラーとの互換性が大幅に向上します。
- ProgLoss + STAL:プログレッシブ損失とソフトターゲットアンカーラベリング(STAL)の統合は、航空画像やロボティクスにおいて重要な要件である小規模物体検出において、堅牢な改善をもたらす。
展開の優位性
YOLO26は高速化を追求して設計されています。前世代と比較して最大43%高速CPU を実現し、Raspberry Pi、モバイルCPU、Intel PC上で動作するアプリケーションに最適な選択肢です。
YOLO26の詳細:
- 著者:グレン・ヨーカーとチン・チウ
- 組織: Ultralytics
- 日付: 2026年1月14日
- ドキュメント:YOLO26 ドキュメント
- GitHub:ultralytics
比較性能分析
以下の表は、様々なYOLO 性能を比較したものです。YOLO26は優れた効率性を示し、NMS 効果CPU 、大幅にmAP を達成しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
レイテンシ優位性
The CPU ONNX の速度は、NMS圧倒的な優位性を浮き彫りにしています。後処理ステップを排除することで、YOLO26は推論時間が確定的で一貫して低いことを保証し、これはリアルタイム動画解析において極めて重要です。
Ultralyticsの利点
YOLO アーキテクチャ探索に関する興味深い学術的知見YOLO 一方、Ultralytics 現代の開発ワークフロー向けに設計された包括的なソリューションを提供します。
1. 使いやすさとエコシステム
YOLO複雑さは、参入障壁となり得る。一方、Ultralytics 「ゼロからヒーローへ」Ultralytics 。Python 、開発者はモデルを数分で読み込み、トレーニングし、デプロイできる。Ultralytics 、クラウドトレーニング、データセット管理、自動アノテーションツールを提供することで、これをさらに簡素化する。
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100)
2. タスクの汎用性
YOLO 主に物体検出アーキYOLO 。一方、Ultralytics マルチタスクの強力なツールです。単一のフレームワークで以下をサポートします:
- インスタンスセグメンテーション:セマンティックセグメンテーション損失などのタスク固有の改善を含む。
- 姿勢推定:高精度キーポイントのための残差対数尤度推定(RLE)の活用
- OBB:方向付き境界ボックス(Oriented Bounding Boxes)の特殊角度損失。衛星画像解析に不可欠。
- 分類:高速画像分類。
3. 訓練効率と記憶
YOLO26はコンシューマー向けハードウェア向けに最適化されています。MuSGDオプティマイザーなどの技術により、メモリを大量に消費するトランスフォーマーハイブリッドや従来のNASアーキテクチャと比較して、より大きなバッチサイズでの安定したトレーニングが可能となります。このAIトレーニングの民主化により、最先端モデルをファインチューニングするために企業向けH100クラスターを必要としません。
理想的なユースケース
適切なモデルの選択は具体的な制約条件に依存しますが、ほとんどの生産シナリオではYOLO26が最高の投資対効果を提供します。
- YOLO を選択YOLO :ニューラルアーキテクチャ検索手法を専門に研究している場合、またはtinyvisionコードベースを基盤とした既存のパイプラインを構築している場合。
- 以下のUltralytics YOLO26を選択してください:
- エッジデプロイメント: ラズベリーパイ、モバイルデバイス、またはNMS設計が大幅な高速化を実現するCPU上で実行する必要があります。
- 迅速な開発:複雑なTFLite 、CoreML TFLite CoreML 形式への学習、検証、エクスポートが容易なモデルが必要です。
- 複雑な視覚タスク:あなたのプロジェクトでは、バウンディングボックスだけでなく、物体のセグメンテーションや人間の姿勢追跡などが必要です。
- 長期的なメンテナンス:活発なコミュニティによるサポート、頻繁な更新、そして包括的なドキュメントを備えたモデルが必要です。
結論
YOLO YOLO26YOLO 、いずれも物体検出における重要なマイルストーンである。YOLO 自動アーキテクチャ探索の可能性YOLO 、2022年当時の限界を押し広げました。しかし、2026年以降においてはYOLO26が決定的な選択肢となります。NMS を解決し、CPU 向けに最適化、さらにMuSGDのような先進的な学習手法を統合することで、Ultralytics 高速かつ高精度であるだけでなく、大幅に使いやすくなったモデルUltralytics
堅牢で将来性のあるコンピュータビジョンアプリケーションの構築を目指す開発者にとって、Ultralytics は成功に必要なツール、モデル、サポートを提供します。
他の高性能アーキテクチャを探求したい方は、以下を検討してみてください YOLO11 汎用検出用、あるいは RT-DETR などのトランスフォーマーベースのアプリケーションを検討してみてください。