コンテンツにスキップ

YOLOv8 YOLO26:Ultralytics 物体検出の進化

コンピュータビジョン分野はここ数年で目覚ましい進歩を遂げてきた。リアルタイムアプリケーション向けで最も普及しているアーキテクチャには、Ultralytics社が開発したモデルが挙げられる。 Ultralyticsによって開発されたモデルが挙げられる。この包括的なガイドでは、画期的な Ultralytics YOLOv8 と最新鋭Ultralytics 詳細な技術比較を行います。アーキテクチャ、性能指標、最適なユースケースを分析し、導入環境に適したモデルの選択を支援します。

モデルの概要

YOLOv8 、YOLO 重要なマイルストーンです。Ultralytics 共有しています。それは、Python 、高速で正確、かつ驚くほど使いやすいモデルを提供することです。

YOLOv8:汎用性の高い標準

2023年初頭にリリースされたYOLOv8 、YOLO に大幅な改良YOLOv8 、アンカーフリー設計と複数のコンピュータビジョンタスクに対する堅牢なサポートを実現した。

YOLOv8 、優れた性能バランスとUltralytics への深い統合により、業界標準としてYOLOv8 普及しました。オブジェクト検出インスタンスセグメンテーション姿勢推定画像分類をネイティブにサポートします。ただし、後処理には標準的な非最大抑制(NMS)に依存しており、制約の厳しいエッジ環境では遅延のボトルネックを引き起こす可能性があります。

YOLOv8について詳しくはこちら

YOLO26:次世代エッジ・パワーハウス

2026年1月にリリースされたYOLO26は、先行モデルが築いた基盤を継承しつつ、特にエッジAIや低消費電力デバイスにおける現代的な展開シナリオに向けて、積極的に最適化を図っています。

YOLO26はパラダイムシフトをもたらす複数の技術的改良を導入している。特に注目すべきは、エンドツーエンドNMS設計である。これは当初 YOLOv10によって最初に導入されたこのアーキテクチャは、NMS の必要性を排除し、エクスポートパイプラインを大幅に簡素化するとともに、レイテンシのばらつきを低減します。さらに、分布焦点損失(DFL)の削除により検出ヘッドが合理化され、エッジAIハードウェアへの展開が非常に容易になります。

YOLO26についてさらに詳しく

Ultralytics

YOLOv8 YOLO26は非常に強力ですが、以下の選択肢も検討する価値があります YOLO11も検討する価値があります。これは洗練されたアーキテクチャで両世代のギャップを埋めるものです。あるいは YOLOv5 も検討の余地があります。

建築と研修の革新

YOLO26は、YOLOv8ベースラインを大幅に改善するいくつかの内部的な改良をもたらす。

MuSGDによる最適化されたトレーニング

Ultralytics 特長であり、通常、大規模なトランスフォーマーベースのアーキテクチャと比較してはるかに低いメモリ要件を誇ります。 RT-DETRなどの巨大なトランスフォーマーベースのアーキテクチャと比較して、はるかに低いメモリ要件を誇っています。YOLO26は、MuSGDオプティマイザーの導入によりこれをさらに強化しています。大規模言語モデル(LLM)のトレーニング技術(特にMoonshot AIのKimi K2)に着想を得たこの手法は、確率的勾配降下法(SGD)とミューオンのハイブリッドであり、複雑なデータセット全体でより速い収束と極めて安定したトレーニングダイナミクスを実現します。

高度な損失関数

ドローン画像やIoTセンサーなど高精度が求められるタスク向けに、YOLO26はProgLoss + STALを導入した。これらの改良された損失関数は、微小物体認識において顕著な性能向上をもたらす。 さらにYOLO26は、セグメンテーションにおける優れたマスク生成のためのマルチスケールプロトタイプ、より精密な姿勢推定のための残差対数尤度推定(RLE)、オリエンテッドバウンディングボックス(OBB)検出における境界問題を解決する専用角度損失など、タスク固有の改善を全面的に導入しています。

パフォーマンス分析と比較

以下の表は、COCO を用いた2つのモデルの性能差を比較したものです。各サイズカテゴリにおける最高性能値は太字で強調表示されています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLO26n64040.938.91.72.45.4
YOLOv8s64044.9128.42.6611.228.6
YOLO26s64048.687.22.59.520.7
YOLOv8m64050.2234.75.8625.978.9
YOLO26m64053.1220.04.720.468.2
YOLOv8l64052.9375.29.0643.7165.2
YOLO26l64055.0286.26.224.886.4
YOLOv8x64053.9479.114.3768.2257.8
YOLO26x64057.5525.811.855.7193.9

指標の分析

データは世代的な飛躍を示している。YOLO26はYOLOv8 大幅に上回る性能を発揮する。YOLO26 Nano(YOLO26n)モデルは40.9mAP驚異的な精度を達成し、YOLOv8n37.3を大きく上回ると同時に、より少ないパラメータとFLOPsで実現している。

最も顕著な改善点の一つCPU 速度である。最適化されたアーキテクチャとDFLの削除により、YOLO26は最大43%高速CPU を実現する。 ONNXGPU が最大43%向上しました。これにより、YOLO26はRaspberry Piやその他のリソース制約のあるエッジデバイスにおいて比類のない性能を発揮します。一方、 TensorRT を使用したGPU速度は両モデルとも競争力がありますが、YOLO26の全体的なパラメータ効率は、トレーニングと推論の両方においてメモリ使用量の削減につながります。

使いやすさとエコシステム

両モデルとも、Ultralytics を受けています。開発者からは、統一されたAPIによる使いやすさが高く評価されており、モデル名の文字列を変更YOLOv8 特徴です。

ハイパーパラメータ調整実験追跡、新たなデータセットの探索など、あらゆるUltralytics 豊富なリソースを提供します。さらにUltralytics 、モデルの注釈付け、トレーニング、クラウドまたはローカル環境へのシームレスなデプロイを効率的に行うことが可能です。

コード例

トレーニングと推論の開始は非常に簡単です。以下Ultralytics Python を使用した完全な実行可能サンプルです:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=50,
    imgsz=640,
    device="cpu",  # Use '0' for GPU training
)

# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
results[0].show()

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")

デプロイメントの簡素化

YOLO26を CoreMLOpenVINO へのエクスポートは、NMSアーキテクチャにより、エクスポートされたグラフから複雑なカスタム操作が除去されるため、旧モデルに比べて大幅にスムーズです。

理想的なユースケース

適切なモデルを選択することが、プロジェクトの成功を左右します。

YOLO26を選択すべき場合:

  • エッジコンピューティング&ロボティクス: CPU がCPU 高速でNMS 必要としないNMS 、組み込みシステム、モバイルデバイス、自律型ロボットに最適な選択肢NMS 。
  • 航空写真および衛星画像:ProgLoss + STALの実装により、YOLO26は複雑で高解像度の景観における微小物体の検出において明確な優位性を発揮する。
  • 新規プロジェクト:最新の安定版リリースとして、YOLO26はあらゆる新規機械学習パイプラインに推奨されるモデルであり、あらゆるタスクにおいて優れた汎用性を提供します。

YOLOv8保持すべき場合:

  • レガシーインフラストラクチャ:現在の本番パイプラインがYOLOv8の特定の出力テンソルやアンカー機構と強く結合している場合、移行には若干の適応が必要となる可能性があります。
  • 学術的ベースライン: YOLOv8 、従来のアーキテクチャと比較する学術的なコンピュータビジョン研究において、YOLOv8 高被引用かつ安定したベースラインYOLOv8 。

結論として、YOLOv8 リアルタイムビジョンタスクの驚異的な基準をYOLOv8 一方で、YOLO26は可能性の概念を再定義する。CPU上での大幅な効率向上と、LLMに着想を得た革新的なトレーニング最適化手法を融合させることで、YOLO26は開発者が事実上あらゆるハードウェア環境において高精度なAIを展開できることを保証する。


コメント