Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOv9: リアルタイム物体検出における次の進化#

コンピュータビジョンの分野は急速に進歩しており、新しいアーキテクチャが常に速度と精度の限界を押し広げています。この技術比較では、リアルタイム物体検出の分野で非常に影響力のある2つのモデル、YOLO26YOLOv9の違いを検証します。両モデルとも独自のアーキテクチャ上の革新を提供していますが、次のビジョンプロジェクトに最適なツールを選択するには、そのパフォーマンスのトレードオフ、デプロイ機能、およびハードウェア要件を理解することが重要です。

Link to this sectionYOLO26: エッジ最適化されたパワーハウス#

2026年初頭にリリースされたUltralytics YOLO26は、デプロイの効率性とモデル学習の安定性において世代を超えた飛躍を遂げました。ネイティブなエンドツーエンドのフレームワークとして設計されており、歴史的にエッジAIアプリケーションを悩ませてきたデプロイのボトルネックを直接解決します。

モデル詳細:

Link to this sectionアーキテクチャとイノベーション#

YOLO26は、エンドツーエンドのNMSフリー設計を導入することで、後処理パイプラインを根本的に再設計しました。Non-Maximum Suppression (NMS)の必要性を排除することで、モデルはレイテンシのばらつきを劇的に低減します。これにより、特にONNXApple CoreMLなどのフレームワークにエクスポートする際に、モバイルおよびエッジプラットフォームへのデプロイが大幅に容易になります。

さらに、Distribution Focal Loss (DFL)の削除によりエクスポートプロセスが合理化され、低電力マイクロコントローラーとの互換性が向上しました。学習の安定性を高めるため、YOLO26はStochastic Gradient Descent (SGD)とMuon(大規模言語モデル学習の革新から着想を得た)を組み合わせたハイブリッドのMuSGD Optimizerを統合しています。これにより、困難なデータセット全体で、より高速な収束と、より堅牢な特徴抽出が可能になります。

エッジデバイスでの推論

アーキテクチャの簡素化とDFLの削除により、YOLO26は最大43%高速なCPU推論を実現しており、Raspberry PiNVIDIA Jetson Nanoのようなリソース制限のあるエッジデバイスにとって理想的な選択肢となっています。

ドローン空撮画像のような非常に難易度の高いシーンでの検出のために、YOLO26は更新されたProgLoss + STAL損失関数を活用します。これらは、小物体認識の再現率を著しく向上させます。さらに、インスタンスセグメンテーション用のマルチスケールproto、姿勢推定用のResidual Log-Likelihood Estimation (RLE)、指向性バウンディングボックス (OBB)検出用の専用の角度損失など、タスク固有の拡張機能を備えています。

YOLO26の詳細はこちら

Link to this sectionYOLOv9: プログラマブル勾配情報#

2024年初頭に導入されたYOLOv9は、ニューラルネットワークが学習段階で勾配フローを処理する方法に理論的な進歩をもたらし、パラメータ効率と深い特徴の保持に焦点を当てました。

モデル詳細:

Link to this sectionアーキテクチャと強み#

YOLOv9は、Programmable Gradient Information (PGI)とGeneralized Efficient Layer Aggregation Network (GELAN)というコンセプトを中心に構築されています。これらのコンセプトは、ディープニューラルネットワークでよく見られる情報ボトルネックの問題に対処します。GELANは、順伝播プロセスを通じて重要な情報を保持することで、重みの更新に使用される勾配の信頼性を維持します。このアーキテクチャは高精度を実現し、YOLOv9をPyTorchフレームワークを使用したニューラルネットワーク理論および勾配パス最適化の学術研究において強力な候補としています。

Link to this section制限事項#

その優れたパラメータ効率にもかかわらず、YOLOv9はバウンディングボックスの後処理に従来のNMSを大きく依存しており、これがエッジデバイスでの推論中に計算上のボトルネックを生じさせる可能性があります。さらに、公式リポジトリは物体検出に大きく焦点を当てており、トラッキングや姿勢推定などの専門的なタスクに適応させるには、大幅なカスタムエンジニアリングが必要となります。

YOLOv9の詳細はこちら

Link to this sectionパフォーマンスの比較#

When evaluating these models for real-world deployment, balancing accuracy (mAP), inference speed, and memory usage is critical. Ultralytics models are renowned for their low memory requirements during both training and inference, requiring far less CUDA memory than transformer-based alternatives like RT-DETR.

以下は、COCOデータセットにおけるYOLO26とYOLOv9のパフォーマンスの直接比較です。各列の最大値は太字で強調されています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

注: YOLOv9のCPU速度は、NMSの設定によって大きく変動し、通常はYOLO26のネイティブなNMSフリー実装よりも遅いため、除外されています。

Link to this sectionユースケースと推奨事項#

YOLO26とYOLOv9のどちらを選択するかは、特定のプロジェクト要件、デプロイの制約、およびエコシステムの好みに依存します。

Link to this sectionYOLO26を選ぶべき時#

YOLO26は以下の場合に強力な選択肢となります:

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionYOLOv9を選択すべき場合#

YOLOv9は以下の場合に推奨されます:

  • 情報ボトルネック研究: Programmable Gradient Information (PGI)およびGeneralized Efficient Layer Aggregation Network (GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化の研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に重点を置いた研究。
  • 高精度検出ベンチマーク: アーキテクチャ比較の基準点として、YOLOv9の強力なCOCOベンチマークパフォーマンスが必要とされるシナリオ。

Link to this sectionUltralyticsの利点#

モデルの選択には、単に精度ベンチマークを読むこと以上の要素が含まれます。周囲のソフトウェアエコシステムが、データ収集から本番環境までどれだけ速く進めるかを決定します。

Link to this section使いやすさとエコシステム#

Ultralytics Python APIは、シームレスな「ゼロからヒーローへ」の体験を提供します。複雑なリポジトリをクローンしたり、分散学習スクリプトを手動で設定したりする代わりに、開発者はpipでパッケージをインストールしてすぐに学習を開始できます。アクティブに保守されているUltralyticsエコシステムは、頻繁な更新、Weights & BiasesのようなMLプラットフォームとの自動統合、および広範なドキュメントを保証します。

その他のUltralyticsモデル

Ultralyticsエコシステム内の他のモデルを探索することに関心がある場合は、YOLO11や古典的なYOLOv8の比較も検討してみてください。どちらもカスタムアプリケーションに対して非常に柔軟な対応が可能です。

Link to this sectionビジョンタスク全般の汎用性#

YOLOv9が主に検出エンジンであるのに対し、YOLO26は汎用的なビジョンツールです。単一の統一された構文を使用して、物体検出からピクセル単位の画像セグメンテーションや画像全体の分類へ簡単に切り替えることができます。この汎用性により、異なるコンピュータビジョン機能のために複数の分断されたコードベースを維持するという技術的負債が軽減されます。

Link to this section効率的な学習とデプロイ#

学習効率はUltralyticsの哲学の礎石です。YOLO26は、すぐに利用可能な学習済み重みを利用し、肥大化したビジョントランスフォーマーと比較してメモリ使用量が大幅に低く抑えられています。学習後は、組み込みのエクスポートパイプラインにより、TensorRTTensorFlow Liteなどの最適化されたフォーマットへのワンクリック変換が可能となり、本番環境への道を円滑にします。

Link to this sectionコード例: YOLO26を始める#

YOLO26の実装は非常に簡単です。以下のPythonスニペットは、学習済みモデルの読み込み、カスタムデータでの学習、およびUltralytics APIを使用した推論の実行方法を示しています。

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Uses GPU 0, or use 'cpu' for CPU training
)

# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes and confidences
predictions[0].show()

YOLO26の速度、簡素化されたアーキテクチャ、堅牢なエコシステムを活用することで、チームはこれまで以上に少ない技術的ハードルで、高度なビジョンAIアプリケーションを市場に投入できるようになります。

コメント