Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0とYOLOv7の比較#

リアルタイムコンピュータビジョンの進化は、アーキテクチャの効率性と学習手法の急速な進歩によって特徴づけられてきました。この分野に多大な影響を与えた2つの著名なモデルが YOLOv6-3.0YOLOv7 です。両方のフレームワークは、推論速度と検出精度のバランスをとるための新しい手法を導入し、ハイエンドサーバーGPUからエッジデバイスに至るまでのデプロイメントをターゲットにしています。

この包括的な技術比較では、両者のアーキテクチャ、性能指標、理想的なユースケースを調査します。同時に、現代の Ultralytics Platform と最新の YOLO26 モデルが、これらの基盤となる概念をどのように活用し、卓越した開発者体験を提供しているかについても強調します。

Link to this sectionYOLOv6-3.0: 産業用スループットの最適化#

Meituan のVision AI部門によって開発された YOLOv6-3.0 は、高スループットの産業用アプリケーション向けに明示的に設計されました。ハードウェアアクセラレータでの性能を最大化することに重点を置いており、専用GPUでのバッチ処理が可能な環境において非常に強力な選択肢となります。

  • 著者:Chuyi Li、Lulu Li、Yifei Geng、Hongliang Jiang、Meng Cheng、Bo Zhang、Zaidan Ke、Xiaoming Xu、およびXiangxiang Chu
  • 組織: Meituan
  • 日付:2023-01-13
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

Link to this sectionアーキテクチャの革新#

YOLOv6-3.0 は、GPU上でのメモリアクセスコストを最適化するように設計されたハードウェアフレンドリーなアーキテクチャである EfficientRep バックボーンに依存しています。異なるスケール間での特徴融合を強化するために、このモデルはそのネック部分に Bi-directional Concatenation (BiC) モジュールを導入しています。これにより、ネットワークは以前のイテレーションよりも効果的に複雑な空間階層をキャプチャできるようになりました。

さらに、YOLOv6-3.0 は Anchor-Aided Training (AAT) 戦略を実装しています。このアプローチは、アンカーベース学習の豊富な勾配信号と、アンカーフリー推論の合理化されたデプロイメントの利点を組み合わせることで、後処理の速度を犠牲にすることなく、モデルをより安定して収束させることに寄与しています。

YOLOv6の詳細はこちら

ハードウェアに関する考慮事項

YOLOv6-3.0 はサーバーグレードのGPU(NVIDIA T4 など)で優れた性能を発揮しますが、特定の構造的な再パラメータ化への依存度が高いため、CPUのみで動作するエッジデバイスでは、新しいアーキテクチャと比較してレイテンシが最適化されない場合があります。

Link to this sectionYOLOv7: Bag-of-Freebies の先駆者#

Academia Sinica の研究者によってリリースされた YOLOv7 は、勾配パスの分析と、推論コストを増加させない学習時の最適化に重点を置くという異なるアプローチを採用しました。これは、著者らが「trainable bag-of-freebies(学習可能な無料の特典)」と呼ぶ概念です。

  • 著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
  • 組織: 台湾 中央研究院 資訊科學研究所
  • 日付: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Link to this sectionアーキテクチャの革新#

YOLOv7 の核心は Extended Efficient Layer Aggregation Network (E-ELAN) です。E-ELAN は、元のネットワークトポロジを損なうことなく、異なるレイヤーがより多様な特徴を学習できるようにすることで、勾配パスを最適化します。その結果、トップクラスの mean average precision (mAP) を達成可能な、表現力の高いモデルが実現しました。

また、YOLOv7 はモデルの再パラメータ化を大幅に活用しており、推論中に畳み込み層とバッチ正規化をマージします。これにより、NVIDIA TensorRTONNX などのフレームワークを使用してデプロイする際に、パラメータ数が削減され、フォワードパスが高速化されます。

YOLOv7の詳細はこちら

Link to this sectionパフォーマンスの比較#

MS COCO データセットでこれらのモデルを評価すると、YOLOv6 の超軽量バリアントと、パラメータを重視し精度に焦点を当てた YOLOv7 アーキテクチャの間で明確なトレードオフが見られます。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

データから、YOLOv6-3.0n は卓越した推論速度を提供し、高頻度のビデオ解析に適していることが分かります。対照的に、YOLOv7x は最高の mAP を達成しており、フレームレートよりも検出精度が重視されるタスクで優位に立っています。

Link to this sectionユースケースと推奨事項#

YOLOv6 と YOLOv7 のどちらを選択するかは、特定のプロジェクトの要件、デプロイメントの制約、エコシステムの好みによって異なります。

Link to this sectionYOLOv6を選択すべき時#

YOLOv6は以下の場合に強力な選択肢となります:

  • 産業用ハードウェア対応の展開: モデルのハードウェア認識設計と効率的な再パラメータ化が、特定のターゲットハードウェア上で最適化されたパフォーマンスを提供するシナリオ。
  • 高速なシングルステージ検出: 管理された環境でのリアルタイムビデオ処理において、GPU上の生の推論速度を優先するアプリケーション。
  • Meituanエコシステムの統合: すでにMeituanの技術スタックと展開インフラ内で作業しているチーム。

Link to this sectionYOLOv7を選択すべき時#

YOLOv7は以下の場合に推奨されます:

  • 学術的なベンチマーク: 2022年当時の最先端の結果を再現したり、E-ELANやtrainable bag-of-freebies技術の効果を研究したりする場合。
  • 再パラメータ化の研究: 計画的な再パラメータ化畳み込みや複合モデルスケーリング戦略を調査する場合。
  • 既存のカスタムパイプライン: YOLOv7固有のアーキテクチャを中心に構築され、容易にリファクタリングできない高度にカスタマイズされたパイプラインを持つプロジェクト。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this sectionUltralytics の利点: 未来へ踏み出す#

YOLOv6-3.0 と YOLOv7 は重要なマイルストーンですが、異なるリポジトリをプロダクションパイプラインに統合することは、モデルデプロイメント やハイパーパラメータの調整において課題となることがよくあります。Ultralytics エコシステム は、合理化された統一インターフェースを提供することで、これらの課題を解決します。

Link to this sectionなぜ Ultralytics を選ぶのか?#

  • 使いやすさ: Ultralytics Python API を使用すると、開発者はわずか数行のコードでモデルの読み込み、学習、エクスポートを行うことができます。古いモデルから最新のアーキテクチャへの切り替えも、文字列を1つ変更するだけで済みます。
  • 整備されたエコシステム: Ultralytics は頻繁なアップデート、活発なコミュニティサポート、そして堅牢な ドキュメント を提供しています。
  • 汎用性: バウンディングボックスに主に焦点を当てていた初期のモデルとは異なり、Ultralytics モデルは インスタンスセグメンテーション姿勢推定回転バウンディングボックス (OBB) を含むマルチタスク学習をネイティブでサポートしています。
  • メモリ要件: Ultralytics YOLO モデルは、RT-DETR のような Transformer ベースのアーキテクチャと比較して、学習中のメモリ使用量が少なく、研究者がコンシューマーグレードのハードウェアで効率的に学習することを可能にします。

Link to this sectionYOLO26 へのアップグレード#

パフォーマンスの頂点を求める開発者にとって、YOLO26(2026年1月リリース)は 物体検出 のパラダイムを根本的に変革します。完全に End-to-End NMS-Free 設計 を導入しており、複雑な後処理ロジックを排除することで、エッジデバイスにおけるレイテンシの変動を大幅に低減しています。

YOLO26 の主な革新点は以下の通りです:

  • MuSGD オプティマイザ: SGD と Muon を高度に組み合わせたもので、非常に安定した学習ダイナミクスとより高速な収束を保証します。
  • DFL の削除: Distribution Focal Loss を削除することで、YOLO26 はエクスポートの互換性を単純化し、低電力デバイスでのパフォーマンスを向上させています。
  • ProgLoss + STAL: 小さな物体の認識において顕著な改善をもたらす高度な損失関数です。
  • 比類のない速度: 前世代と比較して最大 43% 高速な CPU 推論を達成しており、Raspberry PiApple CoreML デプロイメントのような組み込みシステムに最適です。

エコシステム内の他の非常に有能なモデルには YOLO11YOLOv8 があり、これらはいずれもレガシーハードウェア統合において優れたパフォーマンスバランスを提供します。

パイプラインを将来に備える

コンピュータビジョンアプリケーションを Ultralytics Platform 上で構築することで、データセットローダーやデプロイメントスクリプトを書き直すことなく、将来の最先端モデルに即座にアクセスできるようになります。

Link to this sectionコード例: 合理化されたトレーニング#

以下のスニペットは、Ultralytics API を使用して最先端の YOLO26 モデルをいかに簡単に学習できるかを示しています。このワークフローはそのまま YOLO11 や YOLOv8 にもシームレスに適用でき、古いリポジトリで通常必要とされるボイラープレートコードを排除しています。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cuda:0",  # Automatically utilizes PyTorch GPU acceleration
)

# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for cross-platform deployment
model.export(format="onnx")

Link to this section結論#

YOLOv6-3.0 と YOLOv7 は、リアルタイム検出という課題の異なる側面をそれぞれ成功裏に解決しました。YOLOv6-3.0 は特殊な産業用 GPU 環境のための強力なツールであり、YOLOv7 は厳密な勾配パスの最適化を通じて高い精度を提供します。

しかし、比類のない汎用性、最小限のデプロイメントの摩擦、そして最先端のパフォーマンスを必要とする現代のアプリケーションにとって、Ultralytics YOLO26 は決定的な選択肢となります。NMSフリーのアーキテクチャ、高度な MuSGD オプティマイザ、そして Ultralytics Platform との深い統合により、開発者は強力でスケーラブルなビジョン AI ソリューションをこれまで以上に迅速にデプロイできます。

コメント