Link to this sectionYOLO26 vs YOLOv5: 物体検出における世代交代#
コンピュータビジョンの進化は、スピード、精度、そしてアクセシビリティの絶え間ない追求によって定義されてきました。適切なアーキテクチャの選択は、AIプロジェクトの成功にとって不可欠です。本ガイドでは、Ultralyticsによる2つの記念碑的なリリース、先駆的な YOLOv5 と画期的な YOLO26 を比較します。両者ともリアルタイム 物体検出 の状況に多大な影響を与えてきましたが、その根底にあるテクノロジーは、ニューラルネットワークが視覚データを処理する方法における劇的なパラダイムシフトを反映しています。
Link to this sectionモデルの概要#
アーキテクチャの詳細に入る前に、両モデルの基礎となる詳細を確認しましょう。
YOLO26の詳細:
- 作成者:Glenn JocherおよびJing Qiu
- 組織:Ultralytics
- 日付: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: YOLO26 Documentation
YOLOv5の詳細:
- 作成者:Glenn Jocher
- 組織:Ultralytics
- 日付:2020年6月26日
- GitHub: https://github.com/ultralytics/yolov5
- ドキュメント:YOLOv5ドキュメント
Link to this sectionアーキテクチャの革新#
YOLOv5とYOLO26の間の6年の隔たりは、ディープラーニング研究における大きな飛躍を象徴しています。YOLOv5は、ビジョンモデル向けに PyTorch の広範な利用を普及させ、業界標準となった高度に最適化されたアンカーベースの検出メカニズムを提供しました。しかし、後処理において Non-Maximum Suppression (NMS) に大きく依存していたため、リソースが制限されたデバイスではレイテンシのボトルネックが発生する可能性がありました。
YOLO26は、End-to-End NMS-Free Design によって推論パイプラインを完全に再構築しました。NMS後処理の必要性を排除することで、YOLO26はより高速でシンプルな導入ロジックを実現しています。これはYOLOv10で初めて先駆的に導入された概念ですが、本作で完成されました。さらに、YOLO26は DFL Removal (Distribution Focal Loss) を特徴としており、出力ヘッドを大幅に簡素化しています。これにより、モデルを ONNX や TensorRT といったフォーマットへ書き出す作業が非常にスムーズになり、エッジデバイスや低電力デバイスとの優れた互換性が保証されます。
トレーニング中、YOLO26は最先端の MuSGD Optimizer を採用しています。これは Moonshot AIのKimi K2 に触発されたSGDとMuonのハイブリッドです。これにより、LLMのトレーニング技術がコンピュータビジョンの領域にもたらされ、YOLOv5で使用されていた従来のSGDやAdamWオプティマイザーと比較して、非常に安定したトレーニングと大幅に高速な収束が保証されます。
Link to this sectionパフォーマンスとメトリクス#
モデルを評価する際、mean Average Precision (mAP) と推論速度のバランスが実用性を左右します。YOLO26は、ハイエンドのGPUとエッジCPUの両方に対してネイティブに最適化されています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
ベンチマーク結果は驚異的な改善を示しています。例えば、YOLO26nは YOLOv5nの28.0に対して40.9のmAPを達成しつつ、同時に 最大43%高速なCPU推論 を実現しています。これにより、YOLO26は Raspberry Pi やモバイルデバイスのような組み込み環境への導入において、圧倒的に優れています。NanoスケールでのTensorRT GPU速度ではYOLOv5がわずかに優れていますが、精度のトレードオフを考慮するとYOLO26が圧倒的に有利です。
Link to this sectionトレーニングエコシステムと使いやすさ#
両モデルとも、適切にメンテナンスされたUltralyticsエコシステムの恩恵を大きく受けています。合理化されたPython API、広範なドキュメント、活発なコミュニティサポートにより、「ゼロからヒーロー」への体験を提供します。しかし、YOLO26はトレーニングの効率性を新たなレベルに引き上げています。
Ultralyticsのモデルは、トレーニング中にトランスフォーマーを多用する代替手法よりも一貫して低い CUDAメモリ しか必要としません。YOLO26は、その ProgLoss + STAL 損失関数によってこれをさらに強化しています。これらの進歩は、メモリオーバーヘッドを増大させることなく、小さな物体の認識において著しい改善をもたらします。
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()このシンプルなスクリプトにより、開発者は カスタムデータセット で迅速に反復を行い、データの取り込みから本番環境に対応したモデルへとシームレスに移行できます。
Ultralytics Platform を使用すると、トレーニング済みのYOLO26モデルを、変換コードを1行も書くことなく CoreML や TensorFlow Lite などのフォーマットへ自動的に書き出せます。
Link to this section汎用性と理想的なユースケース#
Link to this sectionYOLOv5を使用すべき場面#
YOLOv5は、レガシーシステムにおいて依然として信頼できる主力製品です。アンカーベースの出力に深く結びついた既存の産業用パイプラインがある場合、あるいは成熟した固定のTensorRTスタックを備えた旧式の NVIDIA Jetson デバイスで推論を実行している場合、YOLOv5は安定した、十分にドキュメント化されたソリューションを提供します。
Link to this sectionYOLO26を使用すべき場面#
YOLO26は、現代のコンピュータビジョンプロジェクトにおける決定的な選択肢です。その汎用性は前モデルをはるかに凌駕しています。YOLOv5が主に検出(後にセグメンテーションが追加)に焦点を当てていたのに対し、YOLO26は Instance Segmentation、Pose Estimation、Image Classification、および Oriented Bounding Boxes (OBB) に対する深くネイティブなサポートを提供します。
YOLO26は、専門的なセマンティックセグメンテーション損失、超高精度なポーズキーポイントのためのResidual Log-Likelihood Estimation (RLE)、および複雑な境界問題を解決するためのOBB向けの高度な角度損失など、タスク固有の改善 を導入しています。
- エッジIoTおよびロボティクス: NMSフリーのアーキテクチャと43%高速なCPU推論により、YOLO26はリアルタイムのロボットナビゲーションやスマートホームカメラに最適です。
- 航空画像: ProgLoss + STALの強化により、駐車場の車両や農地の作物など、ドローンからの小さな物体の検出が大幅に信頼性の高いものとなります。
- リアルタイムビデオ分析: スポーツ放送における選手の追跡であれ、交通流の監視であれ、YOLO26のパフォーマンスバランスはフレームを落とさずに高いリコール率を保証します。
最終的に、アクセシブルで高性能なエコシステムに対するUltralyticsのコミットメントは、YOLOv5からYOLO26への移行が摩擦なく行えることを保証し、研究者から開発者まで同様に最先端の機能を利用可能にします。