YOLOv8 vs. DAMO-YOLO: 包括的な技術比較
コンピュータビジョンの急速に進化する環境において、適切な物体検出アーキテクチャの選択は、精度、速度、展開効率のバランスを取る上で極めて重要です。本ガイドでは、二つの主要モデルについて詳細な技術分析を提供します: Ultralytics YOLOv8。前者は堅牢なエコシステムと使いやすさで知られ、YOLO(NAS)を活用した研究志向のアーキテクチャである。
概要
YOLO は2022年にNASバックボーンや再パラメータ化といった革新的な概念YOLO 、 YOLOv8 (2023年発表)およびさらに新しいYOLO26(2026年発表)は、より成熟した実用段階のエコシステムを提供します。Ultralytics 、多様なハードウェア環境におけるトレーニング、検証、デプロイメントの統合サポートにより、シームレスな「ゼロからヒーローへ」の体験を実現します。一方、YOLO 学術研究を対象としており、より複雑なトレーニングパイプラインを備えています。
パフォーマンス指標
以下の表は、COCO YOLO 性能比較を示しています。YOLOv8 、特に実世界の推論シナリオにおいて、優れた汎用性と速度YOLOv8 。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Ultralytics YOLOv8の概要
YOLOv8 YOLOv8は、Ultralytics によって設計されたYOLO の画期的な進化形であり、幅広いタスクにおいて最も使いやすく正確な最先端モデルUltralytics 。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023年1月10日
- ドキュメント:YOLOv8 ドキュメント
- GitHub:ultralytics/ultralytics
YOLOv8の主な機能
YOLOv8 、物体検出、インスタンスセグメンテーション、姿勢推定、分類、および方向付き境界ボックス(OBB)検出をサポートする統一フレームワークにより、これまでの成功をYOLOv8 。アンカーフリー検出ヘッドと新たな損失関数が学習プロセスを効率化し、高い精度とより速い収束を実現します。
統合されたエコシステム
研究専用リポジトリとは異なり、YOLOv8 Ultralytics によってYOLOv8 。これには、ノーコードでのトレーニングとデータセット管理Ultralytics 、および以下のようなツールとのシームレスな統合が含まれます Weights & BiasesUltralytics などとのシームレスな連携も含まれます。
DAMO-YOLO の概要
YOLO、アリババDAMOアカデミーが開発した物体検出フレームワークである。ニューラルアーキテクチャ検索(NAS)やその他の先進技術を活用することで、低遅延と高精度を重視している。
- 著者: Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang、Xiuyu Sun
- 組織: Alibaba Group
- 日付: 2022年11月23日
- Arxiv:DAMO-YOLO: リアルタイム物体detectデザインに関するレポート
- GitHub:tinyvision/DAMO-YOLO
アーキテクチャと手法
YOLO 、異なる遅延制約に対して最適なバックボーンを見つけるため、マルチスケールアーキテクチャ探索(MAE-NAS)YOLO 。効率的な特徴融合のためにRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)を利用し、学習中に重み付け蒸留プロセスを多用することで、生徒モデルの性能向上を図っている。
詳細な建築比較
これら二つのモデルの設計思想は大きく異なり、その使いやすさと柔軟性に影響を与えている。
バックボーンと特徴融合
YOLOv8 は、豊富な勾配フローとハードウェア効率に最適化されたC2fモジュールを備えた改良版CSPDarknetバックボーンを採用している。この「フリービーの袋」アプローチにより、複雑な探索フェーズを必要とせずに高い性能が保証される。
対照的に、YOLONASに依存して、MobileOneや特定のハードウェア向けに最適化されたCSPベースの変種といったバックボーンを発見する。これにより理論上の効率向上が期待できる一方で、トレーニングパイプラインが複雑化し、平均的な開発者にとって新規タスク向けのアーキテクチャカスタマイズが困難になることが多い。
トレーニング方法
YOLO トレーニングYOLO 複雑な多段階プロセスYOLO 。これには「ZeroHead」戦略と、大規模な教師モデルが生徒モデルを導く重厚な蒸留パイプラインが含まれる。これには膨大な計算資源と複雑な設定が必要となる。
Ultralytics トレーニング効率を最優先します。YOLOv8 および新バージョンのYOLO26)は、カスタムデータに対して単一のコマンドでスクラッチからのトレーニングまたは微調整が可能です。事前学習済み重みの使用により、収束に必要なCUDA 大幅に削減されます。
# Simplicity of Ultralytics Training
yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640
汎用性とタスクサポート
Ultralytics 決定的な利点は、その本質的な汎用性にあります。YOLO 主に物体検出器YOLO に対し、YOLOv8 多様なコンピュータビジョンタスク YOLOv8 。開発者はソフトウェアスタックを変更することなく、自動車の検出から腫瘍のセグメンテーション、あるいは人間の姿勢推定へと切り替えることが可能です。
Ultralytics :YOLOv8 YOLO26YOLOv8 を選ぶべきか?
開発者や企業にとって、モデルの選択はしばしば単純なmAP を超えて、AI製品のライフサイクルmAP 及ぶ。
1. 使いやすさとドキュメント
Ultralytics 業界をリードするドキュメントと Python でUltralytics 。YOLOv8 統合するにはわずか数行のコードで済むのに対し、YOLO 外部サポートが限られている複雑な研究コードベースを操作する必要が生じることがYOLO
2. 展開と輸出
実環境での導入には柔軟性が求められます。Ultralytics ワンクリックでONNX、 TensorRT、 CoreML、および TFLite。これにより、クラウドサーバーからラズベリーパイやNVIDIANVIDIA onのようなエッジデバイスまで、あらゆる環境でモデルを実行できます。
3. 性能バランス
YOLOv8 速度と精度の間で卓越したトレードオフYOLOv8 。さらなる効率性を求めるユーザー向けに、新たにリリースされたYOLO26はこの実績を基盤とし、エンドツーエンドNMS設計を採用しています。これにより非最大抑制(NMS)の後処理が不要となり、推論速度の向上とデプロイロジックの簡素化を実現しています。
未来はNMS
YOLO26はネイティブなエンドツーエンドアーキテクチャを先駆けて実現しました。NMS の必要性を排除しNMS LLMトレーニングに着想を得た新たなMuSGDオプティマイザを採用することでNMS 前世代と比較して最大43%CPU を実現。これにより、エッジコンピューティングにおける最適な選択肢となっています。
理想的なユースケース
- YOLO を選択YOLO :ニューラルアーキテクチャサーチ(NAS)技術を特に研究しているYOLO 、または汎用バックボーンでは不十分な高度に特殊なハードウェア制約があり、複雑な蒸留パイプラインを管理するリソースがある場合。
- Ultralytics YOLOv8を選択すべき場合: 小売分析、自動運転車、医療画像診断、スマートシティアプリケーション向けに、実運用可能なソリューションが必要な場合。その堅牢なエクスポート機能、低メモリ要件、活発なコミュニティサポートにより、信頼性の高い商用展開の標準となっています。
結論
YOLO アーキテクチャ探索において興味深い学術的革新YOLO 一方、 Ultralytics YOLOv8 および最先端のYOLO26が実用的な応用において依然として好まれる選択肢である。使いやすさ、よく整備されたエコシステム、そしてバランスの取れた性能を兼ね備えているため、開発者はモデル実装の詳細に苦労するよりも、現実世界の問題解決に集中できる。
コンピュータビジョンの旅を始めようとする方々は、クイックスタートガイドを参照するか、Ultralytics の機能に今すぐ飛び込んでみましょう。
参考資料
- YOLOv8 比較
- YOLO26とRT-DETRのRT-DETR
- YOLO11について学ぶ YOLO11