YOLOv10 YOLOv8:リアルタイム物体検出アーキテクチャの進歩
リアルタイム物体検出の技術環境は絶えず進化しており、新たなアーキテクチャが速度、精度、効率の限界を押し広げている。本技術比較では YOLOv10(非最大抑制(NMS)の排除に焦点を当てた学術的ブレークスルー)と Ultralytics YOLOv8を比較検討する。
開発者は、アーキテクチャ上の差異、性能指標、およびトレーニング手法を分析することで、エッジデプロイメントから高スループットのクラウド推論に至るまでのコンピュータービジョンアプリケーション向けにモデルを選択する際に、情報に基づいた判断を下すことができる。
性能指標の比較
以下の表は主要な性能指標の詳細な比較を示しています。YOLOv10 NMS ステップを削除することで競争力のある遅延YOLOv10 一方、YOLOv8 単なる検出を超えて幅広いタスクに適したバランスの取れたプロファイルYOLOv8 留意してください。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10: エンドツーエンドのパイオニア
YOLOv10 清華大学の研究者によって導入され、後処理における非最大抑制(NMS)への依存を排除することを主な目的としている。従来のYOLO 単一オブジェクトに対して複数の境界ボックスを予測し、重複をフィルタリングNMS 依存していた。YOLOv10 トレーニング中に一貫した二重割り当て戦略YOLOv10 、モデルがオブジェクトごとに単一の最適なボックスを直接予測できるようにしている。
アーキテクチャとイノベーション
- NMS:豊富な教師データのための1対多と効率的な推論のための1対1という二重ラベル割り当てを活用することで、YOLOv10 NMSによって引き起こされる推論遅延をYOLOv10 。
- ホリスティック効率設計:本アーキテクチャは軽量分類ヘッドと空間チャネル分離型ダウンサンプリングを採用し、精度を損なうことなく計算負荷(FLOPs)を低減する。
- 大カーネル畳み込み:大カーネル深度方向畳み込みを意図的に用いることで受容野が改善され、微小物体の検出に寄与する。
メタデータ:
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織:清華大学
- 日付: 2024-05-23
- arXiv:arXiv:2405.14458
- GitHub:THU-MIG/yolov10
Ultralytics YOLOv8:堅牢な業界標準
Ultralytics YOLOv8 は、汎用性と使いやすさを追求した成熟した実運用環境対応フレームワークです。標準NMSを活用しつつ、高度に最適化されたアーキテクチャとUltralytics への統合により、安定性、マルチタスク対応、シームレスなデプロイを求める開発者に最適な選択肢となっています。
主要な建築上の強み
- 統一フレームワーク:検出に特化した多くの学術モデルとは異なり、YOLOv8 単一のコードベース内でインスタンスセグメンテーション、姿勢推定、OBB、分類を YOLOv8 サポートする。
- アンカーフリー検出:アンカーベースの手法から離れ、物体の中心位置を直接予測することで、トレーニングパイプラインを簡素化し、異なるデータセット間での汎化性能を向上させる。
- モザイク拡張:高度なオンザフライデータ拡張により、遮蔽や変化する照明条件に対する頑健性が向上します。
- 最適化されたエコシステム:ユーザーUltralytics (旧称HUB)を活用し、データセット管理、モデルトレーニング、TensorRT、CoreML、ONNXなどのフォーマットへのワンクリックエクスポートを実現します。
メタデータ:
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織:Ultralytics
- 日付: 2023-01-10
- GitHub:ultralytics/ultralytics
- ドキュメント:YOLOv8 ドキュメント
エンドツーエンド検知の未来
YOLOv10 NMS YOLOv10 一方、新たにリリースされた YOLO26 はこの基盤をさらに発展させています。YOLO26はネイティブにエンドツーエンドであり、NMS 分布焦点損失(DFL)NMS 排除 CPU 最大43%高速化します。MuSGDオプティマイザーとProgLoss関数を統合し、YOLOv8 YOLOv10 YOLOv8 優れた安定性と小物体検出を実現しています。
ユースケースと実世界アプリケーション
これらのモデル間の選択は、多くの場合、導入環境の具体的な制約条件によって決まります。
YOLOv10の理想的なシナリオ
YOLOv10 、後処理の遅延がボトルネックとなるアプリケーションに特にYOLOv10 。
- 混雑したシーンの解析: 歩行者検出など、物体が密集した状況では、NMS を除去することで、大きく重なり合う有効な検出結果が「脱落」NMS
- 低消費電力エッジデバイス:FLOPsとパラメータ数の削減により、Raspberry PiやJetson Nanoなど、限られた演算能力を持つデバイスへの展開が可能となります。こうした環境では、処理のミリ秒単位の速度が重要となります。
Ultralytics YOLOvYOLOv8の理想的なシナリオ
信頼性とマルチタスク処理を必要とする包括的なAIソリューションにおいては、YOLOv8 優れた選択肢YOLOv8 。
- 複雑な産業用検査: セグメンテーション機能により、単純な境界ボックスではなく精密な欠陥輪郭の抽出が可能となり、製造工程における品質管理に不可欠である。
- スポーツ分析: YOLOv8 ネイティブ姿勢推定をサポートし、track 動きや骨格キーポイントをtrack 生体力学的分析YOLOv8 。
- 小売分析: Ultralytics に統合された堅牢なオブジェクト追跡機能により、顧客動線と在庫の監視に最適です。
使いやすさとエコシステム
YOLOv8 あるいはより新しいYOLO26)のようなUltralytics を選択する最も重要な利点の一つは、その周辺エコシステムである。
Python :開発者はわずか数行のコードでモデルの読み込み、学習、デプロイが可能です。
from ultralytics import YOLO # Load a model model = YOLO("yolov8n.pt") # Train model.train(data="coco8.yaml", epochs=100)詳細なドキュメント: Ultralytics 、ハイパーパラメータの調整から Android エクスポートに至るまで、あらゆる事項に関する詳細なガイドを提供しています。
- メモリ効率: Ultralytics 、多くのCUDA ベースの代替モデル(例: RT-DETRなどの多くのトランスフォーマーベースの代替モデルと比較して、トレーニング中のCUDAメモリ使用量を低減するよう最適化されており、標準的なコンシューマー向けGPUでより大きなバッチサイズを実現します。
結論
両方のアーキテクチャにはそれぞれ明確な利点がある。 YOLOv10 は、NMSの可能性を示す優れた学術的貢献であり、特定の検出専用タスクにおいて高い効率性を提供する。
Ultralytics YOLOv8 は、機械学習ライフサイクル全体を簡素化する維持管理されたエコシステムに支えられた、汎用性の高いオールラウンダーとして際立っています。セグメンテーションや姿勢推定を含む様々なタスクにおいて、プロトタイプから本番環境への迅速な移行を必要とする開発者にとって、依然として最上位の推奨選択肢です。
究極のパフォーマンスを求める方へ、 YOLO26 が究極の選択肢です。YOLOv10 が先駆けたエンドツーエンドYOLOv10 NMS YOLOv10 利点YOLOv10 、Ultralytics システムの堅牢性、マルチタスク対応、使いやすYOLOv10 融合。MuSGDオプティマイザーや強化された損失関数といった革新により、YOLO26は2026年における速度と精度の最先端のバランスを実現します。
参考資料
- 最新のSOTAモデルを探索:YOLO26
- リアルタイムトランスフォーマーについて学ぶ: RT-DETR
- 指標を理解する:mAP IoU
- 効率的なトレーニングガイド:モデルトレーニングのコツ