YOLOv5 YOLOv10:リアルタイム物体検出器の技術的比較
You Only Look Once(YOLO)アーキテクチャの進化は、コンピュータビジョン史における決定的な物語である。このタイムラインにおける二つの明確なマイルストーンは YOLOv5、信頼性と使いやすさの業界標準であり、 YOLOv10です。後者はポストプロセッシングのボトルネック解消に焦点を当てた学術的ブレークスルーです。本ガイドでは詳細な技術比較を通じて開発者がアプリケーションに適したツールを選択できるよう支援すると同時に、最新のYOLO26が両者の強みを統合する仕組みを探ります。
モデル起源と仕様
パフォーマンス指標を掘り下げる前に、各モデルの背景を理解することが不可欠である。
YOLOv5
著者: Glenn Jocher
組織: Ultralytics
日付: 2020-06-26
GitHub:yolov5
ドキュメント:YOLOv5
YOLOv10
著者: Ao Wang, Hui Chen, Lihao Liu, et al.
所属機関: 清華大学
日付: 2024-05-23
Arxiv:arXiv:2405.14458
GitHub:THU-MIG/yolov10
ドキュメント:YOLOv10
パフォーマンス分析
以下の表は、物体検出の標準的なベンチマークであるCOCO におけるモデルを比較したものです。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv10 、より少ないパラメータで高い平均精度(mAP)を達成し、その新しいアーキテクチャによる効率性の向上を強調している。しかし、YOLOv5 高度にCUDA 、特にGPU 競争力をYOLOv5 。
アーキテクチャと設計
YOLOv5:信頼できる標準
YOLOv5 改良版CSPNetバックボーンとPANetネックを基盤としてYOLOv5 。標準的なアンカーベースの検出ヘッドを利用しており、重複するバウンディングボックスを除去するため、後処理段階で非最大抑制(NMS)を必要とする。
- 強み:非常に成熟したコードベース、サードパーティ製ツールによる幅広いサポート、Raspberry Piなどのエッジデバイス上での安定したデプロイメント。
- 弱点: NMS依存しており、シーン内のオブジェクト数に応じてレイテンシ変動が生じる可能性がある。
YOLOv10:NMS先駆者
YOLOv10 、NMSトレーニングを実現する一貫性のある二重アサインメントを採用することでパラダイムシフトYOLOv10 。これにより、モデルはオブジェクトごとに正確に1つのボックスを予測できるようになり、NMS ステップが不要となった。
- 長所: NMS による高密度シーンでの推論遅延の低減;効率的なランクガイド型ブロック設計による計算冗長性の削減。
- 弱点:新しいアーキテクチャでは、一部のコンパイラ向けに特定のエクスポート設定が必要となる場合がある;v5と比較して、歴史的なコミュニティサポートが少ない。
NMS のNMS
非最大抑制(NMS)は、重複する境界ボックスをフィルタリングする後処理ステップである。効果的ではあるが、順次処理でありCPU上では計算コストが高い。YOLOv10 YOLO26 YOLOv10 これを除去することは、エッジハードウェア上でのリアルタイムアプリケーションにとって極めて重要である。
エコシステムと使いやすさ
開発者にとって最も重要な要素の一つは、モデルを取り巻くエコシステムである。ここで、研究リポジトリと実稼働プラットフォームの区別が明確になる。
Ultralyticsの利点
両モデルは ultralytics Python 、堅牢なツール群へのアクセス権を付与します。
- Ultralytics :ユーザーはUltralytics を使用して、データセットの管理、クラウド上でのトレーニング、モデルのデプロイをシームレスに行うことができます。
- トレーニング効率: Ultralytics トレーニング時のメモリ効率を最適化しており、トランスフォーマーベースの代替モデルと比べて大幅に少ないVRAMで済むことが多い。
- 汎用性: YOLOv10 主に物体検出モデルYOLOv10 、Ultralytics はコアモデル全体で画像セグメンテーション、姿勢推定、および方向性物体検出(OBB)をサポートしています。
コード例
モデル間の切り替えは、モデル名の文字列を変更するだけで簡単に行えます。
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)
# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")
理想的なユースケース
YOLOv5を選択すべき時
- レガシーシステム:既存のパイプラインがYOLOv5 形式を中心に構築されている場合。
- 最も広範な互換性:新しい演算子がまだサポートされていない古い組込みシステムへの展開向け。
- コミュニティリソース:過去5年間に作成された数千ものチュートリアルやサードパーティ製統合機能にアクセスする必要がある場合。
YOLOv10を選択すべき時
- 高密度検出: NMS 処理をNMS ような、人混みの人数計測や交通分析などのシナリオ。
- 厳格なレイテンシ制約:リアルタイムロボティクスや自動運転など、推論レイテンシの1ミリ秒単位が重要な場面。
- 研究:割り当て戦略とアーキテクチャ剪定における最新技術の検証
究極の推奨:YOLO26
YOLOv5 、YOLOv10 NMS YOLOv10 、新たにUltralytics これらの利点を単一の優れたフレームワークに統合しています。
YOLO26にアップグレードする理由 YOLO26はネイティブにエンドツーエンドであり、YOLOv10 が先駆けたNMS設計を採用YOLOv10 堅牢なUltralytics パイプラインで強化されています。
- MuSGDオプティマイザー:大規模言語モデル(LLM)のトレーニング(特にMoonshot AIのKimi K2)に着想を得たこのオプティマイザーは、安定した収束と高速なトレーニングを保証します。
- 性能:エッジコンピューティング向けに最適化され、前世代と比較して最大43%高速CPU を実現。
- 精度: ProgLossとSTAL(セマンティックトークンアラインメント損失)を採用し、従来モデルで弱点となりがちな小物体検出を大幅に改善。
- 完全な汎用性:検出YOLOv10 異なり、YOLO26はセグメンテーション、姿勢推定、分類、およびOBB(物体境界ボックス)のための最先端モデルを提供する。
2026年に開始する新規プロジェクトには、YOLO26が推奨されます。データセットのラベリングから モデルエクスポートまで、最も容易な道筋を提供します。
結論
YOLOv5 YOLOv10 YOLOv5 、いずれもコンピュータビジョンにおける画期的な瞬間をYOLOv10 。 YOLOv5 はAIを民主化し、誰もが利用可能で信頼性の高いものにした一方で、 YOLOv10 はエンドツーエンド処理の技術的限界を押し広げました。しかしこの分野は急速に進化しています。YOLO26の登場により、開発者はUltralytics 信頼性とNMSアーキテクチャの速度のどちらかを選ぶ必要はありません——YOLO26は両方を実現します。
その他の現代的な代替案としては、以下も検討してみてください YOLO11 汎用的なビジョンタスク向け、またはトランスフォーマーベースの検出器であるリアルタイムDETR(RT-DETR)を検討してみてください。