Link to this sectionYOLOv10とYOLOv7の比較#
過去数年間のコンピュータビジョンの急速な進歩により、リアルタイムアプリケーション向けの効率的なアーキテクチャが次々と生み出されています。YOLOv10とYOLOv7の比較は、この進化における重要な転換点を示しています。YOLOv7は非常に効果的なトレーニング戦略とアーキテクチャの拡張性を導入しましたが、YOLOv10は長年依存してきたNMS(Non-Maximum Suppression)を排除することで、デプロイメントに革命をもたらしました。
両モデルとも、リリース時には物体検出の限界を押し広げました。しかし、現代のUltralyticsエコシステムやYOLO26のような次世代モデルの登場により、今日のAI開発者にははるかに優れたワークフローが提供されています。
Link to this sectionモデルのプロファイルと起源#
これらのモデルの起源を理解することは、そのアーキテクチャ設計の選択と、それらを推進する学術研究に関する貴重なコンテキストを提供します。
Link to this sectionYOLOv10の詳細#
- 著者:Ao Wang, Hui Chen, Lihao Liu 他
- 組織:清華大学
- 日付:2024-05-23
- Arxiv: YOLOv10: Real-Time End-to-End Object Detection
- GitHub:THU-MIG/yolov10
- Docs: Ultralytics YOLOv10 Documentation
Link to this sectionYOLOv7の詳細#
- 著者: Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
- 組織: Institute of Information Science, Academia Sinica, Taiwan
- 日付: 2022-07-06
- Arxiv: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art
- GitHub: WongKinYiu/yolov7
- Docs: Ultralytics YOLOv7 Documentation
Link to this sectionアーキテクチャの革新#
Link to this sectionYOLOv7のアプローチ#
2022年にリリースされたYOLOv7は、勾配経路の最適化に大きく焦点を当てました。E-ELAN(Extended Efficient Layer Aggregation Network)を導入することで、元の勾配経路を破壊することなく、より多様な特徴を学習できるようになりました。さらに、トレーニング中に再パラメータ化技術を利用し、推論時にはそれを融合させて高速な実行速度を維持する「trainable bag-of-freebies」手法を実装しました。これらの目覚ましい最適化にもかかわらず、YOLOv7は後処理で依然としてNMSに大きく依存しており、高密度なシーン解析において遅延にばらつきが生じていました。
Link to this sectionYOLOv10のブレイクスルー#
YOLOv10は、NMSのボトルネックに直接対処しました。清華大学のチームは、トレーニング中に一貫したデュアルアサインメントを導入することで、NMS不要のエンドツーエンド物体検出を実現しました。このデュアルヘッドアプローチでは、トレーニング中に豊富な監視信号を得るための「1対多(one-to-many)」アサインメントを持つブランチと、NMSなしの推論を行うための「1対1(one-to-one)」アサインメントを持つブランチを使用します。このアーキテクチャの変更により、高速なビデオ解析に適した一貫性のある超低推論遅延が保証されます。さらに、YOLOv10は包括的な効率性と精度を重視したモデル設計を採用しており、旧世代で見られた計算の冗長性を排除しています。
NMS後処理を削除したことで、推論速度が向上しただけでなく、AIアクセラレータやNPUといった、カスタムNMSオペレーションのコンパイルが非常に困難なエッジAIハードウェアへのデプロイが大幅に簡素化されました。
Link to this sectionパフォーマンスの比較#
MS COCOデータセット上の未加工の指標を比較すると、世代間のギャップが明らかになります。YOLOv10は、パラメータ数、計算要件、精度の間で、より有利なトレードオフを実現しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
上記のように、YOLOv10xはYOLOv7xの53.1%と比較して54.4%という優れたmAPを達成しながら、パラメータ数は約20%削減されています。さらに、軽量なYOLOv10モデル(NanoおよびSmall)は、卓越したTensorRTデプロイメント速度を提供するため、モバイルデプロイメントにおいて非常に魅力的です。
Link to this sectionUltralyticsエコシステムの利点#
アーキテクチャに関する論文を研究することは有益ですが、現代のコンピュータビジョン開発は、堅牢で十分にメンテナンスされたフレームワークに依存しています。Ultralyticsがサポートするモデルを選択することは、プロトタイプから本番環境へ迅速に移行しようとする開発者にとって大きな利点となります。
Link to this section合理化された開発#
YOLOv10とYOLOv7はどちらも、標準のUltralytics Pythonパッケージからアクセスできます。これにより、数千行のボイラープレートコードがシンプルで直感的なAPIに置き換わり、比類のない使いやすさを提供します。さらに、Ultralytics YOLOモデルは、重厚なTransformerアーキテクチャと比較して、トレーニング中のCUDAメモリ消費量が大幅に少なく、コンシューマー向けのハードウェアでも大きなバッチサイズを使用可能です。
Link to this section比類なき汎用性#
古いリポジトリは多くの場合、境界ボックス検出に限定されていましたが、統合されたUltralyticsフレームワークは、多種多様なタスクをシームレスにサポートしています。インスタンスセグメンテーション、姿勢推定、または指向性境界ボックス(OBB)検出のいずれを行う場合でも、ワークフローは同一です。
Link to this sectionコード例: 一貫したトレーニングワークフロー#
次のコードスニペットは、データ拡張と学習率スケジューリングを自動的に処理するシームレスなトレーニングプロセスを示しています。
from ultralytics import YOLO
# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")
# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Export to ONNX format for rapid deployment
model.export(format="onnx")Link to this sectionユースケースと推奨事項#
YOLOv10とYOLOv7のどちらを選択するかは、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの好みに依存します。
Link to this sectionYOLOv10を選択すべき場合#
YOLOv10は以下の用途に最適です。
- NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
- バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
- 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。
Link to this sectionYOLOv7を選択すべき時#
YOLOv7は以下の場合に推奨されます:
- 学術的なベンチマーク: 2022年当時の最先端の結果を再現したり、E-ELANやtrainable bag-of-freebies技術の効果を研究したりする場合。
- 再パラメータ化の研究: 計画的な再パラメータ化畳み込みや複合モデルスケーリング戦略を調査する場合。
- 既存のカスタムパイプライン: YOLOv7固有のアーキテクチャを中心に構築され、容易にリファクタリングできない高度にカスタマイズされたパイプラインを持つプロジェクト。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this section新しい標準: YOLO26の紹介#
YOLOv10は2024年に大きな飛躍を遂げましたが、コンピュータビジョンの状況は非常に速く変化しています。すべての新規開発において、最新世代モデルであるUltralytics YOLO26を強く推奨します。2026年1月にリリースされたこのモデルは、リアルタイムビジョンAIの頂点であり、YOLOv7およびYOLOv10の両方を大幅に上回っています。
YOLO26は、現代のデプロイメント環境向けに特別に設計された前例のない革新をもたらします。
- エンドツーエンドのNMSフリー設計: YOLOv10で築かれた基盤の上に構築されたYOLO26は、NMS後処理をネイティブに排除し、よりシンプルなデプロイメントパイプラインと一貫した高速推論を実現します。
- CPU推論が最大43%高速化: エッジコンピューティングや専用GPUを搭載していないデバイス向けに大幅に最適化されており、ハードウェアコストの大幅な節約を実現します。
- DFLの削除: Distribution Focal Loss(DFL)が完全に削除されました。これにより、エクスポートロジックが根本的に簡素化され、低電力エッジデバイスやマイクロコントローラーとの互換性が大幅に向上しました。
- MuSGDオプティマイザ: Moonshot AIのKimi K2に着想を得た、SGDとMuonのハイブリッドであるこのオプティマイザは、大規模言語モデル(LLM)のトレーニング技術をコンピュータビジョンに直接取り込み、驚異的に安定したトレーニングダイナミクスとより速い収束を実現します。
- ProgLoss + STAL: これらの高度な損失関数は、ドローン、ロボット工学、スマートシティ監視において重要な、歴史的に困難な領域である小物体認識を著しく改善します。
- タスク固有の改善: YOLO26は単なる検出モデルではありません。専門的なセマンティックセグメンテーション損失、超高精度な姿勢追跡のための残差対数尤度推定(RLE)、およびOBB境界の問題を排除するための専門的な角度損失アルゴリズムが含まれています。
データセットの管理、YOLO26のトレーニング、およびモデルのクラウドへのデプロイメントにおいて最高のエクスペリエンスを得るには、Ultralytics Platformをご検討ください。Python SDKを完璧に補完するノーコードインターフェースを提供しています。
Link to this section実際のユースケース#
適切なアーキテクチャの選択は、使用するハードウェアとアプリケーションの制約に大きく依存します。
Link to this sectionYOLOv7を使用する場合#
YOLOv7は、特定のテンソル構造と深く統合されているレガシーパイプラインを維持する場合や、2022年および2023年の学術的なベンチマークを再現する場合に信頼できる選択肢です。ハイエンドのサーバーGPU上で素晴らしいパフォーマンスを発揮します。
Link to this sectionYOLOv10を使用する場合#
YOLOv10は、厳格で不変の遅延が求められるシナリオで真価を発揮します。NMSフリーであるため、高密度の群衆カウントや製造欠陥検出など、物体の数が激しく変動してもフレームあたりの処理時間を一定に保つ必要がある用途に最適です。
Link to this sectionYOLO26 を使用するタイミング#
YOLO26は、あらゆる新規プロジェクトにとって決定的な選択肢です。基本的なRaspberry Pi上での高度なセキュリティ警報システムのデプロイから、大規模なクラウドベースのビデオ解析の実行まで、優れたCPU速度と高度な小物体検出機能により、旧世代よりもはるかに優れています。
その他の最新アーキテクチャの探索に興味がある開発者のために、RT-DETRのようなTransformerベースの検出器や、前世代の定番であるUltralytics YOLO11についても広範なサポートを提供しています。