Link to this sectionYOLOv10とYOLOv5の比較#
適切なニューラルネットワークアーキテクチャを選択することは、本番環境でコンピュータビジョンパイプラインを成功させるために非常に重要です。本ページでは、リアルタイム物体検出の進化において非常に影響力の大きい2つのモデル、YOLOv10とYOLOv5を比較し、技術的な観点から詳細に分析します。両モデルともAIコミュニティに多大な影響を与えてきましたが、ディープラーニングのアーキテクチャ設計における異なる時代と哲学を体現しています。
本ガイドでは、平均精度(mAP)、推論レイテンシ、パラメータ効率、エコシステムのサポートといった観点からこれらのアーキテクチャを評価し、デプロイのニーズに最適なモデルを選択できるよう支援します。
Link to this sectionモデルの概要#
Link to this sectionYOLOv10: リアルタイム・エンドツーエンド物体検出#
清華大学の研究者によって開発されたYOLOv10は、後処理の必要性を排除するという物体検出への斬新なアプローチを導入しました。
- 著者: Ao Wang, Hui Chen, Lihao Liu, 他
- 組織: 清華大学
- 日付: 2024-05-23
- 研究論文: arXiv:2405.14458
- ソースコード: YOLOv10 GitHubリポジトリ
YOLOv10の決定的なブレイクスルーは、そのエンドツーエンドのNMSフリー設計にあります。これまでYOLOモデルは、冗長なバウンディングボックスを除去するために非最大値抑制(NMS)に依存していました。YOLOv10はNMSフリー学習のために一貫した二重割り当てを利用しており、これにより推論レイテンシの変動が大幅に削減され、デプロイのロジックが簡素化されます。さらに、このアーキテクチャは効率性と精度を重視した全体的な設計を採用しており、計算の冗長性を減らすためにさまざまなコンポーネントが徹底的に最適化されています。
Link to this sectionYOLOv5:ユーザビリティの業界標準#
Ultralytics PyTorchリポジトリの立ち上げ直後にリリースされたYOLOv5は、オープンソースのビジョンAIフレームワークに対して開発者が期待するものを再定義しました。現在も、世界で最も広くデプロイされているアーキテクチャの1つです。
- 作成者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020-06-26
- ソースコード: YOLOv5 GitHubリポジトリ
YOLOv5は、その使いやすさと非常に手厚くメンテナンスされたエコシステムで高く評価されています。すべてPyTorchで記述されており、トレーニング、バリデーション、ONNXやTensorRTなどの形式へのエクスポートをすぐに利用できる、シームレスな「ゼロからヒーローへ」の体験を提供します。主に純粋な物体検出に焦点を当てるYOLOv10とは異なり、YOLOv5は優れた汎用性を発揮し、同一の統合Python API内でインスタンスセグメンテーションや画像分類をサポートします。
Link to this sectionパフォーマンスと指標の比較#
速度と精度の関係を可視化することは、特定の速度制約に対して最適な精度を提供するモデルを特定するために不可欠です。これらのパフォーマンス指標を理解することは、特定のハードウェア制約に適合するモデルを選択するための基本となります。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this section技術分析#
- 精度(mAP): YOLOv10は、精度において明確な世代的なアドバンテージを示しています。例えば、YOLOv10-Xモデルは54.4% mAPvalを達成し、YOLOv5x(50.7% mAP)を上回っています。この飛躍は、主に2024年に導入されたNMSフリーの学習戦略とアーキテクチャの改良によるものです。
- Inference Latency: While YOLOv5 models are exceptionally fast on raw T4 TensorRT benchmarks (e.g., YOLOv5n at 1.12ms), YOLOv10 eliminates the post-processing NMS step entirely. In end-to-end practical deployments, YOLOv10's NMS-free design provides more consistent and deterministic latency, which is critical for real-time applications like autonomous vehicles and robotics.
- パラメータ効率: YOLOv10モデルは非常に競争力のあるパフォーマンスバランスを維持しています。YOLOv10-Sは7.2Mパラメータで46.7% mAPを達成しますが、YOLOv5sは9.1Mパラメータで37.4% mAPを達成します。
When deploying to edge AI devices like the NVIDIA Jetson, models without NMS logic (like YOLOv10 and YOLO26) often compile more cleanly to TensorRT, avoiding fallback operations to the CPU.
Link to this sectionユースケースと推奨事項#
YOLOv10とYOLOv5のどちらを選択するかは、特定のプロジェクトの要件、デプロイの制約、およびエコシステムの優先順位に依存します。
Link to this sectionYOLOv10を選択すべき場合#
YOLOv10は以下の用途に最適です。
- NMSフリーのリアルタイム検出: Non-Maximum Suppression(NMS)を使用しないエンドツーエンド検出のメリットを享受し、デプロイの複雑さを軽減できるアプリケーション。
- バランスの取れた速度と精度のトレードオフ: さまざまなモデルスケール全体で、推論速度と検出精度の強力なバランスを必要とするプロジェクト。
- 一貫したレイテンシが求められるアプリケーション: roboticsや自律システムなど、予測可能な推論時間が不可欠なデプロイ環境。
Link to this sectionYOLOv5を選択すべき場合#
YOLOv5は以下のような場合に推奨されます:
- 実証済みの本番システム: YOLOv5の長期にわたる安定性の実績、広範なドキュメント、および膨大なコミュニティサポートが重視される既存のデプロイ環境。
- リソースが制限されたトレーニング: GPUリソースが限られており、YOLOv5の効率的なトレーニングパイプラインと低いメモリ要件が有利に働く環境。
- 広範なエクスポート形式のサポート: ONNX、TensorRT、CoreML、TFLiteを含む多くのフォーマット全体でのデプロイが必要なプロジェクト。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this sectionUltralyticsの利点#
YOLOv10は優れた検出能力を提供しますが、学術的なリポジトリに依存することは、本番パイプラインを複雑にすることがあります。公式のUltralytics Pythonパッケージを使用することで、YOLOv5とYOLOv10の両方をサポートし、高度な機能を備えた統一されたエコシステムにアクセスできます。
- 学習効率: Ultralytics YOLOアーキテクチャは、学習時のメモリ要件を低く抑えるように高度に最適化されています。膨大なCUDAメモリを必要とする重いTransformerモデル(RT-DETRなど)とは異なり、一般的なコンシューマー向けGPUでYOLOv5やYOLOv10を快適に学習できます。
- エコシステムの統合: Ultralytics Platformとの統合により、開発者はデータセットを視覚的に管理したり、Weights & Biasesを使用して実験を追跡したり、ハイパーパラメータを自動的に調整したりすることができます。
Link to this sectionコード例:シームレスな学習#
Ultralyticsライブラリを使用すると、これらのアーキテクチャの切り替えはモデル文字列を変更するのと同じくらい簡単です。学習パイプラインは、データ拡張、スケーリング、オプティマイザ設定を自動的に処理します。
from ultralytics import YOLO
# To use YOLOv5:
# model = YOLO("yolov5s.pt")
# To use YOLOv10:
model = YOLO("yolov10s.pt")
# Train the model on a custom dataset
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=16,
device=0, # Use GPU 0
)
# Export the trained model to ONNX format
path = model.export(format="onnx")Link to this section次世代:Ultralytics YOLO26#
もし今日新しい機械学習プロジェクトを始めるのであれば、最新の**Ultralytics YOLO26**を評価することを強く推奨します。2026年1月にリリースされたこのモデルは、過去5年間の最良のイノベーションを融合させた、絶対的な最先端技術を体現しています。
YOLO26は、YOLOv10が先駆けたエンドツーエンドのNMSフリー設計をネイティブに組み込んでおり、迅速かつ決定的なデプロイを保証します。さらに、YOLO26はいくつかの決定的なブレイクスルーを導入しています:
- 最大43%高速なCPU推論: Distribution Focal Loss(DFL)モジュールを削除することで、YOLO26は標準的なCPU上で大幅な高速化を実現し、モバイルデプロイや低消費電力のIoTセンサーにとって最高の選択肢となっています。
- MuSGDオプティマイザ: Moonshot AIのKimi K2のような大規模言語モデル(LLM)の学習技術に触発されたYOLO26は、SGDとMuonのハイブリッドを利用しています。これにより、YOLOv10で使用されているAdamWオプティマイザと比較して、非常に安定した学習と大幅に加速された収束が保証されます。
- ProgLoss + STAL: これらの高度な損失関数は、ドローン画像や航空セキュリティアプリケーションにとって重要な、小物体認識の顕著な改善をもたらします。
- タスク固有の習熟: YOLOv10は厳密なバウンディングボックス検出器ですが、YOLO26は、ポーズ推定のためのResidual Log-Likelihood Estimation(RLE)や、指向性バウンディングボックス(OBB)のための特殊な角度損失など、すべてのタスクにおいて専用のアーキテクチャ上の改善を提供します。
物体検出のより広範な状況を探求している場合は、これらのアーキテクチャを他のフレームワークと比較することにも興味があるかもしれません。より包括的なベンチマークについては、YOLO11 vs EfficientDetやRT-DETR vs YOLOv8に関する詳細な分析をご覧ください。
YOLOv5の堅牢なレガシー、YOLOv10のNMSフリーのイノベーション、あるいはYOLO26の比類なき最先端のパフォーマンスのいずれに依存するとしても、Ultralyticsエコシステムは、ビジョンAIアプリケーションを迅速かつ効率的に実現するために必要なツールを提供します。