Link to this sectionYOLOv10 対 YOLOv8#

リアルタイム物体検出の進化は、画期的なアーキテクチャの急速な連続によってもたらされており、それぞれが精度、推論速度、および計算効率の限界を押し広げようとしています。この包括的な技術ガイドでは、コンピュータビジョンの分野における2つの主要なマイルストーンである YOLOv10 と Ultralytics YOLOv8 を比較します。YOLOv8 が非常に汎用性が高く本番環境対応の標準を確立した一方で、YOLOv10 は後処理のボトルネックを取り除くことを目的としたアーキテクチャの変革を導入しました。

これらのモデルの明確な利点、アーキテクチャ、およびパフォーマンス指標を理解することは、最先端のビジョンAIソリューションを現実世界のシナリオに導入しようとする開発者や研究者にとって非常に重要です。

Link to this section技術仕様と著作権情報#

これらのモデルを効果的に評価するためには、その起源と各研究チームが焦点を当てている中核的な領域を理解することが役立ちます。

Link to this sectionYOLOv10: エンドツーエンドの効率性#

清華大学の研究者によって開発された YOLOv10 は、前世代のモデルにおいて後処理のステップがもたらしていた計算オーバーヘッドに対処するために設計されました。

著者: Ao Wang, Hui Chen, Lihao Liu, 他
組織: 清華大学
日付: 2024-05-23
Arxiv: 2405.14458
GitHub: THU-MIG/yolov10
Docs: YOLOv10 ドキュメント

YOLOv10について詳しく知る

Link to this sectionUltralytics YOLOv8：汎用的な標準#

2023年初頭にリリースされた YOLOv8 は、その堅牢なアーキテクチャと、より広範な機械学習エコシステム内での比類のない統合性により、急速に業界の定番となりました。

著者: Glenn Jocher, Ayush Chaurasia, Jing Qiu
組織: Ultralytics
日付: 2023-01-10
GitHub: ultralytics/ultralytics

YOLOv8の詳細はこちら

Link to this sectionアーキテクチャの革新#

両モデルとも従来の YOLO アーキテクチャに大きな改善をもたらしていますが、パイプラインのわずかに異なる側面をターゲットにしています。

Link to this sectionYOLOv10 アーキテクチャ#

YOLOv10 の際立った特徴は、NMSフリーのトレーニング戦略です。従来、物体検出モデルは推論中に Non-Maximum Suppression (NMS) に依存して、重なり合う BBox をフィルタリングしていました。このステップはレイテンシを発生させ、エンドツーエンドのデプロイを複雑にする可能性があります。YOLOv10 はトレーニング中に一貫したデュアルアサインメントを採用しており、これによりモデルは物体ごとに単一の正確な BBox をネイティブに予測できます。さらに、全体的な効率と精度を重視したモデル設計を利用しており、FLOPs とパラメータ数を大幅に削減するためにさまざまなコンポーネントを最適化しています。

Link to this sectionYOLOv8 アーキテクチャ#

YOLOv8 は アンカーフリーの検出ヘッド を導入し、前任者が採用していたアンカーベースのアプローチから脱却しました。これにより、ボックス予測の数が減り、NMS操作が高速化されます。さらに、YOLOv8 には C2fモジュール（2つの畳み込みを備えたクロスステージ部分ボトルネック）が組み込まれており、勾配フローが改善され、計算コストを劇的に増大させることなく、より豊かな特徴表現を学習できるようになっています。そのデカップルヘッド構造は、物体らしさ、分類、回帰タスクを分離しており、収束の高速化と全体的な精度の向上につながっています。

Link to this section性能とベンチマーク#

エッジデバイスやクラウドサーバーにモデルをデプロイする場合、速度と精度のトレードオフは最優先事項です。以下の表は、さまざまなサイズの2つのモデルを直接比較したものです。

モデル	サイズ ^{(ピクセル)}	mAP^val 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

注: 空白のセルは、同一のテスト条件下で公式に報告されていない指標を示します。

データからわかるように、YOLOv10 は優れたパラメータ効率を示しており、より少ないパラメータと FLOPs を使用しながら、多くの場合 YOLOv8 対応モデルの mAP に匹敵するか、それを上回ります。しかし、YOLOv8 は非常に競争力を保っており、現代の GPU 上での推論レイテンシを最小限に抑える、高度に最適化された TensorRT統合を提供しています。

ハードウェアアクセラレーション

本番環境をターゲットにする場合、ONNX や TensorRT などのフォーマットを活用することで、推論速度を大幅に向上させることができます。YOLOv8 と YOLOv10 はいずれも、これらの高度に最適化されたグラフフォーマットへのシームレスなエクスポートをサポートしています。

Link to this sectionエコシステム、トレーニング効率、および汎用性#

モデルの選択は理論的なベンチマークを超えたものであり、開発者のエクスペリエンスと周辺のエコシステムも同様に不可欠です。

Link to this sectionUltralyticsの利点#

YOLOv8 の核心的な強みの1つは、Ultralytics エコシステムへの密接な統合です。この環境は、非常に直感的な Python API と広範なドキュメントを特徴とする「ゼロからヒーローへ」の体験を提供します。複雑な環境設定を必要とする研究主導型のリポジトリとは異なり、Ultralytics のモデルは 使いやすさ で知られています。

さらに、YOLOv8 は本質的に多才です。YOLOv10 は物体検出に特化して最適化されていますが、Ultralytics フレームワークを使用すると、まったく同じライブラリと API 構造内で、物体検出、インスタンスセグメンテーション、画像分類、姿勢推定、および回転物体検出 (OBB) のタスクをシームレスに切り替えることができます。

Link to this sectionメモリ要件とトレーニング#

Ultralytics YOLO モデルは、トレーニング効率に重点を置いて設計されています。これらは通常、複雑な Transformerモデルと比較して、トレーニング中および推論中のメモリ使用量が少なく、開発者は CUDA メモリを枯渇させることなく、民生用ハードウェアや標準的なクラウドインスタンスで最先端のモデルをトレーニングできます。ハイパーパラメータ調整とデータ拡張の自動処理により、迅速な収束が保証されます。

Ultralytics Python API を使用してモデルをトレーニングおよび検証するのがいかに簡単かを示す実際的な例を以下に示します。

from ultralytics import YOLO

# Load a pretrained model (YOLOv8 recommended for general tasks)
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 dataset with automatic memory management
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Run inference on a test image
predictions = model("https://ultralytics.com/images/zidane.jpg")
predictions[0].show()

Link to this section次世代: YOLO26#

YOLOv8 と YOLOv10 は卓越したマイルストーンを表していますが、機械学習分野は絶えず進化しています。新しいプロジェクトを開始する開発者には、2026年1月に Ultralytics からリリースされた最新のフラッグシップモデルである YOLO26 を活用することを強く推奨します。

YOLO26 は、過去数年間の最高のアーキテクチャの進歩を1つの高度に最適化されたフレームワークに統合しています。YOLOv10 のようなモデルによって先駆的に開発された エンドツーエンドの NMSフリー設計 を継承しており、デプロイパイプラインを合理化し、レイテンシの変動を軽減しています。さらに、YOLO26 は MuSGDオプティマイザ を導入しています。これは、LLM のトレーニング安定性に触発されたハイブリッドオプティマイザであり、より高速で安定した収束を保証します。

YOLO26 の主な改善点は以下の通りです。

最大43%高速なCPU推論: Distribution Focal Loss (DFL) の削除により、エッジデバイス向けに大幅に最適化されました。
ProgLoss + STAL: ドローン画像や IoT センサーにとって重要な、小さな物体の認識率を劇的に向上させる高度な損失関数です。
タスク固有の強化: セグメンテーション、姿勢推定、OBB 用の専門的なアーキテクチャにより、すべてのビジョンドメインでトップクラスのパフォーマンスを保証します。

Link to this section理想的なユースケースとデプロイ戦略#

これらのアーキテクチャを選択する際は、デプロイ環境の特定のニーズを考慮してください。

YOLOv10 を選択すべき場合: パラメータ効率を極限まで追求することが重要であり、純粋な物体検出パイプラインに取り組んでいて、NMSフリーアーキテクチャの初期実装を試してみたい場合。
Ultralytics YOLOv8 を選択すべき場合: 強固な Ultralytics プラットフォームによってサポートされる、非常に安定した本番環境対応のモデルが必要な場合。プロジェクトで、統合されたメンテナンスしやすいコードベースを使用して、複数のタスク（物体を検出した後にそれらをセグメント化するなど）を実行する必要がある場合に理想的な選択肢です。
YOLO26 を選択すべき場合（推奨）: 最先端の精度、ネイティブなエンドツーエンドの NMSフリー効率、および CPU とエッジハードウェアでの可能な限り最高速度の究極のバランスを求める場合。

より広範な状況を探索している場合は、これらのモデルを YOLO11 と比較したり、Intel OpenVINO のような特定のエッジデプロイ統合をチェックして、ビジョンAIアプリケーションをさらに高速化することも検討してみてください。Ultralytics が提供する統合ツールを活用することで、堅牢なコンピュータビジョンソリューションのデプロイは、かつてないほど利用しやすくなっています。

貢献者

GLglenn-jocher¹²

作成日 2025年1月27日更新日 3 週間前