YOLOv8 vsYOLOv10:包括的な技術比較
適切な物体検出モデルを選択することは、あらゆるコンピュータビジョンプロジェクトの成功にとって極めて重要です。このガイドでは Ultralytics YOLOv8と YOLOv10の詳細な技術比較を行い、アーキテクチャーの革新、パフォーマンス指標、理想的なユースケースを分析します。YOLOv10 斬新な効率最適化を導入する一方で、Ultralytics YOLOv8 、その堅牢なエコシステム、比類のない多用途性、多様な展開シナリオで実証された信頼性により、圧倒的な強さを維持しています。
Ultralytics YOLOv8:多用途スタンダード
2023年1月発売 Ultralytics YOLOv8は、単なるモデルとしてではなく、ビジョンAIのための包括的なフレームワークとして設計され、YOLO シリーズの大きな飛躍を表しています。使いやすさと柔軟性を最優先し、ホビイストから企業エンジニアまで幅広い開発者に選ばれています。
- 著者: Glenn Jocher、Ayush Chaurasia、Jing Qiu
- 組織Ultralytics
- Date: 2023-01-10
- GitHubultralytics
- ドキュメントYOLOv8 ドキュメント
アーキテクチャと能力
YOLOv8 、アンカーを使わない検出メカニズムを採用しており、手動によるアンカーボックスの指定を不要にすることで、学習プロセスを簡素化している。このアプローチにより、異なる物体形状に対する汎化が向上する。YOLOv8のアーキテクチャーは、計算コストと高精度を両立させるために、非結合型ヘッドと最先端のバックボーンを特徴としている。
YOLOv8 特徴は、ネイティブ・マルチタスク・サポートにある。多くの専用モデルとは異なり、YOLOv8 すぐに使える機能を提供している:
主な利点
YOLOv8 取り巻く整備されたエコシステムは、大きな利点です。モデルのトレーニングと管理のためにUltralytics HUBとシームレスに統合され、ONNX、TensorRT、CoreMLフォーマットへの広範なエクスポートオプションを提供します。さらに、学習と推論に 必要なメモリは、トランスフォーマーベースのアーキテクチャよりも大幅に少なく、標準的なハードウェアで効率的に動作します。
YOLOv10:効率の限界に挑む
YOLOv10清華大学の研究者によって開発されたYOLOv10は、後処理に関連するボトルネックを取り除くことによって推論パイプラインを最適化することに重点を置いている。
- 著者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 組織清華大学
- Date: 2024-05-23
- ArxivarXiv:2405.14458
- GitHubTHU-MIG/yolov10
- ドキュメントYOLOv10 ドキュメント
建築イノベーション
YOLOv10 際立った特徴は、NMS学習戦略である。従来のオブジェクト検出器は、推論中に重なり合うバウンディングボックスをフィルタリングするためにNMS(Non-Maximum Suppression)に依存しており、これは待ち時間を発生させる可能性があります。YOLOv10 、学習時に一貫した二重割り当てを利用し、豊富な監視信号のための一対多の監視と、効率的な推論のための一対一のマッチングを組み合わせます。これにより、モデルはNMS必要とせずに正確なバウンディングボックスを予測することができ、エンド・ツー・エンドのレイテンシを削減することができる。
また、このアーキテクチャには全体的な効率と精度の設計が含まれており、軽量な分類ヘッドと、計算の冗長性(FLOPs)とパラメータ数を削減するための空間チャネル分離ダウンサンプリングが特徴となっている。
パフォーマンス指標と分析
この2つのモデルを比較する際には、純粋な精度の数字だけにとらわれないことが重要である。YOLOv10 パラメーターの面で素晴らしい効率性を示すのに対し YOLOv8は、より多様なハードウェアとタスクに対応する堅牢なパフォーマンスを維持している。
比較表
下の表は、COCO データセットでの性能を示している。YOLOv10 、場合によってはより少ないパラメータでより高いmAP 達成しているが、YOLOv8 、特に標準的なCPU およびGPU ベンチマークにおいて、推論速度で高い競争力を維持している。
| モデル | サイズ (ピクセル) | mAP値 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
批判的分析
- パフォーマンスのバランス: YOLOv8 、スピードと精度の間の優れたトレードオフを提供する。CPU (ONNX経由)での速度は十分に文書化され、最適化されているため、特別なGPU ハードウェアがないデプロイメントでも信頼できる選択肢となる。
- トレーニングの効率: Ultralytics モデルは効率的なトレーニングプロセスで知られています。YOLOv88の最適化されたハイパーパラメータと容易に利用可能な事前訓練された重みを使用することで、多くの場合、より早く収束を達成することができます。
- エコシステムの成熟度: YOLOv10 理論的な効率向上を提供する一方で、YOLOv8 Ultralytics エコシステムにおける長年の改良の恩恵を受けています。これには、データ増強のための広範なサポート、活発なコミュニティによるデバッグ、以下のようなツールとの統合が含まれます。 Weights & Biasesそして Comet.
多用途性が重要
例えば、ポーズ推定によるボディランゲージの理解や、YOLOv8 正確な境界画定など、バウンディングボックス以上のものが必要なプロジェクトであれば、 YOLOv10 8が明らかに勝者である。
理想的なユースケース
Ultralytics YOLOv8選ぶとき
YOLOv8 、その多用途性と使いやすさから、実際のアプリケーションの大部分に推奨される選択である。
- 多面的なAIソリューション:検出と同時にインスタンスのセグメンテーションや分類を必要とするプロジェクトに最適です。
- エンタープライズ展開:明確なライセンスオプションと既存のMLOpsパイプラインへの統合を備えた、安定したサポート体制のフレームワークを必要とする企業に最適です。
- スマートリテール:複数のタスクを処理できるため、棚のモニタリングや顧客行動分析などの複雑な小売分析に適しています。
- 迅速なプロトタイピング:シンプルなPython APIにより、開発者は数分でコンセプトから学習済みモデルまで作成できます。
YOLOv10選ぶとき
YOLOv10 、ハードウェアの制約が極端な特定のニッチ分野に最適である。
- レイテンシが重要なエッジAI: 推論レイテンシが1ミリ秒単位で重要視されるマイクロコントローラーやレガシー組込みシステム上のアプリケーション。
- 高スループット・ビデオ処理: トラフィック管理のように、フレームごとの後処理時間を短縮することで、累積的に計算リソースを大幅に節約できるシナリオ。
コードの実装
Ultralytics エコシステムの特徴の1つは、次のようなものです。 使いやすさ.どちらのモデルも統一された ultralytics Python パッケージは、一貫した開発者体験を保証します。
以下は、推論を実行する方法の例である。 YOLOv8で推論を実行する例である。
from ultralytics import YOLO
# Load a pre-trained YOLOv8 model
model = YOLO("yolov8n.pt")
# Perform object detection on a local image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
同様に、Ultralytics 幅広いエコシステムをサポートしているため、ライブラリ内でサポートされていれば、ウェイトを簡単に交換して他のアーキテクチャを試すことができます。
シームレスな輸出
Ultralytics 、学習済みモデルをデプロイに適した形式にエクスポートするためのコマンドを1行で提供します。これはYOLOv8 完璧に連動し、本番用に最適化されたモデルを生成します:
# Export YOLOv8 model to ONNX format
model.export(format="onnx")
結論
YOLOv8 YOLOv10 どちらも、コンピュータ・ビジョン工学の見事な偉業である。YOLOv10 、NMS設計により、アーキテクチャの効率性の限界を押し広げ、高度に専門化され、レイテンシに敏感な検出タスクの強力な候補となる。
しかし、堅牢で汎用性が高く、将来を見据えた開発のためには、次のような課題があります、 Ultralytics YOLOv8が優れています。単一のフレームワークで分類、セグメンテーション、ポーズ推定を処理するその能力は、比類のない価値を提供します。広範なドキュメント、活発なコミュニティサポート、Ultralytics HUBとのシームレスな統合と相まって、YOLOv8 開発者に包括的なAIソリューションをより速く、より確実に構築する力を与えます。
最新のパフォーマンスをお求めの方には、以下の製品もお勧めします。 YOLO11は、YOLOv8 8の長所を生かし、さらに高い精度とスピードを実現しています。