コンテンツにスキップ

YOLOX対YOLOv8:物体検出の進化を技術的に深く掘り下げる

コンピュータ・ビジョンの状況は急速に変化しており、新しいアーキテクチャがスピードと精度の限界を押し上げ続けている。この旅における2つの重要なマイルストーンがYOLOXとYOLOv8である。この比較では、YOLOXのアンカーフリーの革新性と、YOLOv8の最先端の多機能性の間の技術的なニュアンスを探ります。 Ultralytics YOLOv8.機械学習プロジェクトに適したツールを選択できるよう、両者のアーキテクチャ、パフォーマンス指標、実際のアプリケーションへの適合性を分析します。

最新テクノロジーへのアップグレード

YOLOv8 強力なモデルだが、この分野はさらに進化している。チェックアウト YOLO11をご覧ください。Ultralytics最新版で、検出、セグメンテーション、ポーズ推定タスクにおいて、さらに高い効率性、高速処理、精度の向上を実現しています。

パフォーマンス指標とベンチマーク

物体検出モデルを評価する際、推論速度と平均平均精度(mAP)のトレードオフは非常に重要です。以下の表はそのことを強調しています。 Ultralytics YOLOv8は、同等のモデルサイズにおいて、より低いレイテンシでより高い精度を一貫して達成していることがわかります。

注目すべきは、YOLOv8 、CPU 推論用の透過的ベンチマークを提供していることである。 ONNXを介したCPU推論の透過的ベンチマークを提供している。これとは対照的に、標準的なYOLOXベンチマークは主にGPU 性能に焦点を当てており、標準プロセッサ上のエッジAIアプリケーションをターゲットとするユーザーにはギャップが残ります。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOX:アンカーフリーのパイオニア

Megviiの研究者たちによって2021年に発表されたYOLOXは、アンカー不要のメカニズムを採用することで、YOLO ファミリーに大きな変化をもたらした。この設計上の選択により、あらかじめ定義されたアンカーボックスが不要となり、トレーニングプロセスが簡素化され、特定のシナリオにおけるパフォーマンスが向上した。

アーキテクチャーと強み

YOLOXは、収束速度と精度を向上させるために、分類タスクとローカリゼーションタスクを分離した非結合型ヘッドを統合している。動的なラベル割り当てにはSimOTA(Simplified Optimal Transport Assignment)を利用し、学習プロセスを最適輸送問題として扱う。当時としては画期的であったが、YOLOXは主に物体検出モデルであり、同じコードベース内でセグメンテーションやポーズ推定などの他のタスクをネイティブにサポートしていない。

YOLOXの詳細について。

YOLOv8:ビジョンAIの最新スタンダード

Ultralytics2023年初頭に発表したYOLOv8 、効率性、正確性、ユーザビリティに関する広範な研究の集大成です。YOLOv8は、アンカー・フリーのレガシーをベースに、最先端のタスク・アラインド・アサイナーと、幅広いハードウェアに対応する近代化されたアーキテクチャによって、より洗練されたものとなっている。

主な利点

YOLOv8 単なる検出モデルではなく、統一されたフレームワークです。画像分類インスタンス・セグメンテーションポーズ推定指向性オブジェクト検出(OBB)をネイティブでサポートしている。この多機能性により、開発者は、単一のまとまったAPIを使用して、複雑なマルチモーダル問題を解決することができます。

YOLOv8の詳細について。

アーキテクチャの比較と使用例

これらのアーキテクチャの技術的な違いを理解することは、リアルタイム推論や生産システムに適したツールを選択するのに役立つ。

1.トレーニングの効率と記憶

Ultralytics YOLO モデルの際立った特徴の一つは、そのトレーニング効率です。YOLOv8 、モザイクやミックスアップといった高度なオーグメンテーション戦略を実装しており、高いトレーニング速度を維持しながらオーバーフィッティングを防ぐように最適化されています。

重要なことは、YOLOv8 、旧来のアーキテクチャや重いトランスフォーマーベースのモデルと比較して、学習と推論の両方で必要なメモリが少ないことを示していることです。この効率性により、コンシューマーグレードのGPUでカスタムモデルを訓練したり、メモリ制約のあるエッジデバイスに展開したりすることが可能になります。YOLOXは効率的ですが、最適な安定性を達成するために、ハイパーパラメータを手動で調整する必要があります。

2.エコシステムと使いやすさ

開発者や研究者にとって、モデルを取り巻くエコシステムは、アーキテクチャそのものと同じくらい重要である。

  • YOLOXは伝統的な研究用リポジトリ構造に従っています。YOLOXのセットアップには、複雑な設定ファイルや手作業による依存関係の管理が必要になることがよくあります。
  • Ultralytics YOLOv8使いやすさを最優先している。pipでインストール可能なパッケージ、合理化されたPython API、すぐに使えるCLI 特徴です。

Ultralytics APIによる使いやすさ

YOLOv8 予測を実行するのは非常に簡単で、数行のコードで済む。

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

3.整備された生態系

YOLOv8 選択することは、整備されたエコシステムへのアクセスを得ることを意味します。Ultralytics 、包括的なドキュメント、頻繁なアップデート、活発なコミュニティサポートを提供します。より広範なUltralytics エコシステムとの統合は、データ注釈、データセット管理、および以下のようなフォーマットへのモデルデプロイメントを含むワークフローを簡素化します。 TensorRTOpenVINO.

現実世界のアプリケーション

YOLOv8 いる点

  • スマートリテール: セグメンテーション機能を活用し、棚のレイアウトや商品の配置をピクセルレベルの精度で把握。
  • スポーツ分析: ポーズ推定を活用し、選手の動きやバイオメカニクスをリアルタイムでtrack 。
  • 工業用検査:コンベアベルト上の部品のような回転する物体を高精度でdetect するためにOBBモデルを展開。
  • エッジ展開: YOLOv8 8の優れたスピード対精度比は、モバイルアプリケーションやRaspberry PiやNVIDIA Jetsonのような組み込みシステムに最適です。

YOLOXニッチ

YOLOXは、アンカーなし検出ヘッドの理論的側面に特に焦点を当てた学術研究の有力な候補であり続けている。そのコードベースは、2021年の時代におけるアンカー・ベースからアンカー・フリーの方法論への移行を研究する研究者に明確なリファレンスを提供する。

結論

YOLOXはアンカーなし検出の普及に極めて重要な役割を果たした、 Ultralytics YOLOv8は、このテクノロジーの自然な進化を表しています。優れたパフォーマンス指標、多目的なマルチタスク学習フレームワーク、そして比類のないユーザー体験を提供することで、YOLOv8 最新のAI開発における優れた選択肢として際立っています。

迅速なプロトタイピングから企業展開まで拡張可能な、堅牢で将来性のあるソリューションを求める開発者向けに、Ultralytics YOLOv8より新しいYOLOv8用意されています。 YOLO11-は、成功に必要なツールを提供します。

その他のモデルを見る

これらの比較を通じて、物体検出の状況について理解を深めてください:


コメント