コンテンツにスキップ

YOLOv8 YOLO11:リアルタイム物体検出の進化

適切なコンピュータビジョンアーキテクチャを選択することは、AIプロジェクトのスピード、精度、スケーラビリティに影響を与える重要な決断です。このガイドでは Ultralytics YOLOv8と、2023年にリリースされた広く採用されている業界標準である Ultralytics YOLO11は、優れた効率とパフォーマンスを実現するために設計されたYOLO シリーズの最新版です。それぞれのアーキテクチャーの違い、ベンチマーク指標、理想的なユースケースを分析し、お客様のニーズに最適なモデルをお選びいただけるようにします。

Ultralytics YOLOv8

著者Glenn Jocher、Ayush Chaurasia、Jing Qiu
組織:Ultralytics
日付:2023-01-10
GitHubultralytics
Docsyolov8

2023年初頭にリリースされたYOLOv8 、物体検出の歴史において重要なマイルストーンとなった。検出、インスタンス分割姿勢推定画像分類など、複数のコンピュータビジョンタスクを単一のリポジトリでサポートする統一フレームワークを導入した。YOLOv8 、アンカーベースの検出からアンカーフリーのアプローチに移行し、設計を簡素化するとともに、異なる物体形状に対する汎化性を向上させた。

アーキテクチャと主な機能

YOLOv8 、C3モジュールの代わりに YOLOv5をC2fモジュール(Cross-Stage Partial bottleneck with two convolutions)に置き換えた。この変更により、フットプリントを軽量化しながら、勾配フローと特徴統合が改善された。このアーキテクチャはまた、非結合型ヘッドを特徴としており、対象性、分類、回帰タスクを分離して精度を高めている。

信頼性の遺産

YOLOv8 、製造オートメーションから 自律走行車まで、何千もの商用アプリケーションでテストされ、安定性と配備の容易さで高い評価を得ている。

長所と短所

  • 長所:
    • 成熟したエコシステム:膨大なコミュニティのチュートリアル、統合、デプロイメントガイドにサポートされています。
    • 汎用性:標準的な検出に加えて、OBB(Oriented Bounding Box)と分類をネイティブサポート。
    • 実証された安定性:長いtrack あるモデルを必要とする生産環境での安全な選択。
  • 弱点:
    • 速度効率:高速ではあるが、CPU 推論速度やパラメータ効率ではYOLO11 劣る。
    • コンピュート要件:より大きなバリアント(L、X)は、最適化されたYOLO11 同等品と比較して、より多くのVRAMとFLOPを必要とする。
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

YOLOv8の詳細について。

Ultralytics YOLO11

著者Glenn Jocher、Jing Qiu
組織:Ultralytics
日付:2024-09-27
GitHubultralytics
Docsyolo11

YOLO11は、Ultralytics モデルファミリーの最先端を行くものである。リアルタイム推論を再定義するために設計されたYOLOv8 11は、YOLOv8 8の成功に基づき、アーキテクチャの大幅な改良が加えられています。YOLO11 、計算コストを最小限に抑えながら精度を最大化することに重点を置いており、エッジデバイスからクラウドサーバーに至るまで、最新のAIアプリケーションに最適です。

アーキテクチャと主な機能

YOLO11 、C3k2ブロックと C2PSA(Cross-Stage Partial with Spatial Attention)モジュールが導入されました。これらのコンポーネントは、複雑な特徴を抽出するモデルの能力を強化し、オクルージョンを以前のバージョンよりも効果的に処理します。アーキテクチャーはスピードのために最適化されており、GPU リソースが利用できない可能性のあるエッジAIの展開にとって重要な要素であるCPUでの処理時間を大幅に短縮します。

このモデルはUltralytics特徴である統一されたインターフェイスを維持しており、開発者はワークフローを変更することなくOBBやセグメンテーションなどのタスクを切り替えることができる。

長所と短所

  • 長所:
    • 優れた効率性: YOLOv8最大22%少ないパラメータで高いmAP 達成し、モデルサイズとストレージの必要性を削減。
    • より速い推論:最新のハードウェア向けに最適化され、CPU GPU 両方のバックエンドで高速化を実現。
    • 特徴抽出の強化:新しいバックボーンにより、小さな物体の検出と乱雑なシーンでのパフォーマンスが向上。
    • メモリ使用量の低減:のようなトランスフォーマーベースのモデルと比較して、トレーニング中に必要なCUDA メモリが少なくて済みます。 RT-DETRよりアクセスしやすいハードウェアでのトレーニングが可能になります。
  • 弱点:
    • 新しいリリース:最近のモデルであるため、特定のニッチなサードパーティツールは完全にサポートを更新するのに時間がかかるかもしれないが、中核となるUltralytics エコシステムは初日からサポートしている。
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

YOLO11の詳細について。

性能直接対決

以下の比較は、YOLO11効率性の向上を強調しています。YOLOv8 依然として強力な候補である一方で、YOLO11 一貫して、計算複雑度(FLOPs)を低減し、推論速度を高速化しながら、より高い精度mAP)を実現しています。これは特に "Nano "と "Small "モデルで顕著で、YOLO11nはYOLOv8n37.3に対して39.5のmAP達成し、同時にCPU処理速度も大幅に向上しています。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

メトリック分析

YOLO11 、速度と精度のトレードオフにおいて明確な優位性を示している。例えば、YOLO11lモデルはYOLOv8l モデルを精度(+0.5mAP)で上回る一方で、使用するパラメータは約42%少なく CPU処理速度は36%高速です。

エコシステムと使いやすさ

どちらのモデルも、最先端のテクノロジーを誰もが利用できるようにすることで、AIの民主化を目指す堅牢なUltralytics エコシステムの恩恵を受けている。

  • 統一API: YOLOv8 YOLO11 切り替えは、モデル文字列を次のように変更するだけでよい。 yolov8n.pt 宛先 yolo11n.pt.コードのリファクタリングは必要ない。
  • トレーニングの効率化: Ultralytics 、データセットと事前トレーニング済みの重みを自動ダウンロードし、データ収集からモデルトレーニングまでのパイプラインを合理化します。
  • 展開の多様性:どちらのモデルも、ONNX、TensorRT、CoreML、TFLiteフォーマットへのワンクリックでのエクスポートをサポートしており、Raspberry Pis、携帯電話、クラウドインスタンスなど、さまざまなハードウェアへの展開を容易にします。
  • 十分なメンテナンス: DiscordとGitHubの活発なコミュニティに支えられ、頻繁なアップデートによりPyTorch CUDA最新バージョンとの互換性が保証されています。

結論と推奨事項

一方 YOLOv8は、レガシーシステムの保守に適した、信頼性が高く高性能なモデルであることに変わりはない、 YOLO11がすべての新規開発に推奨されることは明らかである。

  • 以下の場合はYOLO11 お選びください:可能な限り高い精度、より高速な推論速度(特にCPU)が必要な場合、またはメモリやストレージが高価な、リソースに制約のあるエッジ・デバイスに導入する場合。YOLO11のアーキテクチャーの改良は、商用アプリケーションに将来性のある基盤を提供します。
  • 次のような場合は、YOLOv8 お選びください:既存のパイプラインをv8特有の動作に大きくチューニングしている場合、または厳しいプロジェクト要件に制約されて最新のアーキテクチャに更新できない場合。

Ultralytics ドキュメントでは、以下のようなモデルも扱っています。 YOLOv9, YOLOv10RT-DETR.モデル比較ページでは、より幅広い比較をご覧いただけます。


コメント