Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs YOLOv5#

コンピュータビジョンの分野は目覚ましい成長を遂げており、物体検出は数多くの産業および研究アプリケーションのバックボーンとして機能しています。適切なアーキテクチャを選択するには、平均精度(mAP)、推論速度、メモリオーバーヘッドを慎重に評価する必要があります。本比較では、非常に影響力の大きい2つのモデルを取り上げます。勾配情報の保持におけるアーキテクチャ上の飛躍的進歩で称賛される YOLOv9 と、驚異的な使いやすさと比類のないデプロイ汎用性で知られる、実戦で鍛え抜かれた業界標準の Ultralytics YOLOv5 です。

Link to this sectionアーキテクチャの革新と技術的背景#

これら2つのモデルの基礎となるメカニズムを理解することは、それぞれのパフォーマンスプロファイルを把握する上で重要な文脈となります。

Link to this sectionYOLOv9: プログラマブル勾配情報#

YOLOv9は、台湾の中央研究院情報科学研究所の研究者であるChien-Yao Wang氏とHong-Yuan Mark Liao氏によって開発され、2024年2月21日にリリースされました。このモデルは、ディープニューラルネットワークで一般的に発生する情報のボトルネックに対処するため、プログラム可能な勾配情報(PGI: Programmable Gradient Information)と一般化効率レイヤー集約ネットワーク(GELAN: Generalized Efficient Layer Aggregation Network)という2つの画期的なコンセプトを導入しています。

PGIを活用することで、YOLOv9はフィードフォワードプロセス全体で重要な情報が保持されることを保証し、非常に正確な勾配更新を実現します。一方、GELANアーキテクチャはパラメータ効率を最大化し、驚くほど低い計算オーバーヘッドで最先端の精度を達成することを可能にしています。技術的な詳細については、公式の YOLOv9 Arxiv論文 を参照するか、YOLOv9 GitHubリポジトリ をご覧ください。

YOLOv9の詳細はこちら

Link to this sectionUltralytics YOLOv5: 本番環境の標準#

Glenn Jocher氏によって考案され、2020年6月26日にUltralyticsからリリースされたYOLOv5は、コンピュータビジョンのアクセシビリティに革命をもたらしました。PyTorch フレームワーク上でネイティブに構築された最初の物体検出モデルの1つとして、古いDarknet Cフレームワークの複雑さを回避しました。YOLOv5は、高度に最適化されたCSPNetバックボーンとPANetネックを活用し、速度と精度のシームレスなバランスを優先しています。

しかし、その最大の功績は、より広範なUltralyticsエコシステムへの統合です。YOLOv5は高速な トレーニング効率 と低メモリ環境向けに高度に最適化されており、エッジデプロイメントにおいて非常に安定しています。

YOLOv5の詳細はこちら

メモリ効率

エッジデバイス用のモデルを評価する際は、Ultralytics YOLOモデルが、Transformerベースの重量級アーキテクチャと比較して、トレーニングと推論の両方において通常、大幅に低いGPUメモリしか必要としないことを念頭に置いてください。

Link to this sectionパフォーマンス分析: 速度 vs 精度#

コンピュータビジョンパイプラインを設計する際、開発者は精度とレイテンシのトレードオフを検討する必要があります。以下の表は、標準的な COCOデータセット におけるパフォーマンスの違いを示しています。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionトレードオフの分析#

YOLOv9は生の精度において圧倒的な強さを確立しています。YOLOv9e は、GELANレイヤーを利用して微細な詳細を保持することで、mAPを55.6%まで高めました。これにより、医療画像 や小さな物体に対して厳密な精度が求められるシナリオにおいて優れた選択肢となります。

対照的に、YOLOv5 は、生のデプロイ速度とハードウェアの柔軟性において優れています。YOLOv5n (Nano) は非常に軽量で、TensorRT を介してT4 GPU上でわずか1.12msで推論を実行します。制約のあるIoTデバイス、携帯電話、または Raspberry Pi にデプロイする場合、YOLOv5のメモリフットプリントは非常に信頼性が高くなります。

Link to this sectionUltralyticsエコシステムの利点#

モデルを選択する際の大きな考慮事項は、周囲のソフトウェアエコシステムです。YOLOv9は最高レベルの研究ベンチマークを提供しますが、モダンな Ultralytics Python API を通じて両方のモデルを利用することで、開発者に統一された効率的なエクスペリエンスを提供し、そのギャップを埋めることができます。

Link to this section使いやすさとエクスポート#

Ultralyticsは複雑なエンジニアリングのハードルを抽象化します。自動的な データ拡張ハイパーパラメータチューニング といった機能は、標準で対応しています。モデルを本番環境へ移行することも同様に簡単で、モデルを ONNXOpenVINO、または TFLite 形式に変換するためのエクスポートコマンドが組み込まれています。

Link to this sectionタスクの汎用性#

両モデルとも 物体検出 に秀でていますが、現代のUltralyticsモデルはさまざまなコンピュータビジョンの課題に取り組むように構築されています。より広範なフレームワークは、画像分類インスタンスセグメンテーション姿勢推定、および 指向性バウンディングボックス (OBB) をネイティブサポートしており、開発者はコードベースを切り替えることなく複数のビジョン問題を解決できます。

Link to this sectionユースケースと推奨事項#

YOLOv9とYOLOv5の選択は、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの優先順位によって決まります。

Link to this sectionYOLOv9を選択すべき場合#

YOLOv9は以下の場合に強力な選択肢となります:

  • 情報ボトルネック研究: Programmable Gradient Information (PGI)およびGeneralized Efficient Layer Aggregation Network (GELAN)アーキテクチャを研究する学術プロジェクト。
  • 勾配フロー最適化の研究: トレーニング中の深層ネットワーク層における情報損失の理解と軽減に重点を置いた研究。
  • 高精度検出ベンチマーク: アーキテクチャ比較の基準点として、YOLOv9の強力なCOCOベンチマークパフォーマンスが必要とされるシナリオ。

Link to this sectionYOLOv5を選択すべき場合#

YOLOv5は以下のような場合に推奨されます:

  • 実証済みの本番システム: YOLOv5の長期にわたる安定性の実績、広範なドキュメント、および膨大なコミュニティサポートが重視される既存のデプロイ環境。
  • リソースが制限されたトレーニング: GPUリソースが限られており、YOLOv5の効率的なトレーニングパイプラインと低いメモリ要件が有利に働く環境。
  • 広範なエクスポート形式のサポート: ONNXTensorRTCoreMLTFLiteを含む多くのフォーマット全体でのデプロイが必要なプロジェクト。

Link to this sectionUltralytics (YOLO26) を選択すべき時#

ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。

  • NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
  • CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
  • 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。

Link to this section実装例#

Ultralyticsエコシステムの利点は、ウェイト文字列を変更するだけで、YOLOv5モデルとYOLOv9モデルを簡単に切り替えられることです。

from ultralytics import YOLO

# Load a pretrained YOLOv9 model (swap to "yolov5s.pt" to use YOLOv5)
model = YOLO("yolov9c.pt")

# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on new images
predictions = model.predict("https://ultralytics.com/images/zidane.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this section新しいアーキテクチャの探求#

YOLOv5とYOLOv9は明確な利点を持つ優れたモデルですが、分野は進化し続けています。新しいプロジェクトを検討しているユーザーは、Ultralyticsの最新イテレーションも評価することをお勧めします。

  • YOLO11: 全てのビジョンタスクにおいて優れた速度と精度のバランスを提供する、YOLOv8系統の強力で洗練された進化形です。
  • YOLO26: 2026年にリリースされたYOLO26は、モダンなパイプラインに最適です。NMSフリーのEnd-to-End設計 を導入しており、後処理のボトルネックを完全に取り除いています。DFL Removal(簡素化されたエクスポートとエッジ/低電力デバイスへの適合性向上のため、Distribution Focal Lossを削除)により、CPU推論が最大43%高速化 されました。新しい MuSGD Optimizer によってトレーニングの安定性が大幅に向上し、ProgLoss + STAL は、IoT、ロボティクス、航空画像に不可欠な小さな物体の認識において顕著な改善をもたらす損失関数を実現しており、エッジとクラウドの両方のデプロイメントにおいて最も堅牢なアーキテクチャとなっています。

大規模なデータセットと複雑なデプロイパイプラインを管理するチームにとって、Ultralytics Platform を利用することで、これらの最先端モデルを簡単にトレーニング、追跡、デプロイできるノーコードソリューションが得られます。

コメント