YOLO11 YOLOv9：包括的な技術比較

急速に進歩するコンピュータビジョンの分野では、適切な物体検出モデルを選択することがプロジェクトの成功に不可欠です。この比較では Ultralytics YOLO11との技術的な相違点を探ります。 YOLOv9理論的な革新で知られる研究に特化したアーキテクチャである。両者のアーキテクチャの違い、性能指標、多様な展開シナリオへの適合性を分析する。

Ultralytics YOLO11：プロダクションAIのスタンダード

2024年9月27日、Glenn Jocherと Jing Qiuによって発表された。 UltralyticsYOLO11 、効率的なニューラルネットワーク設計に関する広範な研究開発の集大成です。実用的な使いやすさよりも理論的な指標を優先することが多い学術的なモデルとは異なり、YOLO11 11は開発者や企業にとって速度、精度、リソース効率の最適なバランスを実現するように設計されています。

技術詳細:

著者: Glenn Jocher、Jing Qiu
組織Ultralytics
日付: 2024-09-27
GitHubultralytics
ドキュメントYOLO11 ドキュメント

アーキテクチャと機能

YOLO11 、コンパクトなフォームファクターを維持しながら、特徴抽出を強化する洗練されたアーキテクチャを導入している。改良されたバックボーンとネック構造を採用し、YOLO11のような前世代と比較して、より少ないパラメータで複雑なパターンを捉えることができるように設計されている。 YOLOv8.この設計思想により、YOLO11 モデルは、検出能力を犠牲にすることなく、エッジ・デバイスのようなリソースに制約のあるハードウェア上でも非常に優れた性能を発揮します。

YOLO11 際立った特徴は、そのネイティブな汎用性にある。多くのモデルが厳密にオブジェクト検出を行うのに対し、YOLO11 1つのフレームワークで幅広いコンピュータビジョンタスクをサポートする：

生産における強み

開発者にとってのYOLO11 主な利点は、Ultralytics エコシステムへの統合です。これにより、シンプルなPython APIと包括的なCLI合理化されたユーザーエクスペリエンスが保証される。

開発者がYOLO11選ぶ理由

YOLO11 、AIソリューションの「市場投入までの時間」を劇的に短縮します。学習と推論に必要なメモリ容量が少ないため、幅広いハードウェアに対応でき、トランスフォーマーベースの代替品に伴う高いVRAMコストを回避できる。

YOLO11の詳細について。

YOLOv9：情報のボトルネックへの対処

2024年初頭、Chien-Yao Wangと Hong-Yuan Mark Liaoによって発表されたYOLOv9 、深層学習理論の課題、特に情報ボトルネック問題の解決に焦点を当てている。YOLOv9は学術的な厳密さを証明するものであり、特徴保存で可能なことの限界を押し広げている。

技術詳細:

著者: Chien-Yao Wang、Hong-Yuan Mark Liao
組織中央研究院
Date: 2024-02-21
Arxiv:arXiv:2402.13616
GitHubWongKinYiu/yolov9
ドキュメントYOLOv9 ドキュメント

建築イノベーション

YOLOv9 、2つのコアコンセプトを中心に構築されている：プログラム可能な勾配情報（PGI）と一般化された効率的な層集約ネットワーク（GELAN）である。PGIは、深い層を通過する際に入力情報を保持し、損失関数に対して信頼性の高い勾配を計算することを目的としている。GELANはパラメータ利用を最適化し、COCO データセットのサイズに比して高い精度を達成することを可能にする。

パフォーマンスとトレードオフ

YOLOv9 生精度のベンチマークで優れており、その最大のバリエーションであるYOLOv9印象的なmAP スコアを達成している。しかし、このような学術的な焦点は、展開の複雑さにつながる可能性がある。強力ではあるが、オリジナルの実装は、Ultralytics フレームワークに見られるネイティブなマルチタスクの汎用性を欠いており、主に検出に重点を置いている。さらに、これらのアーキテクチャーのトレーニングは、YOLO11高度に最適化されたパイプラインと比較して、より多くのリソースを必要とする可能性がある。

YOLOv9もっと知る

パフォーマンス指標：スピードと精度

モデルを選択する際には、推論速度と検出精度のトレードオフを理解することが重要である。下の表は、COCO データセットにおける両モデルファミリーの性能を対比したものである。

モデル	サイズ ^{(ピクセル)}	mAP^値 50-95	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

分析

このデータは、YOLO11組み込まれたパフォーマンス・バランスを浮き彫りにしている。

効率性：YOLO11nはYOLOv9tを精度（39.5%対38.3%）で上回る一方、消費するFLOPは少なく（6.5B対7.7B）、モバイル展開に優れている。
スピード： YOLO11 、TensorRT使用したT4 GPUでの推論時間の高速化が実証されており、これはリアルタイムのビデオ解析に不可欠な要素です。
精度： YOLOv9-Eは、生のmAPでトップの座を保持していますが、レイテンシが大幅に高くなっています（YOLO11xの11.3msに対して16.77ms）。ほとんどの実用的なアプリケーションでは、YOLO11の速度上の利点が、mAPのわずかな向上を上回ります。

ユーザビリティとエコシステム

使いやすさ、文書化、サポートといった「ソフトスキル」の違いこそ、Ultralytics モデルが真に輝くところである。

使いやすさとトレーニングの効率

YOLO11 11はアクセスしやすいように設計されている。標準的な Python環境があれば、わずか数行のコードでモデルのトレーニング、検証、デプロイが可能です。Ultralytics 、転移学習を可能にする事前訓練された重みを提供し、訓練時間とAI開発のカーボンフットプリントを大幅に削減します。

対照的に、YOLOv9 Ultralytics パッケージで利用可能ですが、そのオリジナルの研究コードベースは、ディープラーニングの構成についてより深い理解を必要とします。YOLO11 ユーザーは、セグメンテーションを実行する場合でも、分類を実行する場合でも、同じように動作する統一されたインターフェースの恩恵を受けることができます。

コード比較：YOLO11シンプルさ

YOLO11 モデルのトレーニングは、Ultralytics Python APIを使って簡単に行うことができる。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

整備されたエコシステム

YOLO11 選択することは、サポートされた環境に入ることを意味します。Ultralytics エコシステムには以下が含まれます：

活発な開発： 頻繁なアップデートにより、最新のPyTorchバージョンおよびハードウェアドライバーとの互換性が確保されます。
コミュニティ・サポート： GitHubと Discord上の大規模なコミュニティでトラブルシューティングを行う。
ドキュメント： ハイパーパラメータのチューニングから ONNXモデルのエクスポートまで、すべてをカバーする豊富なガイド。

理想的なユースケース

YOLO11選ぶとき

YOLO11 、その多用途性とスピードにより、商業および趣味のプロジェクトの95%に推奨されている。

エッジAI：メモリやFLOPが限られているRaspberry Piや NVIDIA Jetsonのようなデバイスに展開する。
リアルタイム監視： セキュリティ監視のために高いFPSを必要とするアプリケーション。
マルチタスクアプリケーション：複数の異なるモデルアーキテクチャを管理することなく、同時に検出、セグメンテーション、ポーズ推定を必要とするプロジェクト。

YOLOv9選ぶとき

YOLOv9 、特定のアカデミックまたは高精度のシナリオに最適である。

研究ベンチマーク：理論的なアーキテクチャを比較したり、COCOようなデータセットで特定のmAP スコアに勝ったりすることが主な目的である場合。
オフライン処理：推論速度に制約がなく、オフラインの医用画像解析のように数パーセントの精度が重要な場面。

結論

一方 YOLOv9はPGIやGELANのような魅力的なコンセプトをアカデミック・コミュニティに紹介している、 Ultralytics YOLO11は、AI製品を構築するための優れた実用的な選択肢として際立っている。スピード、精度、多用途性、使いやすさの比類ない組み合わせにより、現代のコンピューター・ビジョンに最適なモデルとなっている。堅牢なエコシステムに支えられ、効率性を重視して設計されたYOLO11 11は、開発者がコンセプトから展開まで自信を持って移行できるようにします。

その他のモデルを見る

さらなる比較にご興味のある方は、Ultralytics ライブラリにある他の高性能モデルの調査をご検討ください：

YOLOv10: リアルタイムのエンドツーエンド物体detect。
YOLOv8: YOLO11 の前身であり、現在も製造で広く使用されています。
RT-DETR: GPUが豊富な環境向けに高い精度を提供するTransformerベースのdetector。