コンテンツにスキップ

YOLO11 YOLOv7詳細な技術比較

適切な物体検出モデルの選択は、コンピュータビジョンアプリケーションの速度、精度、スケーラビリティに影響を与える重要な決定です。このガイドでは Ultralytics YOLO11YOLOv7YOLO Only Look Once)の系譜における2つの重要なマイルストーンである。YOLOv7 2022年に大きな飛躍を遂げたのに対して、最近リリースされたYOLO11 11は、最新のAI開発のための最先端のパフォーマンスを再定義するアーキテクチャの改良を導入しています。

Ultralytics YOLO11:ビジョンAIの新基準

2024年後半発売、 Ultralytics YOLO11は、前作の堅牢な基盤の上に構築され、比類のない効率性と汎用性を実現します。これは、単一の統一されたフレームワーク内で、幅広いコンピュータビジョンタスクを処理するように設計されています。

アーキテクチャとイノベーション

YOLO11 、C3k2ブロックと C2PSA(Cross-Stage Partial with Spatial Attention)メカニズムを搭載した、より洗練されたアーキテクチャが導入されている。これらの機能強化により、前世代と比較してパラメータ数を抑えながら、よりきめ細かく特徴を抽出することが可能になりました。アーキテクチャはスピードのために最適化されており、より大きなモデルのバリエーションであっても、標準的なハードウェア上でリアルタイムの推論機能を維持することができます。

YOLO11 特徴は、インスタンスのセグメンテーションポーズ推定オリエンテッドバウンディングボックス(OBB)検出、画像分類など物体検出以外の複数のタスクをネイティブにサポートしていることだ。

Ultralytics エコシステム統合

YOLO11 11はUltralytics エコシステムに完全に統合されており、開発者はデータ管理、モデルトレーニング、デプロイのためのツールにシームレスにアクセスできます。この統合により、MLOpsパイプラインの複雑さが大幅に軽減され、チームはプロトタイプからプロダクションへ迅速に移行することができます。

YOLO11の詳細について。

YOLOv7:効率的なトレーニングのベンチマーク

2022年半ばにリリースされたYOLOv7、推論コストを増加させることなく高精度を達成するため、学習プロセスの最適化に重点を置いた。YOLOv7はいくつかの新しいコンセプトを導入し、その後の研究に影響を与えた。

アーキテクチャとイノベーション

YOLOv7 7の中核はE-ELAN(Extended Efficient Layer Aggregation Network)であり、元の勾配経路を破壊することなくモデルの学習能力を向上させる。著者らはまた、モデルの再パラメータ化や補助的な検出ヘッドなど、最適化戦略のコレクションである「trainable bag-of-freebies」を導入した。

YOLOv7 リリース時に印象的なベンチマークを設定したが、それは主にオブジェクト検出アーキテクチャである。セグメンテーションやポーズ推定のような他のタスクに適用するには、コードベースの特定のブランチやフォークが必要になることが多く、新しいモデルの統一されたアプローチとは対照的である。

レガシー・アーキテクチャー

YOLOv7 、アンカーベースの検出方法と複雑な補助ヘッドに依存しています。効果的ではあるが、このようなアーキテクチャの選択は、最新のUltralytics 見られる合理的でアンカーのない設計に比べ、エッジ展開のためのモデルのカスタマイズや最適化を困難にする可能性がある。

YOLOv7もっと知る

性能分析:速度、精度、効率

技術的な指標を比較すると、YOLO11アーキテクチャの進歩が明らかになる。新しいモデルは、大幅に少ないパラメータと高速な推論速度で、同等かそれ以上の精度を達成している。

モデルサイズ
(ピクセル)
mAP
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

主なポイント

  1. パラメータ効率: YOLO11 、モデルサイズを大幅に削減します。例えば、YOLO11lはYOLOv7xの精度(53.4%対53.1%mAP)を上回る一方で、使用するパラメータは65%近く少ない(25.3M対71.3M)。この削減は、ストレージやメモリが限られたデバイスにモデルを展開する上で非常に重要です。
  2. 推論速度: YOLO11 アーキテクチャの最適化は、そのまま速度に反映される。T4GPU TensorRTを使用するT4 GPUでは、YOLO11lはYOLOv7xの約2倍高速です。CPUアプリケーションでは、軽量のYOLO11nが驚異的なスピード(56.1 ms)を提供し、YOLOv7 亜種が苦戦するようなエッジハードウェアでのリアルタイム検出を可能にする。
  3. 演算要件: YOLO11 モデルでは、FLOP(浮動小数点演算)数が大幅に削減されている。このように計算負荷が低いため、消費電力と発熱が少なく、YOLO11 バッテリー駆動のエッジAIデバイスに非常に適しています。

エコシステムと開発者エクスペリエンス

生の指標だけでなく、開発者の経験も大きな差別化要因です。Ultralytics YOLO モデルは、その使いやすさと堅牢なエコシステムで有名です。

合理化されたワークフロー

YOLOv7 通常、リポジトリのクローンを作成し、トレーニングやテストのために複雑なシェルスクリプトを操作する必要がある。対照的に、YOLO11 11は標準的なPython パッケージ(ultralytics).これにより、開発者はわずか数行のコードで、高度なコンピューター・ビジョン機能をソフトウェアに組み込むことができる。

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed)
model = YOLO("yolo11n.pt")

# Train the model with a single command
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

汎用性とトレーニング効率

YOLO11 、すぐに使える幅広いタスクをサポートしている。プロジェクトの要件が、単純なバウンディング・ボックスから インスタンスセグメンテーション または ポーズ推定開発者は、モデルのウェイトファイルを単純に切り替えることができる、 yolo11n-seg.ptコードベースやパイプライン全体を変更することなく)。YOLOv7 通常、これらのタスクのために特定のフォークを見つけて設定する必要がある。

さらに、YOLO11 11はトレーニングの効率性にも優れている。モデルは最新の最適化技術を利用し、高品質の事前学習済みウェイトが付属しており、多くの場合、古いアーキテクチャよりも高速に収束します。この効率性はメモリ要件にも及びます。Ultralytics モデルは、トレーニング中のCUDA メモリ使用量を最小限に抑えるように最適化されており、旧式の検出器やTransformerベースの検出器を悩ませる一般的なOOM(Out-Of-Memory)エラーを防ぎます。

ドキュメンテーションとサポート

Ultralytics 、広範なドキュメントと活気あるコミュニティを維持しています。ユーザーは、頻繁なアップデートやバグ修正、企業サポートのための明確なパスから利益を得ることができる。逆に、YOLOv7 リポジトリは、歴史的に重要ではあるが、あまり積極的にメンテナンスされていないため、長期的な本番導入にはリスクがある。

現実世界のアプリケーション

  • 小売分析: YOLO11 高い精度とスピードは、標準的な店舗のハードウェアで、リアルタイムでの顧客行動追跡と在庫監視を可能にします。
  • 自律型ロボットYOLO11nはレイテンシーが低いため、ミリ秒単位が重要なドローンやロボットのナビゲーションや障害物回避に最適です。
  • ヘルスケア画像:セグメンテーションのネイティブサポートにより、YOLO11 、医療用スキャン画像の異常箇所を高精度で特定し、輪郭を描くために素早く適応することができます。
  • 工業用検査: YOLO11 、OBB(Oriented Bounding Boxes)を扱うことができるため、標準のYOLOv7ない、組み立てラインで回転した部品や文字を検出するのに優れています。

結論

YOLOv7 依然として有能なモデルであり、2022年のコンピュータービジョンの急速な進歩の証である、 Ultralytics YOLO11は、最新のAI開発のための決定的な選択肢です。性能効率使いやすさのバランスが優れている。

開発者や研究者にとって、YOLO11 移行は、推論時間の短縮、ハードウェアコストの削減、多様なビジョンタスクのための統一されたワークフローといったメリットを即座にもたらします。活発なUltralytics エコシステムに支えられたYOLO11 、単なるモデルではなく、実世界で最先端のコンピュータービジョンを展開するための包括的なソリューションです。

さらなる探求

より多くの比較を検討し、特定のニーズに最適なモデルを見つけましょう:


コメント