Link to this sectionYOLO11とDAMO-YOLOの比較#
最適なアーキテクチャの選択は、あらゆるコンピュータビジョンプロジェクトにおいて極めて重要なステップです。この技術ガイドでは、2つの強力な物体検出モデルであるUltralytics YOLO11とDAMO-YOLOを総合的に比較します。両者のアーキテクチャ上の革新、学習パラダイム、実用性について深く掘り下げ、デプロイメントのニーズに最適なツールを選択できるようサポートします。
Link to this sectionモデルの概要#
Link to this sectionUltralytics YOLO11#
Ultralyticsチームによって開発されたYOLO11は、YOLOファミリーにおける高度に洗練されたイテレーションであり、精度と効率の両面を大幅に最適化しています。データセット管理からエッジデプロイメントまでを網羅する、統合された本番環境対応のエコシステムを求める研究者やエンジニア向けに設計されています。
- 著者: Glenn Jocher and Jing Qiu
- 組織: Ultralytics
- 日付: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- ドキュメント: https://docs.ultralytics.com/models/yolo11/
YOLO11はその汎用性に優れています。従来の多くのモデルがバウンディングボックスのみに焦点を当てる一方、YOLO11は物体検出、インスタンスセグメンテーション、画像分類、および姿勢推定をネイティブでサポートしています。このマルチモーダル機能により、開発者はビジョンAIパイプラインを単一の適切にメンテナンスされたフレームワークに統合できます。
Link to this sectionDAMO-YOLO#
DAMO-YOLOは、Alibaba Groupの研究者によって開発されました。ニューラルアーキテクチャ探索(NAS)を活用して、GPUやその他のアクセラレータ上でのリアルタイム推論に最適化された高効率なバックボーンを生成します。
- 著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
- 組織: Alibaba Group
- 日付: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- ドキュメント: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLOの核心的な哲学は、レップ・パラメータリゼーション(再パラメータ化)と自動探索にあります。MAE-NAS(多目的進化的ニューラルアーキテクチャ探索)を利用することで、著者は特殊なハードウェア上での推論速度を大幅に向上させるカスタムバックボーンを設計しました。また、レイテンシを最小限に抑えるために、Efficient RepGFPNと呼ばれる高度に最適化されたネックと、簡略化されたZeroHead構造を採用しています。
YOLO11とDAMO-YOLOを比較する際は、より新しいUltralytics YOLO26も検討してください。これはネイティブなエンドツーエンドのNMSフリー推論を導入し、CPU速度を最大43%向上させています。YOLOXやYOLOv8との比較も併せてご確認ください。
Link to this section性能とアーキテクチャの比較#
エッジAIアプリケーションをデプロイする際には、性能のトレードオフを理解することが不可欠です。以下の表は、平均適合率 (mAP)、レイテンシ、計算サイズなどの主要なメトリクスを概説しています。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Link to this sectionアーキテクチャの深掘り#
YOLO11は、パラメータ数と表現能力のバランスを完璧に保つ、効率的かつカスタム設計されたバックボーンに依存しています。学習時および推論時のCUDAメモリ使用量を最小限に抑えながら、様々なハードウェア環境で優れた性能を発揮するよう最適化されています。このため、一般的なコンシューマー向けハードウェアやリソース制約のあるIoTデバイスにとって素晴らしい選択肢となります。
対照的に、DAMO-YOLOのMAE-NASによって生成されたバックボーンは、高スループットのGPU環境向けに微調整されています。そのEfficient RepGFPN(一般化特徴ピラミッドネットワーク)は、複数のスケールを積極的に統合します。しかし、レップ・パラメータリゼーションは推論を高速化する一方で、使用するハードウェアスタックがこれらの操作を明示的にサポートしていない場合、デプロイメントプロセスが複雑になる可能性があります。
Link to this sectionユーザビリティと学習効率#
開発時間を考慮する場合、モデルの使いやすさは純粋なベンチマーク数値と同じくらい重要になります。
YOLO11は、開発者のアクセシビリティという原則に基づいて構築されています。包括的なultralyticsパッケージは、データセットの解析、拡張、ハイパーパラメータ調整などの煩雑な作業を抽象化します。モデルをONNX、TensorRT、OpenVINOといった本番環境向けのフォーマットにエクスポートするには、単一のコマンドを実行するだけです。
from ultralytics import YOLO
# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")
# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)学術的かつ研究重視の背景を持つDAMO-YOLOは、学習曲線が急峻です。最高の精度を達成するには、多くの場合、複雑な知識蒸留パイプラインが必要となります。つまり、巨大な「教師」ネットワークを先に学習させ、その知識をより小さな「学生」ネットワークに引き継ぐ必要があるのです。これは、Ultralyticsモデルの効率的な学習ループと比較して、必要なGPUコンピュートオーバーヘッドと全体的な学習時間を大幅に増大させます。
Link to this sectionユースケースと推奨事項#
YOLO11とDAMO-YOLOのどちらを選択するかは、特定のプロジェクト要件、デプロイメントの制約、およびエコシステムの好みによって異なります。
Link to this sectionYOLO11を選択すべき時#
YOLO11は以下のような場合に適しています:
- 本番環境へのエッジ展開: Raspberry PiやNVIDIA Jetsonなどのデバイス上で動作する商業アプリケーションで、信頼性と継続的なメンテナンスが最優先される場合。
- マルチタスクビジョンアプリケーション: 単一の統合フレームワーク内でdetection、segmentation、pose estimation、OBBが必要なプロジェクト。
- 迅速なプロトタイピングと展開: 効率化されたUltralytics Python APIを使用して、データ収集から本番運用まで素早く移行する必要があるチーム。
Link to this sectionDAMO-YOLOを選択すべきケース#
DAMO-YOLOは以下の場合に推奨されます:
- 高スループットビデオ解析: バッチサイズ1でのスループットが主要な指標となる、固定のNVIDIA GPUインフラストラクチャ上での高FPSビデオストリーム処理。
- 産業用製造ライン: 組立ラインでのリアルタイム品質検査など、専用ハードウェア上での厳格なGPUレイテンシ制約があるシナリオ。
- Neural Architecture Searchの研究: 自動化されたアーキテクチャ探索 (MAE-NAS) や効率的な再パラメータ化バックボーンが検出パフォーマンスに与える影響の研究。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this section実世界のアプリケーションとユースケース#
Link to this section自律システムとドローン#
航空画像およびUAV(無人航空機)のデプロイメントにおいて、YOLO11は非常に有利な性能バランスを提供します。ドローン解析において小さな物体を検出することは大きな障壁ですが、YOLO11は様々なスケールをネイティブで処理できます。さらに、低いメモリ要件により、YOLO11のNanoおよびSmallバリアントは、ドローンに搭載された軽量なエッジCPUやNPU上で直接実行可能です。
Link to this section産業オートメーションと品質管理#
スマート工場において、レイテンシは最優先事項です。DAMO-YOLOはRepGFPNネックのおかげで高性能なサーバーグレードGPU上で堅牢な推論速度を提供しますが、その厳格な統合は過剰な場合があります。YOLO11は、シンプルなトラッキングAPIや、欠陥の検出に角度付きの境界認識が必要な場合に純粋な検出から指向性バウンディングボックス (OBB)タスクへとシームレスに切り替えられる能力により、自動品質管理のためのより優れた代替手段となることがよくあります。
Link to this sectionスマートヘルスケアと医用画像処理#
医用画像データセットは比較的小さいことが多く、過学習を防ぐのは困難です。Ultralyticsの適切にメンテナンスされたエコシステムが提供する活発なデータ拡張技術と標準的な転送学習パイプラインを組み合わせることで、臨床医や開発者は正確な腫瘍検出モデルを確実にデプロイできます。広範なコミュニティサポートにより、ヘルスケアのような複雑なドメインにおける問題も迅速に解決されます。
新しいアプリケーションをゼロから構築する場合は、YOLO26を試すことを検討してください。2026年初頭にリリースされたこのモデルは、MuSGDオプティマイザーとProgLoss関数を活用し、小さな物体に対して優れた精度を発揮するとともに、エンドツーエンドのNMSフリーなパイプラインを標準で提供します!
最終的に、DAMO-YOLOは依然としてニューラルアーキテクチャ探索の強力なデモンストレーションである一方で、YOLO11と広範なUltralyticsファミリーは、迅速なデプロイメント、開発者の利便性、そしてトップクラスのマルチモーダル性能を優先させる実世界のコンピュータビジョンタスクにおいて、決定的な推奨事項であり続けます。