Link to this sectionDAMO-YOLOとYOLOv5の比較#
コンピュータビジョンの進化は、リアルタイム物体検出における絶え間ないイノベーションによって特徴付けられてきました。今日、開発者や研究者は、ビジョンパイプラインを設計する際に数多くのアーキテクチャの選択肢に直面しています。この包括的な技術比較では、DAMO-YOLOとUltralytics YOLOv5の間の微妙な違いを探り、それぞれのアーキテクチャ、学習手法、性能指標、および理想的なデプロイシナリオに焦点を当てます。
Link to this sectionDAMO-YOLOの紹介#
Alibaba GroupによってリリースされたDAMO-YOLOは、検出速度と精度の限界を押し広げることを目的としたいくつかの新しい手法を導入しました。
- 著者: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
- 組織: Alibaba Group
- 日付: 2022年11月23日
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
- ドキュメント: README.md
Link to this sectionアーキテクチャの革新#
DAMO-YOLOはニューラルアーキテクチャ探索(NAS)を基礎として構築されています。著者らは、MAE-NASを利用して、レイテンシと精度のバランスをとるバックボーンを自動的に設計しました。このモデルは、異なるスケール間での特徴融合を改善する効率的なRepGFPN(再パラメータ化汎用特徴ピラミッドネットワーク)を導入しています。さらに、DAMO-YOLOは「ZeroHead」設計を採用しており、複雑なマルチブランチ予測ヘッドを取り除き、推論中の再パラメータ化に大きく依存する、より単純で効率的な構造を採用しています。
学習を改善するために、このモデルはラベル割り当てにAlignedOTAを使用し、より大きな「教師」モデルが小さな「生徒」モデルを導いてより高い精度を達成する強力な蒸留強化プロセスを使用しています。
Link to this sectionUltralytics YOLOv5の紹介#
Ultralytics YOLOv5は、世界で最も広く採用されているビジョンアーキテクチャの1つであり、その安定性、使いやすさ、および広範なデプロイエコシステムで有名です。
- 著者: Glenn Jocher
- 組織: Ultralytics
- 日付: 2020年6月26日
- GitHub: ultralytics/yolov5
- ドキュメント: YOLOv5ドキュメント
Link to this sectionエコシステムの標準#
YOLOv5は、ユーザビリティに関する業界標準を再定義しました。PyTorchでネイティブに構築されており、高度に最適化されたCSPNetバックボーンと、堅牢な特徴集約のためのPANetネックを利用しています。後のモデルで見られるアンカーフリーのトレンドに先駆けて登場しましたが、自動アンカー学習と組み合わせた非常に洗練されたアンカーベースのアプローチにより、導入直後から優れたパフォーマンスを保証します。
YOLOv5の真の強みは、適切に維持管理されたエコシステムにあります。CometやWeights & Biasesのようなトラッキングツールとシームレスに統合し、ONNX、TensorRT、CoreMLなどのフォーマットへのワンクリックエクスポートをサポートしています。
YOLOv5は、カスタムデータセットでの学習が非常に簡単です。合理化されたAPIがプロトタイプから本番環境への移行の摩擦を軽減し、アジャイルなエンジニアリングチームの間で人気となっています。
Link to this sectionパフォーマンスと指標の比較#
これらのモデルを比較する際は、mean Average Precision (mAP)、推論速度、およびパラメータ数のバランスを見ることが不可欠です。
| モデル | サイズ (ピクセル) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | パラメータ (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionトレードオフの分析#
DAMO-YOLOは、そのパラメータサイズに対して印象的なmAPスコアを達成しており、蒸留学習フェーズから大きな恩恵を受けています。しかし、これは学習効率の代償を伴います。多段階の蒸留プロセスでは、まず重い教師モデルを学習させる必要があり、必要なGPU計算時間とVRAMが大幅に増加します。
対照的に、YOLOv5は優れたメモリ要件を提供します。Ultralytics YOLOモデルは、複雑な蒸留パイプラインやRT-DETRのようなTransformerベースのモデルと比較して、学習および推論中のメモリ使用量が少ないことで知られています。これにより、YOLOv5はコンシューマ向けのハードウェアや、Google Colabのような利用しやすいクラウド環境で効率的に学習できます。
Link to this section現実世界のアプリケーションと汎用性#
適切なアーキテクチャの選択は、多くの場合、デプロイ環境に依存します。
Link to this sectionDAMO-YOLOの強み#
DAMO-YOLOは厳密に物体検出モデルです。学術研究、特にニューラルアーキテクチャ探索を研究しているチームや、論文で詳述されている再パラメータ化手法を再現しようとしているチームにとって、優れた選択肢です。プロジェクトに蒸留学習フェーズを実行するための広範な計算リソースがあり、2Dバウンディングボックスの精度を極限まで引き出すことのみに焦点を当てている場合、DAMO-YOLOは強力な候補となります。
Link to this sectionUltralyticsの利点#
実社会の本番環境においては、Ultralyticsモデルの使いやすさと汎用性が好まれる理由です。YOLOv5は依然として検出および画像分類の主力ですが、より広範なUltralyticsエコシステムにより、開発者はタスクを容易に切り替えることができます。
例えば、Ultralyticsファミリーの新しいイテレーションは、インスタンスセグメンテーション、姿勢推定、および指向性バウンディングボックス (OBB)検出をネイティブにサポートしています。このマルチタスク機能により、チームは自動ナンバープレート認識と車両セグメンテーションを組み合わせるような複雑なパイプラインのために、単一の統一されたPython APIを活用できます。
Link to this sectionユースケースと推奨事項#
DAMO-YOLOとYOLOv5の選択は、プロジェクト固有の要件、デプロイの制約、およびエコシステムの優先順位に依存します。
Link to this sectionDAMO-YOLOを選択すべきケース#
DAMO-YOLOは以下のような場合に強力な選択肢となります。
- 高スループットビデオ解析: バッチサイズ1でのスループットが主要な指標となる、固定のNVIDIA GPUインフラストラクチャ上での高FPSビデオストリーム処理。
- 産業用製造ライン: 組立ラインでのリアルタイム品質検査など、専用ハードウェア上での厳格なGPUレイテンシ制約があるシナリオ。
- Neural Architecture Searchの研究: 自動化されたアーキテクチャ探索 (MAE-NAS) や効率的な再パラメータ化バックボーンが検出パフォーマンスに与える影響の研究。
Link to this sectionYOLOv5を選択すべき場合#
YOLOv5は以下のような場合に推奨されます:
- 実証済みの本番システム: YOLOv5の長期にわたる安定性の実績、広範なドキュメント、および膨大なコミュニティサポートが重視される既存のデプロイ環境。
- リソースが制限されたトレーニング: GPUリソースが限られており、YOLOv5の効率的なトレーニングパイプラインと低いメモリ要件が有利に働く環境。
- 広範なエクスポート形式のサポート: ONNX、TensorRT、CoreML、TFLiteを含む多くのフォーマット全体でのデプロイが必要なプロジェクト。
Link to this sectionUltralytics (YOLO26) を選択すべき時#
ほとんどの新規プロジェクトにおいて、Ultralytics YOLO26はパフォーマンスと開発者体験の最良の組み合わせを提供します。
- NMSフリーのエッジ展開: Non-Maximum Suppression後処理の複雑さを伴わずに、一貫した低レイテンシの推論が求められるアプリケーション。
- CPUのみの環境: GPUアクセラレーションを利用できないデバイスにおいて、YOLO26の最大43%高速なCPU推論が決定的な利点となる場合。
- 小さな物体の検出: aerial drone imageryやIoTセンサー分析のような困難なシナリオで、ProgLossとSTALが微小な物体の検出精度を大幅に向上させる場合。
Link to this section未来: YOLO26 への移行#
YOLOv5は伝説的な存在であり、DAMO-YOLOは興味深い学術的な洞察を提供しますが、最先端技術は進化しています。2026年1月にリリースされたUltralytics YOLO26は、ビジョンコミュニティにとって大きな飛躍を遂げたことを表しています。
YOLO26は、エッジデプロイと学習不安定性の従来のボトルネックに対処しています。
- エンドツーエンドのNMSフリー設計: YOLO26は、Non-Maximum Suppression後処理をネイティブに排除します。このブレークスルーにより、デプロイロジックが簡素化され、レイテンシのばらつきが大幅に減少するため、高速ロボティクスや自律システムに理想的です。
- MuSGDオプティマイザ: LLM学習のイノベーション(Moonshot AIのKimi K2など)に触発され、YOLO26はMuSGDオプティマイザ(SGDとMuonのハイブリッド)を利用しています。これにより、非常に安定した学習実行と驚くほど高速な収束が保証されます。
- 最大43%高速なCPU推論: Distribution Focal Loss (DFL)を戦略的に削除することで、YOLO26はYOLO11やYOLOv8といった前世代と比較して、CPUおよびエッジデバイス上で圧倒的に優れた速度を達成しています。
- ProgLoss + STAL: これらの高度な損失関数は、空中ドローン画像やIoTセンサーフィードの解析に不可欠な、小さな物体の認識において顕著な改善をもたらします。
Link to this sectionコード例: シンプルな動作#
Ultralyticsパッケージを使用すると、わずか数行のコードでモデルの学習とデプロイが可能になります。YOLOv5を使用している場合でも、推奨されるYOLO26にアップグレードする場合でも、インターフェースは一貫しており直感的です。
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Export the model for edge deployment
model.export(format="onnx")Link to this section結論#
DAMO-YOLOとYOLOv5はどちらも、コンピュータビジョンの領域に大きく貢献してきました。DAMO-YOLOはニューラルアーキテクチャ探索と蒸留の力を示しており、研究者にとって興味深い研究対象となっています。しかし、YOLOv5は、そのパフォーマンスのバランス、低いメモリ要件、比類のない使いやすさにより、依然として実用的な強力なツールです。
今日新しいプロジェクトを開始する開発者には、Ultralytics Platformを活用し、YOLO26を採用することを推奨します。これは、YOLOv5の愛されているユーザーフレンドリーなエコシステムと画期的なアーキテクチャの進歩を組み合わせたもので、クラウドAIアプリケーションとエッジAIアプリケーションの両方で、最高レベルの精度と驚異的な推論速度を保証します。開発者は、特定のレガシーハードウェアの制約に応じて、YOLOv6やYOLOXなどの他の効率的なモデルを探求することもできます。