Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0とYOLOv5の比較#

リアルタイム物体検出の進化により、さまざまな導入シナリオに最適化された複数のアーキテクチャが登場しました。本稿では、業界向けの「YOLOv6-3.0」と、汎用性が非常に高い「Ultralytics YOLOv5」という2つの主要なモデルを深く掘り下げて比較します。それぞれのアーキテクチャの選択、パフォーマンス指標、エコシステムのサポートを理解することは、実際のアプリケーションに最適なコンピュータビジョンフレームワークを選択する助けとなります。

Link to this sectionYOLOv6-3.0:産業用スループットとハードウェア最適化#

MeituanのVision AI部門によって開発されたYOLOv6-3.0は、高いスループットを求める産業環境に大きく適応しています。これは、専用のNVIDIA GPUなどのハードウェアアクセラレータ上でのフレームレートを最大化することに重点を置いています。

  • 著者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
  • 組織: Meituan
  • 日付: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6
  • ドキュメント: YOLOv6 Documentation

Link to this sectionアーキテクチャの強み#

YOLOv6-3.0は、速度向上のために設計されたいくつかの構造上の最適化を導入しています。このモデルは、GPU推論時にハードウェアフレンドリーになるよう特別に設計されたEfficientRepバックボーンを採用しています。これにより、オフラインのバッチ処理タスクにおいて、このアーキテクチャは特に強力なものとなっています。

トレーニングフェーズでは、モデルに**Anchor-Aided Training (AAT)戦略が組み込まれています。この手法は、アンカーベースのトレーニングの安定性と、アンカーフリー推論の速度を両立させることを目指したものです。さらに、そのネックアーキテクチャでは、スケール間での特徴融合を改善するためにBi-directional Concatenation (BiC)**モジュールを使用しています。TensorRTを使用するハイエンドサーバーGPU向けに高度に最適化されていますが、この専門化により、CPUのみの環境や低電力のエッジデバイスではレイテンシが増大する場合があります。

YOLOv6の詳細はこちら

Link to this sectionUltralytics YOLOv5: アクセシブルなVision AIのパイオニア#

UltralyticsによってリリースされたYOLOv5は、使いやすさ、トレーニング効率、堅牢な導入において新しい基準を打ち立てました。これは、最新のディープラーニングワークフローと密接に統合することで、高性能な物体検出を民主化しました。

Link to this sectionエコシステムと汎用性#

YOLOv5の決定的な特徴はその使いやすさにあります。PyTorchフレームワーク上でネイティブに構築されており、リポジトリは機械学習のライフサイクルを劇的に簡素化する統合されたPython APIを提供します。データセットの構成から最終的なデプロイに至るまで、統合されたエコシステムにより、開発者は環境のデバッグに費やす時間を減らし、アプリケーションの構築により多くの時間を割くことができます。

YOLOv5は物体検出に限定されません。並外れた汎用性を誇り、画像分類およびインスタンスセグメンテーションをネイティブでサポートしています。さらに、スマートキャッシング、自動データローダー、分散型マルチGPUトレーニングへの組み込みサポートを備え、比類のないトレーニング効率を提供します。

Ultralyticsモデルにおけるメモリ効率

モデルアーキテクチャを比較する際、メモリ消費量は重要な要素です。Ultralytics YOLOモデルは、負荷の高いTransformerモデルと比較して、トレーニングおよび推論の両方でVRAM要件を大幅に低く維持しており、コンシューマー向けハードウェアやGoogle Colabのようなクラウドノートブックを使用する開発者にとって非常に利用しやすくなっています。

YOLOv5の詳細はこちら

Link to this sectionパフォーマンスとアーキテクチャの比較#

以下の表は、標準的なCOCO datasetで評価した場合の、両方のアーキテクチャのパフォーマンス指標をまとめたものです。モデルがさまざまな環境で、平均適合率(mAP)と推論速度のトレードオフをどのようにバランスさせているかに注目してください。

モデルサイズ
(ピクセル)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
パラメータ
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this section分析#

YOLOv6-3.0は、印象的なmAPスコアを達成しており、T4 GPU上のTensorRTパイプライン向けに高度に最適化されています。一方、YOLOv5は、ONNX、CoreML、TFLiteなどの複数のフォーマットへの即時エクスポートをサポートする、非常にしっかりとメンテナンスされたエコシステムで対抗しています。このパフォーマンスのバランスにより、YOLOv5は専用サーバーだけでなく、モバイルデバイスやRaspberry Piのようなエッジコンピューティング環境でも確実に動作します。

Link to this sectionコード例: Ultralyticsによるシームレスなトレーニング#

Ultralyticsエコシステムの最大の利点の1つは、合理化されたユーザー体験です。モデルのトレーニング、評価、エクスポートは、数行のPythonコードだけで完了します。

from ultralytics import YOLO

# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format for flexible deployment
model.export(format="onnx")

Link to this section理想的なユースケースとデプロイシナリオ#

これらのアーキテクチャのどちらを選択するかは、多くの場合、特定のインフラストラクチャの制約に依存します。

  • YOLOv6-3.0の導入時期: 専用のNVIDIA GPUが利用可能で、レイテンシを最小限に抑える必要がある自動製造ラインや、高スループットのサーバー分析に最適です。そのアーキテクチャは、TensorRTの最適化を最大限に活用できる環境で真価を発揮します。
  • YOLOv5の導入時期: ラピッドプロトタイピング、クロスプラットフォーム展開、および統合されたパイプラインを求めるチームに最適です。その多様なエクスポート機能により、エッジデバイスでの小売分析、農業用ドローン監視、およびフィットネスアプリでの姿勢推定に理想的です。

Link to this section物体検出の未来: YOLO26の登場#

YOLOv5とYOLOv6は重要なマイルストーンを象徴していますが、コンピュータビジョンの分野は急速に進歩しています。新しいプロジェクトを開始する開発者や、究極の最先端技術を求める開発者には、Ultralytics YOLO26(2026年1月リリース)へのアップグレードを強くお勧めします。

YOLO26は、画期的なエンドツーエンドのNMSフリー設計を導入することで、エッジファーストのVision AIを再定義します。Non-Maximum Suppression(後処理)の必要性を排除することで、デプロイロジックを簡素化し、レイテンシのばらつきを劇的に低減します。

YOLO26の主な革新点は以下の通りです:

  • MuSGDオプティマイザ: SGDとMuonのハイブリッドであり、高度なLLMトレーニングの安定性をコンピュータビジョンにもたらし、より高速で信頼性の高い収束を実現します。
  • 最大43%高速なCPU推論: 専用のアクセラレータがない環境向けに高度に最適化されています。
  • DFLの削除: Distribution Focal Lossを削除することで、エクスポートプロセスが簡素化され、低電力エッジデバイスとの互換性が向上します。
  • ProgLoss + STAL: 航空画像やスマートシティのIoTセンサーにとって極めて重要な、小さな物体の認識精度を大幅に向上させる高度な損失関数です。

汎用タスク向けには、YOLO11もUltralyticsファミリー内で、完全にサポートされた優れた選択肢であり続けています。

YOLO26の詳細はこちら

Link to this section結論#

YOLOv6-3.0とYOLOv5の両方が、リアルタイム検出の進歩において中心的な役割を果たしてきました。YOLOv6-3.0は、GPU加速スループットのために高度に専門化されたアーキテクチャを提供し、一方のYOLOv5は、広範なドキュメント、使いやすさ、マルチタスク機能を通じて、比類のない開発者体験を提供しています。

最新のアプリケーションにおいて、統合されたUltralyticsエコレステムを活用することは、将来を見据えたワークフローを保証します。YOLO26のような最新のアーキテクチャを採用することで、デプロイパイプラインがスピード、精度、アルゴリズムのシンプルさにおける最新のブレークスルーを確実に享受できるようにします。

コメント