DAMO-YOLO ve YOLOv6-3.0: Endüstriyel Nesne Dedektörlerinin Kapsamlı Bir Karşılaştırması

Bilgisayarlı görüdeki hızlı evrim, endüstriyel uygulamalar için özel olarak tasarlanmış oldukça uzmanlaşmış mimariler ortaya çıkardı. Bunlar arasında, gerçek zamanlı performans ve dağıtım verimliliğine odaklanmalarıyla iki ağır top öne çıkıyor: DAMO-YOLO ve YOLOv6-3.0. Bu sayfa, dağıtım seçeneklerini belirlemene yardımcı olmak için mimarilerinin, performans metriklerinin ve eğitim metodolojilerinin derinlemesine teknik bir karşılaştırmasını sunar.

DAMO-YOLO: Sinirsel Mimari Arayışı Nesne Tespiti ile Buluşuyor

Alibaba Group araştırmacıları tarafından geliştirilen DAMO-YOLO, Sinirsel Mimari Arayışını (NAS) omurga tasarımına yoğun bir şekilde entegre ederek YOLO ailesine yeni bir yaklaşım getiriyor.

Mimari Yenilikler

DAMO-YOLO, belirli gecikme kısıtlamaları altında optimal ağ yapılarını otomatik olarak arayan MAE-NAS adlı NAS ile optimize edilmiş bir omurga kullanır. Bu, modelin farklı donanım profillerinde verimli bir şekilde ölçeklenmesini sağlar. Özellik birleşimini iyileştirmek için mimari, çok ölçekli temsili önemli ölçüde geliştiren verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) kullanır.

Ayrıca model, "ZeroHead" tasarımını sunar. Tespit kafasındaki karmaşık çok dallı yapıları kaldırarak, hesaplama yükünü azaltırken mekansal bilgiyi daha etkili bir şekilde korur. Eğitim metodolojisi ayrıca AlignedOTA (Hizalı Optimal Taşıma Ataması) ve sağlam bilgi damıtmadan yararlanarak daha küçük öğrenci modellerinin daha ağır öğretmen ağlarından öğrenmesine olanak tanır.

DAMO-YOLO hakkında daha fazla bilgi edinin

Damıtma Karmaşıklığı

Bilgi damıtma, DAMO-YOLO'nun yüksek doğruluk elde etmesine yardımcı olsa da çok aşamalı bir eğitim hattı gerektirir. Bu, standart, tek aşamalı modelleri eğitmeye kıyasla gereken GPU compute miktarını ciddi şekilde artırır.

YOLOv6-3.0: Endüstriyel İş Hacmini Maksimuma Çıkarma

Meituan Vision AI Departmanı tarafından öncülük edilen YOLOv6-3.0, özellikle NVIDIA donanımında iş hacmini en üst düzeye çıkarmak için tasarlanmış, endüstriyel bir nesne dedektörü olarak açıkça etiketlenmiştir.

  • Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
  • Kuruluş: Meituan
  • Tarih: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Temel Özellikler ve Geliştirmeler

YOLOv6-3.0, modern GPU'larda TensorRT gibi optimizasyonlardan yararlanırken onu son derece hızlı kılan, donanım dostu EfficientRep omurgası üzerine inşa edilmiştir. v3.0 sürümünde ağ, değişen nesne boyutlarının yerelleştirilmesini iyileştirmek için Çift Yönlü Birleştirme (BiC) modülünü entegre eder.

Bir diğer dikkat çekici özellik ise Çapa Destekli Eğitim (AAT) stratejisidir. AAT, eğitim sırasında anchor-based detectors kararlılığını, çapasız bir tasarımın çıkarım hızıyla birleştirir. Bu hibrit yaklaşım, dağıtım gecikmesinden ödün vermeden mükemmel yakınsama sağlar ve bu da onu akıllı şehir analitiği ve otomatik ödeme sistemlerindeki devasa video akışlarını işlemek için güçlü bir seçenek haline getirir.

YOLOv6 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

real-time inference için bu modelleri değerlendirirken parametreleri, FLOP'ları ve doğruluğu dengelemek çok önemlidir. Aşağıda performanslarını karşılaştıran ayrıntılı bir değerlendirme bulunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

DAMO-YOLO küçük ölçekte hafif bir üstünlük sergilese de (46.0 mAP'ye karşı 45.0 mAP), YOLOv6-3.0, nano yapılandırmasında mutlak en düşük parametreleri korurken orta ve büyük ölçeklerde kazanan, üstün ölçeklenebilirlik gösterir.

İkisi Arasında Seçim Yapmak

Donanım ortamın, omurganı özelleştirmek için ağır otomatik aramalara izin veriyorsa, DAMO-YOLO'nun NAS yaklaşımı oldukça etkilidir. Ancak, tamamen standartlaştırılmış GPU hızlandırmasına (T4 veya A100 gibi) güveniyorsan, YOLOv6'nın EfficientRep yapıları genellikle daha yüksek ham FPS'ye dönüşür.

Kullanım Durumları ve Öneriler

DAMO-YOLO ve YOLOv6 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman DAMO-YOLO Seçilmeli

DAMO-YOLO şunlar için güçlü bir tercihtir:

  • Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.

YOLOv6 Ne Zaman Seçilmeli?

YOLOv6 şunlar için önerilir:

  • Endüstriyel Donanım Odaklı Dağıtım: Modelin donanım odaklı tasarımının ve verimli yeniden parametrelendirmenin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
  • Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU'da ham çıkarım hızına öncelik veren uygulamalar.
  • Meituan Ekosistem Entegrasyonu: Hali hazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.

Ne Zaman Ultralytics (YOLO26) Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı: YOLO26 ile Tanışın

Hem DAMO-YOLO hem de YOLOv6-3.0 oldukça yetenekli olsa da parçalanmış ekosistemlerden, tek görev sınırlamalarından ve karmaşık dağıtım hatlarından muzdariptirler. Modern mühendislik ekipleri için Ultralytics models, çığır açan YOLO26 ile sonuçlanan önemli ölçüde daha iyi bir geliştirici deneyimi sunar.

Ocak 2026'da piyasaya sürülen YOLO26, memory requirements ve hesaplama verimliliğini büyük ölçüde optimize ederek uç ve bulut dağıtımı için yeni standardı temsil eder.

Neden YOLO26 Seçmelisin?

  1. Uçtan Uca NMS'siz Tasarım: YOLOv10 kavramları üzerine inşa edilen YOLO26, Non-Maximum Suppression (NMS) sonrası işlemeyi yerel olarak ortadan kaldırır. Bu, dağıtım kodunu önemli ölçüde basitleştirir ve tüm uç cihazlarda çıkarım gecikme varyansını azaltır.
  2. Üstün Optimizasyon: YOLO26, eğitim süreçlerini son derece kararlı kılan ve daha hızlı yakınsama sağlayan, SGD ve Muon'un (büyük dil modellerinden esinlenilmiştir) bir hibriti olan MuSGD Optimizer kullanır.
  3. Donanım Çok Yönlülüğü: DFL Removal (Distribution Focal Loss) uygulayarak, çıktı kafaları basitleştirilir ve uç cihaz uyumluluğu artırılır. Aslında, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde eder, bu da onu mobil veya IoT uç ortamları için YOLOv6'dan çok daha üstün kılar.
  4. Gelişmiş Doğruluk: ProgLoss + STAL kullanan YOLO26, small object detection konusunda çarpıcı iyileştirmeler görür, bu da onu aerial imagery ve kusur denetimi için en uygun seçenek haline getirir.
  5. Benzersiz Çok Yönlülük: Sadece sınırlayıcı kutular yapan endüstriyel modellerin aksine, YOLO26 ailesi Image Classification, Instance Segmentation, Pose Estimation ve Oriented Bounding Boxes (OBB) dahil olmak üzere çok modlu görevleri destekler.

YOLO26 hakkında daha fazla bilgi edin

Kusursuz Ekosistem Deneyimi

Ultralytics Platform, tüm makine öğrenimi yaşam döngüsünü dönüştürür. Bir modeli eğitmek artık çok aşamalı bir damıtma baş ağrısı değildir. Otomatik veri artırma, birleşik hiperparametre ayarlama ve ONNX, OpenVINO ve CoreML gibi formatlara tek tıkla dışa aktarma ile veri kümesinden üretime haftalar değil, saatler içinde geçersin.

Additionally, Ultralytics models are known for their memory efficiency, sidestepping the massive VRAM bottlenecks that plague transformer architectures like RT-DETR.

Hızlı Başlangıç Kod Örneği

YOLO26 gibi bir Ultralytics modeliyle eğitim ve çıkarım yapmak oldukça basittir. Aşağıdaki Python betiği, sadece birkaç satır kodla nesneleri takip etmeye nasıl hemen başlayabileceğini gösterir:

from ultralytics import YOLO

# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)

Sonuç

Hem DAMO-YOLO hem de YOLOv6-3.0, endüstriyel nesne tespitinin sınırlarını zorlayan etkileyici mühendislik başarılarıdır. Ancak bunlar, genellikle karmaşık kurulumlar ve katı donanım kısıtlamaları gerektiren oldukça uzmanlaşmış araçlardır.

Mükemmel bir performans dengesi, çok görevli yetenekler ve aktif olarak well-maintained ecosystem talep eden geliştiriciler ve araştırmacılar için Ultralytics YOLO26 eşsizdir. LLM'den ilham alan iyileştiricileri temiz, NMS'siz bir mimariyle harmanlayan YOLO26, AI deployment süreçlerini basitleştirirken uç ve bulut ortamlarında en üst düzey doğruluk sağlar.

Yeni bir bilgisayarlı görü projesi için modelleri değerlendiriyorsan, Ultralytics YOLO ekosisteminin yeteneklerini keşfetmeni şiddetle tavsiye ederiz. Ayrıca, gerçek zamanlı vizyon yapay zekasının evrimini tam olarak kavramak için bunları EfficientDet gibi diğer mimarilerle veya YOLO11 gibi önceki kilometre taşlarıyla karşılaştırmayı yararlı bulabilirsin.

Yorumlar