İçeriğe geç

YOLOv6-3.0 vs DAMO-YOLO: Gerçek Zamanlı Nesne Detect (Tespiti) Alanında Teknik Bir Karşılaşma

Bilgisayar görüşü alanı sürekli gelişmektedir; yeni mimariler gerçek zamanlı nesne detect (tespiti) alanında nelerin mümkün olduğunun sınırlarını zorlamaktadır. Bu alandaki iki önemli rakip YOLOv6-3.0 ve DAMO-YOLO'dur. Her iki model de endüstriyel donanımlarda performansı en üst düzeye çıkarmak için tasarlanmış benzersiz mimari yenilikler sunar. Bu kılavuz, bu iki model arasında kapsamlı bir teknik karşılaştırma sunarak mimarilerini, eğitim metodolojilerini ve ideal kullanım durumlarını incelerken, aynı zamanda Ultralytics'in YOLO26 gibi yeni nesil modellerinin avantajlarını da tanıtır.

Model Profilleri

YOLOv6-3.0: Endüstriyel Sınıf Verim

Meituan'daki Vizyon Yapay Zeka Departmanı tarafından geliştirilen YOLOv6-3.0, yüksek verimli endüstriyel uygulamalar için özel olarak tasarlanmıştır. NVIDIA GPU'lar gibi donanım hızlandırıcılarda performansı en üst düzeye çıkarmaya büyük ölçüde odaklanır.

YOLOv6-3.0, özellik füzyonunu iyileştirmek için Çift Yönlü Birleştirme (BiC) modülünü sunar ve Çapa Destekli Eğitim (AAT) stratejisini kullanır. Bu strateji, eğitim sırasında çapa tabanlı ve çapa-sız detect (tespit) edicilerin faydalarını birleştirirken, çıkarımı kesinlikle çapa-sız tutar. EfficientRep backbone'u, GPU toplu işleme için oldukça donanım dostu olmasını sağlar ve büyük miktarda video anlama verisini işlemek için idealdir.

YOLOv6 hakkında daha fazla bilgi edinin.

DAMO-YOLO: NAS Aracılığıyla Hızlı ve Doğru

Alibaba Group tarafından oluşturulan DAMO-YOLO, gerçek zamanlı çıkarım için en verimli backbone yapılarını otomatik olarak keşfetmek amacıyla Sinirsel Mimari Arama (NAS) teknolojisinden yararlanır.

DAMO-YOLO, verimli çok ölçekli özellik füzyonu için RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) ile ve detect (tespit) başlığındaki hesaplama yükünü önemli ölçüde azaltan ZeroHead tasarımıyla öne çıkar. Ayrıca, modelin parametre sayısını artırmadan doğruluğu artırmak için AlignedOTA etiket atamasını ve sağlam bilgi damıtma tekniklerini içerir.

DAMO-YOLO hakkında daha fazla bilgi edinin

Damıtma Yükü

DAMO-YOLO mükemmel doğruluk elde etse de, eğitim sırasında bilgi damıtmasına yoğun bağımlılığı, çok daha büyük bir "öğretmen" modeli gerektirir. Bu durum, daha basit mimarilere kıyasla eğitim aşamasında gereken CUDA belleğini önemli ölçüde artırır.

Performans Karşılaştırması

Nesne detect (tespit) modellerini değerlendirirken, ortalama hassasiyet (mAP) ile çıkarım hızı arasındaki denge kritiktir. Aşağıda, farklı model ölçeklerinde YOLOv6-3.0 ve DAMO-YOLO'nun ayrıntılı bir karşılaştırması bulunmaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

YOLOv6-3.0, TensorRT optimizasyonlarını kullanarak NVIDIA GPU'larda olağanüstü hız sergiler, özellikle nano ve küçük varyantlarında. Ancak, DAMO-YOLO'nun NAS optimize edilmiş backbone'ları, orta ve büyük ölçeklerde daha az FLOP gerektirme eğilimindedir, bu da daha büyük dağıtımlar için hafif gecikme avantajları sağlar.

Ultralytics Avantajı: YOLO26 Sahneye Çıkıyor

YOLOv6-3.0 ve DAMO-YOLO güçlü araçlar olsa da, geliştiriciler genellikle karmaşık dağıtım hatları, eğitim sırasında yüksek bellek gereksinimleri ve katı, tek görevli mimarilerle zorluklar yaşarlar. Ultralytics ekosistemi önemli ölçüde daha akıcı bir geliştirici deneyimi sunar.

YOLO26'nın piyasaya sürülmesiyle Ultralytics, son teknoloji vizyon yapay zekasını yeniden tanımladı. Ocak 2026'da piyasaya sürülen Ultralytics YOLO26 verimlilik ve çok yönlülük sınırlarını zorluyor.

YOLO26'daki Temel Yenilikler

  • Uçtan Uca NMS'siz Tasarım: YOLOv10'da öncülük edilen konseptlere dayanarak, YOLO26, Non-Maximum Suppression (NMS) son işlemeyi doğal olarak ortadan kaldırır. Bu, gecikme varyansını önemli ölçüde azaltır ve CoreML veya TFLite aracılığıyla kenar cihazlara dağıtımı basitleştirir.
  • DFL Kaldırma: Distribution Focal Loss'u kaldırarak, YOLO26 dışa aktarma sürecini basitleştirir ve düşük güçlü mikrodenetleyiciler ile kenar donanımlarıyla uyumluluğu önemli ölçüde artırır.
  • Yüzde 43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU donanımına sahip olmayan uygulamalar için, YOLO26'nın CPU optimizasyonları eşsiz hız sunar ve YOLOv6 gibi yoğun GPU bağımlısı modelleri geride bırakır.
  • MuSGD Optimizatörü: Moonshot AI'nin Kimi K2'si gibi LLM eğitim tekniklerinden esinlenerek, YOLO26 kararlı eğitim ve hızlı yakınsama sağlamak için MuSGD optimizatörünü (SGD ve Muon'un bir hibriti) kullanır.
  • ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, küçük nesne tanımayı önemli ölçüde iyileştirerek YOLO26'yı drone operasyonları ve uzaktaki hedef takibi için mükemmel hale getirir.
  • Çok Görevli Çok Yönlülük: Yalnızca bir dedektör olan DAMO-YOLO'nun aksine, YOLO26, tek ve birleşik bir API içinde Örnek Segmentasyon, Poz Tahmini (Kalıntı Log-Olasılık Tahmini aracılığıyla) ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) için kullanıma hazır destek sağlar.

YOLO26 hakkında daha fazla bilgi edinin

Bellek Verimli Eğitim

RT-DETR gibi karmaşık transformer mimarilerinin veya DAMO-YOLO'nun yoğun damıtma tabanlı işlem hatlarının aksine, Ultralytics modelleri düşük VRAM ayak izleriyle tanınır. YOLO26 modelini tüketici sınıfı donanımlarda kolayca eğitebilirsiniz.

Akıcı python İş Akışı

Son teknoloji modelleri eğitmek ve dağıtmak yüzlerce satır standart kod gerektirmemelidir. Ultralytics python paketi, makine öğrenimi yaşam döngüsünü basitleştirir.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with built-in data handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run ultra-fast inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export seamlessly to ONNX or TensorRT
model.export(format="onnx")

İdeal Kullanım Senaryoları

Doğru mimariyi seçmek tamamen dağıtım kısıtlamalarınıza bağlıdır:

YOLOv6-3.0 Ne Zaman Kullanılmalı

  • Yüksek Parti Video Analizi: TensorRT'nin tam olarak kullanılabileceği kurumsal GPU sunucularında yoğun video akışlarını işlemek için mükemmeldir.
  • Endüstriyel Otomasyon: Kalite kontrol hata tespiti yapan yüksek hızlı üretim hatları.

DAMO-YOLO Ne Zaman Kullanılmalı

  • Özel Silikon: Belirli, tescilli NPU donanımları için Sinirsel Mimari Arama eşlemesini araştırmak.
  • Akademik Araştırma: Gerçek zamanlı ağlar için yeni bilgi damıtma tekniklerini kıyaslamak.

Ultralytics YOLO26 Ne Zaman Kullanılmalı

  • Kenar ve Mobil Dağıtımlar: NMS'siz tasarım, DFL kaldırma ve %43 CPU hız artışı, onu iOS, Android ve Raspberry Pi entegrasyonları için tartışmasız şampiyon yapar.
  • Hızlı Prototiplemeden Üretime: Ultralytics Platformu ile sorunsuz entegrasyon, ekiplerin veri kümesi açıklamasından küresel bulut dağıtımına aylarca değil, günler içinde geçmesini sağlar.
  • Karmaşık Görsel İşleme Hatları: Bir proje, insan poz anahtar noktaları ve hassas segmentasyon maskeleriyle birlikte sınırlayıcı kutuları aynı anda detect etmeyi gerektirdiğinde.

Sonuç

Hem YOLOv6-3.0 hem de DAMO-YOLO, gerçek zamanlı nesne detect etme bilimine önemli katkılarda bulunmuştur. YOLOv6 GPU maksimizasyonunu iyileştirirken, DAMO-YOLO otomatik mimari aramanın gücünü sergiledi.

Ancak, doğruluk, çıkarım hızı ve ekosistem sürdürülebilirliğinin nihai karışımını arayan geliştiriciler için, Ultralytics YOLO ailesi en iyi seçenek olmaya devam etmektedir. YOLO26'da sunulan çığır açan optimizasyonlarla, kurumsal düzeyde bilgisayar görüşü uygulamaları oluşturmak için giriş engeli hiç bu kadar düşük olmamıştı.

Daha fazla keşif için, belgelerimizdeki YOLO11 veya RT-DETR gibi transformer tabanlı yaklaşımlar gibi diğer mimarilerle bu modelleri karşılaştırmakla da ilgilenebilirsiniz.


Yorumlar