DAMO-YOLO vs YOLOv6-3.0: Endüstriyel Nesne Algılayıcılarının Kapsamlı Bir Karşılaştırması

Bilgisayar görüşünün hızlı evrimi, endüstriyel uygulamalar için özel olarak tasarlanmış yüksek düzeyde uzmanlaşmış mimariler üretmiştir. Bunlar arasında, gerçek zamanlı performans ve dağıtım verimliliğine odaklanmalarıyla iki önemli model öne çıkmaktadır: DAMO-YOLO ve YOLOv6-3.0. Bu sayfa, dağıtım seçeneklerinizi belirlemenize yardımcı olmak için mimarileri, performans metrikleri ve eğitim metodolojileri hakkında derinlemesine teknik bir karşılaştırma sunmaktadır.

DAMO-YOLO: Sinirsel Mimari Arama Nesne Algılama ile Buluşuyor

Alibaba Group araştırmacıları tarafından geliştirilen DAMO-YOLO, Sinirsel Mimari Arama (NAS) teknolojisini backbone tasarımına yoğun bir şekilde entegre ederek YOLO ailesine yeni bir yaklaşım sunmaktadır.

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:2211.15444v2
GitHub:tinyvision/DAMO-YOLO

Mimari Yenilikler

DAMO-YOLO, belirli gecikme kısıtlamaları altında optimal ağ yapılarını otomatik olarak arayan MAE-NAS adlı NAS-optimize edilmiş bir backbone kullanır. Bu, modelin farklı donanım profillerinde verimli bir şekilde ölçeklenmesini sağlar. Özellik füzyonunu iyileştirmek için mimari, çok ölçekli temsili önemli ölçüde artıran verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramit Ağı) kullanır.

Ayrıca, model bir "ZeroHead" tasarımı sunar. Algılama başlığındaki karmaşık çok dallı yapıları kaldırarak, hesaplama yükünü azaltırken uzamsal bilgiyi daha etkili bir şekilde korur. Eğitim metodolojisi ayrıca AlignedOTA (Hizalı Optimal Taşıma Ataması) ve sağlam bilgi damıtmayı kullanarak, daha küçük öğrenci modellerinin daha büyük öğretmen ağlarından öğrenmesini sağlar.

DAMO-YOLO hakkında daha fazla bilgi edinin

Damıtma Karmaşıklığı

Bilgi damıtma DAMO-YOLO'nun yüksek doğruluk elde etmesine yardımcı olsa da, çok aşamalı bir eğitim hattı gerektirir. Bu durum, standart, tek aşamalı modellerin eğitimine kıyasla gereken GPU hesaplama gücünü önemli ölçüde artırır.

YOLOv6-3.0: Endüstriyel Verimi En Üst Düzeye Çıkarma

Meituan Görsel Yapay Zeka Departmanı'nın öncülüğünü yaptığı YOLOv6-3.0, NVIDIA donanımında verimi en üst düzeye çıkarmak için özel olarak tasarlanmış endüstriyel bir nesne dedektörü olarak açıkça etiketlenmiştir.

Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş:Meituan
Tarih: 2023-01-13
Arxiv:2301.05586
GitHub:meituan/YOLOv6

Temel Özellikler ve İyileştirmeler

YOLOv6-3.0, donanım dostu EfficientRep backbone üzerine inşa edilmiştir ve modern GPU'larda TensorRT gibi optimizasyonlardan yararlanıldığında olağanüstü hızlı çalışır. v3.0 yinelemesinde, ağ, farklı nesne boyutlarının konumlandırmasını iyileştirmek için Çift Yönlü Birleştirme (BiC) modülünü entegre eder.

Bir diğer öne çıkan özellik ise Çapa Destekli Eğitim (AAT) stratejisidir. AAT, eğitim sırasında çapa tabanlı dedektörlerin kararlılığını, çapasız bir tasarımın çıkarım hızıyla birleştirir. Bu hibrit yaklaşım, dağıtım gecikmesini feda etmeden mükemmel yakınsama sağlar ve akıllı şehir analitiği ile otomatik ödeme sistemlerinde büyük video akışlarını işlemek için güçlü bir seçenek haline getirir.

YOLOv6 hakkında daha fazla bilgi edinin.

Performans Karşılaştırması

Bu modelleri gerçek zamanlı çıkarım için değerlendirirken, parametreleri, FLOP'ları ve doğruluğu dengelemek çok önemlidir. Aşağıda, performanslarını karşılaştıran ayrıntılı bir değerlendirme bulunmaktadır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

DAMO-YOLO küçük katmanda (46.0 mAP'ye karşı 45.0 mAP) hafif bir üstünlük sergilerken, YOLOv6-3.0 üstün ölçeklenebilirlik gösterir ve nano yapılandırmasında mutlak en düşük parametreleri koruyarak orta ve büyük katmanlarda öne çıkar.

İkisi Arasında Seçim Yapmak

Donanım ortamınız, backbone'unuzu özelleştirmek için yoğun otomatik aramalara izin veriyorsa, DAMO-YOLO'nun NAS yaklaşımı oldukça etkilidir. Ancak, tamamen standartlaştırılmış GPU hızlandırmasına (T4 veya A100 gibi) güveniyorsanız, YOLOv6'nın EfficientRep yapıları genellikle daha yüksek ham FPS'ye dönüşür.

Kullanım Durumları ve Öneriler

DAMO-YOLO ve YOLOv6 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

Ne Zaman DAMO-YOLO Seçmeli

DAMO-YOLO şunlar için güçlü bir seçimdir:

Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.

YOLOv6 Ne Zaman Tercih Edilmeli?

YOLOv6 şunlar için önerilir:

Endüstriyel Donanım Farkındalıklı Dağıtım: Modelin donanım farkındalıklı tasarımının ve verimli yeniden parametrelendirmesinin belirli hedef donanımlarda optimize edilmiş performans sağladığı senaryolar.
Hızlı Tek Aşamalı Algılama: Kontrollü ortamlarda gerçek zamanlı video işleme için GPU üzerinde ham çıkarım hızına öncelik veren uygulamalar.
Meituan Ekosistem Entegrasyonu: Halihazırda Meituan'ın teknoloji yığını ve dağıtım altyapısı içinde çalışan ekipler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ultralytics Avantajı: YOLO26'yı Tanıtıyoruz

Hem DAMO-YOLO hem de YOLOv6-3.0 oldukça yetenekli olsa da, parçalanmış ekosistemlerden, tek görevli sınırlamalardan ve karmaşık dağıtım hatlarından muzdariptirler. Modern mühendislik ekipleri için Ultralytics modelleri, çığır açan YOLO26 ile sonuçlanan önemli ölçüde daha iyi bir geliştirici deneyimi sunar.

Ocak 2026'da piyasaya sürülen YOLO26, uç ve bulut dağıtımı için yeni standardı temsil ederek bellek gereksinimlerini ve hesaplama verimliliğini yoğun bir şekilde optimize etmektedir.

Neden YOLO26'yı Seçmelisiniz?

Uçtan Uca NMS'siz Tasarım: YOLOv10'dan alınan kavramlar üzerine inşa edilen YOLO26, Maksimum Olmayan Bastırma (NMS) son işlemeyi yerel olarak ortadan kaldırır. Bu, dağıtım kodunu önemli ölçüde basitleştirir ve tüm uç cihazlarda çıkarım gecikmesi varyansını azaltır.
Üstün Optimizasyon: YOLO26, SGD ve Muon'un (büyük dil modellerinden esinlenilmiştir) bir hibriti olan MuSGD Optimizatörünü kullanır, bu da oldukça kararlı eğitim çalışmaları ve daha hızlı yakınsama sağlar.
Donanım Çok Yönlülüğü: DFL Kaldırma (Distribution Focal Loss) uygulanarak çıktı başlıkları basitleştirilir ve uç cihaz uyumluluğu artırılır. Aslında, YOLO26 %43'e kadar daha hızlı CPU çıkarımı elde ederek mobil veya IoT uç ortamları için YOLOv6'dan çok daha üstün hale gelir.
Gelişmiş Doğruluk: ProgLoss + STAL kullanarak, YOLO26 küçük nesne algılamada önemli iyileşmeler gösterir ve bu da onu hava görüntüleri ve kusur denetimi için en uygun seçim haline getirir.
Eşsiz Çok Yönlülük: Sadece sınırlayıcı kutular kullanan endüstriyel modellerin aksine, YOLO26 ailesi Görüntü Sınıflandırma, Örnek Segmentasyon, Poz Tahmini ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) dahil olmak üzere çok modlu görevleri destekler.

YOLO26 hakkında daha fazla bilgi edinin

Sorunsuz Ekosistem Deneyimi

Ultralytics Platformu, tüm makine öğrenimi yaşam döngüsünü dönüştürür. Bir model eğitmek artık çok aşamalı bir damıtma baş ağrısı değildir. Otomatik veri artırma, birleşik hiperparametre ayarlaması ve ONNX, OpenVINO ve CoreML gibi formatlara tek tıklamayla dışa aktarma sayesinde, veri kümesinden üretime haftalar değil, saatler içinde geçersiniz.

Ek olarak, Ultralytics modelleri bellek verimlilikleriyle bilinir ve RT-DETR gibi transformatör mimarilerini rahatsız eden büyük VRAM darboğazlarını atlatır.

Hızlı Başlangıç Kodu Örneği

YOLO26 gibi bir Ultralytics modeliyle eğitim ve çıkarım yapmak zarifçe basittir. Aşağıdaki Python betiği, sadece birkaç satır kodla nesneleri hemen izlemeye nasıl başlayabileceğinizi göstermektedir:

from ultralytics import YOLO

# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)

Sonuç

Hem DAMO-YOLO hem de YOLOv6-3.0, endüstriyel nesne algılamanın sınırlarını zorlayan etkileyici mühendislik başarılarıdır. Ancak, genellikle karmaşık kurulumlar ve katı donanım kısıtlamaları gerektiren oldukça uzmanlaşmış araçlardır.

Mükemmel bir performans dengesi, çok görevli yetenekler ve aktif olarak iyi bakılan bir ekosistem talep eden geliştiriciler ve araştırmacılar için Ultralytics YOLO26 rakipsizdir. LLM'den ilham alan optimize edicileri temiz, NMS'siz bir mimariyle harmanlayarak, YOLO26 yapay zeka dağıtımını basitleştirirken, uç ve bulut ortamlarında son teknoloji doğruluk sunar.

Yeni bir bilgisayar görüşü projesi için modelleri değerlendiriyorsanız, Ultralytics YOLO ekosisteminin yeteneklerini keşfetmenizi şiddetle tavsiye ederiz. Gerçek zamanlı görüş yapay zekasının evrimini tam olarak kavramak için bunları EfficientDet gibi diğer mimarilerle veya YOLO11 gibi önceki kilometre taşlarıyla karşılaştırmayı da faydalı bulabilirsiniz.