DAMO-YOLO vs. YOLO26: Gerçek Zamanlı Nesne Algılama İçin Teknik Bir Karşılaşma
Bilgisayar görüşünün evrimi, verimlilik, hız ve doğruluk arayışıyla şekillenmiştir. Bu alandaki iki önde gelen isim, Alibaba Group tarafından geliştirilen DAMO-YOLO ve Ultralytics'in en son sürümü olan son teknoloji YOLO26'dır. DAMO-YOLO, 2022'de Sinirsel Mimari Arama (NAS) alanında önemli yenilikler sunarken, YOLO26, 2026'da uç dağıtım ve üretim ölçeklenebilirliği için özel olarak tasarlanmış, uçtan uca, NMS içermeyen bir tasarımla bu alanı yeniden tanımlamaktadır.
Bu kılavuz, bu iki modelin mimarilerini, performans metriklerini ve gerçek dünya uygulamalarına uygunluklarını karşılaştıran derinlemesine bir teknik analiz sunmaktadır.
DAMO-YOLO: Sinirsel Mimari Arama İnovasyonu
Alibaba'nın DAMO Academy'si tarafından geliştirilen DAMO-YOLO (Damıtma Destekli Sinirsel Mimari Arama Tabanlı YOLO), belirli gecikme kısıtlamaları altında performansı en üst düzeye çıkarmak için detect backbone'larının tasarımını otomatikleştirmeye odaklanmaktadır.
Temel Mimari Özellikler
DAMO-YOLO, çeşitli gelişmiş teknolojilerle öne çıkmaktadır:
- Sinirsel Mimari Arama (NAS): Manuel olarak tasarlanmış backbone'ların (CSPDarknet gibi) aksine, DAMO-YOLO, optimal yapıları keşfetmek için MAE-NAS'ı (Verimli Sinirsel Mimari Aramayı Otomatikleştirme Yöntemi) kullanır. Bu, kayan nokta işlemleri (FLOPs) ve doğruluk arasındaki denge için özel olarak ayarlanmış bir ağ topolojisi ile sonuçlanır.
- RepGFPN: Yeniden parametrelendirme ile birleştirilmiş Genelleştirilmiş Özellik Piramit Ağlarını (GFPN) kullanan ağır bir boyun tasarımıdır. Bu, farklı ölçeklerde verimli özellik füzyonuna olanak tanıyarak, çeşitli boyutlardaki nesnelerin detect edilmesini iyileştirir.
- ZeroHead: Çıkarım sırasında hesaplama yükünü azaltan basitleştirilmiş bir detect kafasıdır.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevleri arasındaki uyumsuzluğu çözen dinamik bir etiket atama stratejisidir.
Performans ve Sınırlamalar
DAMO-YOLO, 2022'de önemli bir ilerlemeyi temsil etti ve YOLOv6 ve YOLOv7 gibi önceki yinelemeleri belirli benchmark'larda geride bıraktı. Ancak, karmaşık eğitim pipeline'larına bağımlılığı —özellikle büyük bir öğretmen modeliyle bir damıtma aşamasına duyulan ihtiyaç— özel veri kümeleri üzerinde hızlı bir şekilde yineleme yapması gereken geliştiriciler için onu hantal hale getirebilir. Ek olarak, RepGFPN'si güçlü olsa da, modern mimarilere kıyasla bellek yoğun olabilir.
DAMO-YOLO Detayları:
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
Ultralytics YOLO26: Uçtan Uca Uç Devrimi
Ocak 2026'da yayınlanan Ultralytics YOLO26, YOLOv8 ve YOLO11'in mirası üzerine inşa edilmiştir ve detect işlemlerinin nasıl yapıldığına dair temel bir değişim sunmaktadır. Yalnızca yüksek benchmark skorları için değil, bulut sunucularından kaynak kısıtlı IoT cihazlarına kadar her yerde pratik, sorunsuz dağıtım için tasarlanmıştır.
Çığır Açan Mimari
YOLO26, geleneksel anchor tabanlı veya anchor-free detectörlerden ayıran birkaç son teknoloji gelişmeyi bünyesinde barındırır:
- Uçtan Uca NMS-Free Tasarım: Belki de en önemli değişiklik, Non-Maximum Suppression (NMS)'in kaldırılmasıdır. Eğitim sırasında bire bir eşleştirme stratejisi benimsenerek (YOLOv10'da öncülük edildi), model nihai tahminleri doğrudan çıkarır. Bu, kalabalık sahnelerde genellikle bir darboğaz olan NMS son işleminden kaynaklanan gecikme varyansını ortadan kaldırır.
- MuSGD Optimizatörü: Moonshot AI'nin Kimi K2 gibi Büyük Dil Modeli (LLM) eğitimindeki yeniliklerden ilham alan YOLO26, SGD ve Muon'u birleştiren hibrit bir optimizatör kullanır. Bu, bilgisayar görüşü eğitimine benzeri görülmemiş bir kararlılık getirerek daha hızlı yakınsamaya yol açar.
- DFL Kaldırılması: Distribution Focal Loss'un kaldırılmasıyla çıktı katmanı basitleştirilmiştir. Bu, ONNX ve TensorRT gibi formatlara dışa aktarımı çok daha temiz hale getirerek, kenar cihazlar ve düşük güçlü mikrodenetleyicilerle uyumluluğu önemli ölçüde artırır.
- ProgLoss + STAL: Progressive Loss ve Soft-Target Anchor Labeling (STAL) entegrasyonu, hava görüntüleme ve robotik için kritik bir gereksinim olan küçük nesne detect etme konusunda sağlam iyileştirmeler sağlar.
Dağıtım Üstünlüğü
YOLO26 hız için tasarlanmıştır. Önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı sunarak, Raspberry Pi, mobil CPU'lar veya Intel AI PC'lerde çalışan uygulamalar için ideal bir seçimdir.
YOLO26 hakkında daha fazla bilgi edinin
YOLO26 Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2026-01-14
- Belgeler: YOLO26 Dokümantasyonu
- GitHub: ultralytics/ultralytics
Karşılaştırmalı Performans Analizi
Aşağıdaki tablo, DAMO-YOLO ve YOLO26'nın çeşitli model boyutlarındaki performansını karşılaştırmaktadır. YOLO26, özellikle NMS kaldırmanın öne çıktığı CPU donanımında, önemli ölçüde daha düşük gecikmeyle karşılaştırılabilir veya daha iyi mAP elde ederek üstün verimlilik sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Gecikme Avantajı
YOLO26 için CPU ONNX hızları, NMS-free tasarımının büyük avantajını vurgulamaktadır. Son işlem adımının kaldırılmasıyla YOLO26, çıkarım süresinin deterministik ve sürekli olarak düşük olmasını sağlar; bu da gerçek zamanlı video analizi için kritik öneme sahiptir.
Ultralytics'in Avantajı
DAMO-YOLO mimari arama konusunda ilginç akademik bilgiler sunarken, Ultralytics YOLO26 modern geliştirme iş akışları için tasarlanmış bütünsel bir çözüm sunmaktadır.
1. Kullanım Kolaylığı ve Ekosistem
DAMO-YOLO'nun damıtma tabanlı eğitiminin karmaşıklığı bir giriş engeli olabilir. Buna karşılık, Ultralytics "sıfırdan kahramana" bir deneyim sunar. Birleşik bir python API'si ile geliştiriciler modelleri dakikalar içinde yükleyebilir, eğitebilir ve dağıtabilir. Ultralytics Platformu ise bulut eğitimi, veri kümesi yönetimi ve otomatik etiketleme araçları sunarak bu süreci daha da basitleştirir.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100)
2. Görev Çok Yönlülüğü
DAMO-YOLO öncelikli olarak bir nesne algılama mimarisidir. Ancak Ultralytics YOLO26, çok görevli bir güç merkezidir. Tek bir çerçeve şunları destekler:
- Örnek Segmentasyonu: Semantik segmentasyon kaybı gibi göreve özgü iyileştirmeler dahil.
- Poz Tahmini: Yüksek hassasiyetli anahtar noktalar için Artık Log-Olasılık Tahmini (RLE) kullanır.
- obb: Yönlendirilmiş Sınırlayıcı Kutular için özel açı kaybı, uydu görüntüsü analizi için temeldir.
- Sınıflandırma: Yüksek hızlı görüntü sınıflandırma.
3. Eğitim Verimliliği ve Bellek
YOLO26, tüketici sınıfı donanım için optimize edilmiştir. MuSGD optimize edici gibi teknikler, bellek yoğun transformatör hibritleri veya eski NAS mimarilerine kıyasla daha büyük toplu iş boyutları ile kararlı eğitime olanak tanır. Yapay zeka eğitiminin bu demokratikleşmesi, son teknoloji bir modeli ince ayarlamak için kurumsal bir H100 kümesine ihtiyacınız olmadığı anlamına gelir.
İdeal Kullanım Senaryoları
Doğru modeli seçmek, özel kısıtlamalarınıza bağlıdır, ancak çoğu üretim senaryosu için YOLO26 en iyi yatırım getirisini sunar.
- DAMO-YOLO'yu seçin eğer: Sinirsel Mimari Arama metodolojilerini özel olarak araştıran bir araştırmacıysanız veya tinyvision kod tabanı etrafında oluşturulmuş eski bir iş akışınız varsa.
- Ultralytics YOLO26'yı seçin eğer:
- Uç Dağıtım: Raspberry Pi, mobil cihazlar veya NMS içermeyen tasarımın büyük hızlanmalar sağladığı CPU'lar üzerinde çalıştırmanız gerekiyorsa.
- Hızlı Geliştirme: Karmaşık yapılandırma olmadan CoreML veya TFLite gibi formatlara kolayca eğitilebilen, doğrulanabilen ve dışa aktarılabilen bir modele ihtiyacınız varsa.
- Karmaşık Görsel Görevler: Projeniz, yalnızca sınırlayıcı kutulardan fazlasını, örneğin nesneleri segment etmeyi veya insan pozunu track etmeyi gerektiriyorsa.
- Uzun Süreli Bakım: Aktif bir topluluk, sık güncellemeler ve kapsamlı belgelerle desteklenen bir modele ihtiyacınız varsa.
Sonuç
Hem DAMO-YOLO hem de YOLO26, nesne algılamada önemli kilometre taşlarını temsil etmektedir. DAMO-YOLO, otomatik mimari aramanın potansiyelini sergileyerek 2022'de mümkün olanın sınırlarını zorladı. Ancak, YOLO26 2026 ve sonrası için kesin bir tercih olarak öne çıkmaktadır. NMS darboğazını çözerek, CPU çıkarımı için optimize ederek ve MuSGD gibi gelişmiş eğitim tekniklerini entegre ederek, Ultralytics sadece daha hızlı ve daha doğru değil, aynı zamanda kullanımı önemli ölçüde daha kolay bir model yaratmıştır.
Sağlam, geleceğe dönük bilgisayar görüşü uygulamaları geliştirmek isteyen geliştiriciler için, Ultralytics ekosistemi başarılı olmak için gereken araçları, modelleri ve desteği sağlar.
Diğer yüksek performanslı mimarileri keşfetmek isteyenler için, genel amaçlı detect için YOLO11'i veya transformatör tabanlı uygulamalar için RT-DETR'i incelemeyi düşünebilirsiniz.