DAMO-YOLO vs. YOLO26: Gerçek Zamanlı Nesne Algılayıcılarının Teknik Karşılaştırması
Gerçek zamanlı nesne algılamanın evrimi, hız, doğruluk ve dağıtım verimliliğini dengeleyen modellere olan ihtiyaçtan kaynaklanan hızlı ilerlemeler kaydetmiştir. Bu makale, Alibaba Group tarafından geliştirilen DAMO-YOLO ile Ultralytics'in en son sürümü olan YOLO26 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Geliştiricilerin ve araştırmacıların bilgisayar görüşü projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla bu modellerin mimarilerini, performans metriklerini ve ideal kullanım senaryolarını analiz edeceğiz.
DAMO-YOLO'ya Genel Bakış
DAMO-YOLO, Alibaba Group araştırmacıları tarafından 2022'nin sonlarında tanıtılan hızlı ve doğru bir nesne algılama yöntemidir. YOLO çerçevesine çeşitli son teknoloji entegre ederek performansın sınırlarını zorlamak için tasarlanmıştır. DAMO-YOLO'nun temel felsefesi, verimli backbone'ları otomatik olarak keşfetmek için Sinirsel Mimari Arama (NAS) kullanımının, yoğun bir yeniden parametrelendirme boynu ile birleştirilmesidir.
Temel mimari özellikler şunları içerir:
- MAE-NAS Backbone: Farklı gecikme kısıtlamaları altında optimal backbone yapılarını aramak için maskeli bir otomatik kodlayıcı (MAE) yaklaşımı kullanır.
- Verimli RepGFPN: Çıkarım sırasında hızdan ödün vermeden özellik birleştirme verimliliğini artırmak için yeniden parametrelendirme ile yoğun bir şekilde optimize edilmiş Genelleştirilmiş Bir Özellik Piramit Ağı (GFPN).
- ZeroHead: Hesaplama yükünü azaltan hafif bir başlık tasarımı.
- AlignedOTA: Sınıflandırma ve regresyon görevleri arasındaki hizalama sorunlarını çözen geliştirilmiş bir etiket atama stratejisi.
- Damıtma İyileştirmesi: Daha büyük öğretmen modelleri kullanılarak daha küçük modellerin doğruluğunu artırmak için sağlam bir damıtma hattı kullanılır.
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 23 Kasım 2022
Bağlantılar:Arxiv, GitHub
DAMO-YOLO hakkında daha fazla bilgi edinin
YOLO26'ya Genel Bakış
Ultralytics tarafından Ocak 2026'da piyasaya sürülen YOLO26, kenar optimize edilmiş bilgisayar görüşünde önemli bir ilerlemeyi temsil etmektedir. Özellikle kenar ve düşük güçlü cihazlar için tasarlanmış olup, küçük nesne algılama gibi zorlu görevlerde doğruluğu artırırken dağıtım hattını kolaylaştırmaya odaklanmaktadır.
YOLO26, birkaç önemli yenilikle öne çıkmaktadır:
- Uçtan Uca NMS-Serbest Tasarım: Maksimum Olmayan Bastırma (NMS) sonrası işlemine olan ihtiyacı ortadan kaldırarak, YOLO26 dağıtım mantığını basitleştirir ve gecikme değişkenliğini azaltır; bu, YOLOv10'da ilk kez öncülük edilen bir konsepttir.
- DFL Kaldırma: Dağıtım Odak Kaybı (DFL) kaldırılması, modelin çıktı yapısını basitleştirerek ONNX ve TensorRT gibi formatlara dışa aktarımı daha basit ve daha geniş bir donanım yelpazesiyle uyumlu hale getirir.
- MuSGD Optimizatörü: Moonshot AI'nin Kimi K2'sinden LLM eğitim tekniklerinden esinlenerek SGD ve Muon'u birleştiren yeni bir hibrit optimizatördür. Bu, daha istikrarlı eğitim dinamiklerine ve daha hızlı yakınsamaya yol açar.
- ProgLoss + STAL: Aşamalı Kayıp Dengeleme ve Küçük Hedef Farkındalıklı Etiket Atama (STAL) kombinasyonu, küçük nesneler üzerindeki performansı önemli ölçüde artırarak gerçek zamanlı algılayıcılardaki yaygın bir zayıflığı giderir.
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 14 Ocak 2026
Bağlantılar:Ultralytics Docs, GitHub
YOLO26 hakkında daha fazla bilgi edinin
Karşılaştırmalı Analiz
Mimari ve Tasarım Felsefesi
En çarpıcı fark çıkarım hattında yatmaktadır. DAMO-YOLO, çakışan sınırlayıcı kutuları filtrelemek için NMS gerektiren geleneksel bir algılayıcı iş akışını takip eder. Etkili olsa da, NMS yüksek verimli uygulamalarda bir darboğaz olabilir ve belirli hızlandırıcılarda dağıtımı karmaşıklaştırır.
Buna karşılık, YOLO26 doğal olarak uçtan uca bir yapıdadır. Model, nihai sınırlayıcı kutu kümesini doğrudan tahmin eder. Bu NMS-serbest tasarım, çıkarım gecikmesini azaltmakla kalmaz (özellikle NMS'nin maliyetli olduğu CPU tabanlı kenar cihazlarda), aynı zamanda modeli üretim ortamlarında çalıştırmak için gereken entegrasyon kodunu da basitleştirir.
Dağıtım Kolaylığı
YOLO26'nın NMS-serbest mimarisi, kenar cihazlara dağıtım yaparken C++ veya CUDA'da karmaşık bir son işlem mantığı uygulamanıza gerek olmadığı anlamına gelir. Model çıktısı, nihai algılama sonucudur.
Eğitim Metodolojileri
DAMO-YOLO, yüksek performansını, özellikle daha küçük varyantları için, Bilgi Damıtma'ya büyük ölçüde güvenir. Bu durum, önce güçlü bir öğretmen modelin eğitilmesi gerektiğinden, eğitim hattına karmaşıklık katar.
YOLO26, Büyük Dil Modeli (LLM) optimizasyonu ile bilgisayar görüşü arasındaki boşluğu kapatan MuSGD optimizer'ı sunar. Bu sayede YOLO26, karmaşık damıtma kurulumlarına mutlaka ihtiyaç duymadan son teknoloji yakınsama elde edebilir; ancak Ultralytics eğitim modları çeşitli gelişmiş konfigürasyonları desteklemektedir. Ayrıca, YOLO26'nın ProgLoss'u, öğrenme sürecini stabilize etmek için eğitim sırasında kayıp ağırlıklarını dinamik olarak ayarlar.
Performans Metrikleri
COCO veri kümesindeki performans karşılaştırıldığında, her iki model de etkileyici sonuçlar gösterir, ancak hız ve verimlilik açısından belirgin ödünleşimler ortaya çıkar.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Analiz:
- Parametre Verimliliği: YOLO26, önemli ölçüde daha iyi parametre verimliliği sergiler. Örneğin,
YOLO26selde eder 48.6 mAP yalnızca 9.5M parametre ile, oysaDAMO-YOLOs16.3M parametre ile 46.0 mAP elde eder. Bu durum, YOLO26 modellerini depolamada daha hafif ve yüklemede daha hızlı hale getirir. - Çıkarım Hızı: YOLO26n, TensorRT ile bir T4 GPU üzerinde 1.7 ms gibi bir süreye ulaşarak son derece hızlıdır; Tiny DAMO varyantı için yaklaşık 2.32 ms'ye kıyasla. YOLO26'nın CPU hızı da önemli bir özelliktir ve GPU'ların bulunmadığı Raspberry Pi veya cep telefonları gibi cihazlar için özel olarak optimize edilmiştir.
- Doğruluk: Benzer ölçeklerde (örn. Orta/Büyük), YOLO26, mAP'te DAMO-YOLO'yu sürekli olarak geride bırakır; bu durum muhtemelen gelişmiş STAL atama stratejisi ve geliştirilmiş mimarisi sayesindedir.
Çok Yönlülük ve Görev Desteği
DAMO-YOLO öncelikli olarak nesne algılamaya odaklanmış olsa da, Ultralytics ekosistemi, YOLO26'nın çok görevli bir güç merkezi olmasını sağlar.
- DAMO-YOLO: Nesne Algılama konusunda uzmanlaşmıştır.
- YOLO26: Nesne Algılama, Örnek Segmentasyonu, Görüntü Sınıflandırma, Poz Tahmini ve kutudan çıktığı haliyle Yönlendirilmiş Sınırlayıcı Kutu (OBB) algılamayı destekler.
Bu çok yönlülük, geliştiricilerin çeşitli bilgisayar görüşü problemleri için tek bir birleşik API kullanmasına olanak tanır, öğrenme eğrisini ve teknik borcu azaltır.
Kullanım Kolaylığı ve Ekosistem
YOLO26'nın en güçlü avantajlarından biri, onu çevreleyen Ultralytics ekosistemidir.
DAMO-YOLO, araştırmacıların sonuçları yeniden üretmek için kullanabileceği bir kod tabanı sağlar, ancak daha ürün odaklı kütüphanelerde bulunan kapsamlı dokümantasyon, bakım ve topluluk desteğinden yoksun olabilir.
YOLO26 şunlardan faydalanır:
- Basit API: Tutarlı bir Python ve CLI arayüzünü (
yolo predict ...) hem yeni başlayanlar hem de uzmanlar için eğitimi ve dağıtımı erişilebilir kılar. - Dokümantasyon: Özel veri kümeleri üzerinde eğitimden iOS ve Android için modelleri dışa aktarmaya kadar her konuda kapsamlı kılavuzlar.
- Entegrasyonlar: MLOps için Comet, Weights & Biases ve Roboflow gibi araçlarla sorunsuz bağlantı.
- Bakım: Hataları gideren ve yeni özellikler sunan sık güncellemeler, modelin güncel kalmasını sağlar.
Kod Örneği: YOLO26'yı Çalıştırma
from ultralytics import YOLO
# Load a pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
Kullanım Alanları
DAMO-YOLO ne zaman seçilmeli
- Araştırma Uygulamaları: Çalışmanız Sinirsel Mimari Arama (NAS) incelemesini veya yeni yeniden parametrelendirme tekniklerini keşfetmeyi içeriyorsa, DAMO-YOLO, akademik araştırma için zengin bir zemin sunar.
- Belirli Eski Kısıtlamalar: Mevcut bir işlem hattı, DAMO-YOLO'nun belirli çıktı formatı veya anchor atama stratejileri etrafında sıkı bir şekilde inşa edilmişse ve yeniden düzenleme (refactoring) mümkün değilse.
YOLO26 ne zaman seçilmeli
- Uç Cihaz Dağıtımı: Raspberry Pi, mobil cihazlar veya CPU çıkarım hızı ve düşük bellek ayak izinin kritik olduğu gömülü sistemlerdeki uygulamalar için.
- Gerçek Zamanlı Sistemler: NMS içermeyen yapısı, YOLO26'yı robotik veya otonom sürüşteki ultra düşük gecikme süresi gereksinimleri için ideal kılar.
- Çok Görevli Projeler: Projeniz nesneleri detect etmeyi, maskeleri segment etmeyi ve pozları eş zamanlı olarak tahmin etmeyi gerektiriyorsa, YOLO26 tek bir çerçeve ile tüm bu ihtiyaçları karşılar.
- Ticari Geliştirme: Kararlılığı, desteği ve CoreML ve OpenVINO gibi formatlara kolay dışa aktarımı, onu üretim yazılımları için üstün bir seçenek haline getirir.
Sonuç
Her iki model de bilgisayar görüşünde önemli başarıları temsil etmektedir. DAMO-YOLO, NAS ve verimli özellik füzyonunda etkileyici konseptler sunmuştur. Ancak, YOLO26, dağıtım pratikliği, eğitim kararlılığı ve hesaplama verimliliğine odaklanarak son teknolojiyi geliştirir. Uçtan uca NMS içermeyen tasarımı, üstün parametre verimliliği ve sağlam Ultralytics ekosisteminin desteğiyle YOLO26, modern gerçek zamanlı bilgisayar görüşü uygulamaları için önerilen bir seçenek olarak öne çıkmaktadır.
Ultralytics ailesi içinde diğer seçenekleri keşfetmek isteyenler için, YOLO11 ve YOLOv8 gibi modeller, genel amaçlı detect görevleri için güçlü alternatifler olmaya devam etmektedir.