YOLO26 vs. DAMO-YOLO: Gerçek Zamanlı Nesne Algılamayı Geliştirmek
Hızla gelişen bilgisayar görüşü ortamında, doğru nesne algılama modelini seçmek doğruluk, hız ve dağıtım fizibilitesini dengelemek için kritik öneme sahiptir. Bu karşılaştırma, Ultralytics'in en yeni kenar optimize edilmiş çözümü olan YOLO26 ile Alibaba Group tarafından geliştirilen yüksek performanslı bir dedektör olan DAMO-YOLO'yu inceliyor. Her iki model de önemli mimari yenilikler sunsa da, dağıtım hattında biraz farklı öncelikleri hedeflemektedir.
Modele Genel Bakış
Ultralytics YOLO26
YOLO26, basitlik ve kenar verimliliğine doğru bir paradigma değişimi temsil eder. Ocak 2026'da piyasaya sürülen bu model, geleneksel ön işleme sonrası karmaşıklıklarını ortadan kaldırmak ve CPU kısıtlı cihazlarda son teknoloji performans sunmak üzere tasarlanmıştır. Nesne algılama, örnek segmentasyon, poz tahmini, sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama dahil olmak üzere çok çeşitli görevleri doğal olarak destekler.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 14 Ocak 2026
- GitHub:Ultralytics Deposu
YOLO26 hakkında daha fazla bilgi edinin
DAMO-YOLO
DAMO-YOLO, gelişmiş sinirsel mimari arama (NAS) ve ağır yeniden parametrelendirme yoluyla hız ve doğruluk arasındaki dengeyi optimize etmeye odaklanır. Alibaba'daki TinyVision ekibi tarafından geliştirilen bu model, özellik çıkarım verimliliğini en üst düzeye çıkarmak için RepGFPN ve ZeroHead gibi yeni bileşenler sunar ve öncelikli olarak genel amaçlı GPU senaryolarını hedefler.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 23 Kasım 2022
- Arxiv:DAMO-YOLO Makalesi
- GitHub:DAMO-YOLO Deposu
Teknik Mimari Karşılaştırması
Uçtan Uca vs. Geleneksel NMS
En önemli operasyonel fark, tahminlerin nasıl sonuçlandırıldığıdır.
YOLO26, doğal olarak uçtan uca NMS içermeyen bir tasarım kullanır. Nihai tahminleri doğrudan ağdan üreterek, Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırır. Bu ön işleme sonrası adımının kaldırılması, gecikme değişkenliğini azaltır ve dağıtım hatlarını basitleştirir; özellikle NMS işlemlerinin bir darboğaz olabileceği Raspberry Pi veya mobil cihazlar gibi kenar donanımlarda. Bu yaklaşım, YOLOv10'da başarıyla öncülük edilmiş ve burada geliştirilmiştir.
DAMO-YOLO, çakışan kutuları filtrelemek için NMS gerektiren daha geleneksel bir yoğun tahmin başlığına (ZeroHead) dayanır. Etkili olmakla birlikte, bu, çıkarım sırasında algılanan nesnelerin sayısıyla ölçeklenen bir hesaplama adımı ekler ve kalabalık sahnelerde potansiyel olarak gecikme dalgalanması yaratır.
Eğitim İnovasyonu: MuSGD vs. NAS
YOLO26, SGD ve Muon'un bir hibriti olan MuSGD Optimizer'ı sunar. Moonshot AI'nin Kimi K2'si gibi LLM eğitimindeki çığır açan gelişmelerden ilham alan bu optimize edici, daha kararlı eğitim dinamikleri ve daha hızlı yakınsama sağlayarak kullanıcıların daha az epok ile optimum performansa ulaşmasına olanak tanır.
DAMO-YOLO, verimli backbone yapılarını otomatik olarak keşfetmek için MAE-NAS yöntemi aracılığıyla Sinirsel Mimari Arama (NAS) yöntemini kullanır. Ayrıca, birden çok ölçekte özellikleri birleştiren ağır bir yeniden parametrelendirme boynu olan Efficient RepGFPN'yi de kullanır. Güçlü olmakla birlikte, bu NAS türevi mimariler bazen Ultralytics modellerindeki elle tasarlanmış, akıcı bloklara kıyasla değiştirmesi veya ince ayar yapması daha az sezgisel olabilir.
Kayıp Fonksiyonları
YOLO26, CoreML ve TensorRT gibi formatlara dışa aktarılabilirliği kolaylaştırmak için Distribution Focal Loss (DFL)'yi kaldırır. Bunun yerine, ProgLoss ve Küçük Hedef Farkındalıklı Etiket Ataması (STAL) kullanır; bu da hava görüntüleme ve tıbbi analiz gibi sektörlerde yaygın bir sorun noktası olan küçük nesneler üzerindeki performansı önemli ölçüde artırır.
DAMO-YOLO, sınıflandırma ve regresyon görevleri arasındaki yanlış hizalamayı çözen bir etiket atama stratejisi olan AlignedOTA kullanır. Eğitim sırasında yüksek kaliteli ankrajların en alakalı gerçek değerlere atanmasını sağlamaya odaklanır.
YOLO26'da Kenar Optimizasyonu
DFL ve NMS'nin kaldırılmasıyla YOLO26, önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı sağlar. Bu durum, GPU kaynaklarının bulunmadığı, cihaz üzerinde akıllı otopark yönetimi gibi "Edge AI" uygulamaları için onu benzersiz kılar.
Performans Metrikleri
Aşağıdaki tablo, performans farklılıklarını vurgulamaktadır. YOLO26, özellikle parametre sayısı ve FLOPs açısından üstün verimlilik sergilerken, rekabetçi veya üstün doğruluğu korur.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Temel Çıkarımlar
- Verimlilik: YOLO26n (Nano), DAMO-YOLOt'den yaklaşık 3.5 kat daha az parametreye ve 3.3 kat daha düşük FLOPs'a sahipken benzer doğruluk elde eder. Hesaplama yükündeki bu çarpıcı azalma, YOLO26'yı mobil ve IoT dağıtımı için önemli ölçüde daha iyi hale getirir.
- Doğruluk Ölçeklendirmesi: Modeller büyüdükçe, YOLO26m, daha az parametre (20.4M'ye karşı 28.2M) kullanırken DAMO-YOLOm'yi neredeyse 4.0 mAP ile geride bırakır.
- Hız: YOLO26, tüm ölçeklerde T4 GPU'larda sürekli olarak daha hızlı çıkarım süreleri sunar; bu, video analizi gibi yüksek verimli uygulamalar için kritik öneme sahiptir.
Kullanılabilirlik ve Ekosistem
Basitlik ve Dokümantasyon
Ayırt edici özelliklerinden biri Ultralytics modellerinin kullanım kolaylığıdır. YOLO26, ultralytics Python paketine entegre edilmiştir ve kullanıcıların modelleri yalnızca birkaç satır kodla eğitmesine, doğrulamasına ve dağıtmasına olanak tanır.
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100)
Buna karşılık, DAMO-YOLO araştırma odaklı bir depodur. Eğitim ve çıkarım için betikler sunsa da, Ultralytics ekosisteminin sunduğu birleşik API'den, kapsamlı kılavuzlardan ve geniş işletim sistemi desteğinden (Windows, Linux, macOS) yoksundur.
Dağıtım ve Dışa Aktarım
YOLO26, ONNX, OpenVINO, CoreML ve TFLite dahil olmak üzere 10'dan fazla formata tek tıklamayla dışa aktarımı destekler. Bu esneklik, mühendislerin araştırmadan üretime geçişi için hayati öneme sahiptir. DFL gibi karmaşık modüllerin kaldırılması, bu dışa aktarımların sağlam olmasını ve daha geniş bir donanım hızlandırıcı yelpazesiyle uyumlu olmasını sağlar.
DAMO-YOLO, dışa aktarma sırasında dikkatle ele alınması gereken belirli yeniden parametrelendirme adımlarına dayanır. Eğitim modundan dağıtım moduna doğru şekilde "geçiş" yapılmazsa, model performansı düşebilir veya çalışmayabilir, bu da kullanıcı için bir karmaşıklık katmanı ekler.
Gerçek Dünya Kullanım Durumları
YOLO26 İçin İdeal Senaryolar
- Edge Cihazlar ve IoT: Minimal bellek ayak izi (2.4M parametreden başlayarak) sayesinde YOLO26, güç ve RAM'in sınırlı olduğu güvenlik kameraları ve drone'lar için mükemmeldir.
- Gerçek Zamanlı Spor Analizi: NMS içermeyen tasarım, spor uygulamalarında hızlı hareket eden nesneleri takip etmek için kritik olan tutarlı gecikmeyi sağlar.
- Çok Görevli Sistemler: YOLO26, segmentasyon, poz ve obb'yi yerel olarak desteklediği için, yönelim ve kavrama noktaları gerektiren robotik manipülasyon gibi karmaşık iş akışları için tercih edilen seçenektir.
DAMO-YOLO için İdeal Senaryolar
- Akademik Araştırma: NAS ve gelişmiş damıtma tekniklerini kullanması, mimari arama metodolojilerini inceleyen araştırmacılar için güçlü bir aday olmasını sağlar.
- Yüksek Uç GPU Sunucuları: Donanım kısıtlamalarının olmadığı ve belirli kıyaslamalarda doğruluğun her bir kesrinin önemli olduğu senaryolarda, DAMO-YOLO'nun ağır backbone'u etkin bir şekilde kullanılabilir.
Sonuç
DAMO-YOLO, 2022'de mimari arama ve yeniden parametrelendirmede etkileyici konseptler sunmuş olsa da, YOLO26 2026 için son teknolojiyi temsil etmektedir. Uçtan uca basitliğe odaklanarak, NMS ve DFL gibi darboğazları ortadan kaldırarak ve parametre sayılarını önemli ölçüde azaltarak, YOLO26 modern yapay zeka geliştiricileri için daha pratik, daha hızlı ve kullanıcı dostu bir çözüm sunar.
Bugün sağlam bilgisayar görüşü çözümleri dağıtmak isteyen kullanıcılar için, Ultralytics Platformu ile sorunsuz entegrasyon ve muazzam watt başına performans verimliliği, YOLO26'yı açık ara tavsiye haline getirmektedir.
Daha Fazla Okuma
Diğer mimari yaklaşımlarla ilgilenenler için, belgelerdeki bu ilgili modelleri inceleyin:
- YOLO11 - Çok yönlülük ve doğruluk için önceki nesil standardı.
- RT-DETR - NMS içermeyen çıkarım da sunan, transformatör tabanlı gerçek zamanlı bir dedektör.
- YOLOv10 - YOLO26'da kullanılan uçtan uca NMS içermeyen eğitim yaklaşımının öncüsü.