DAMO-YOLO ile YOLO26: Yeni Nesil Gerçek Zamanlı Nesne Algılama Mimarilerinin Analizi
Bilgisayarlı görü dünyası, yüksek doğruluk ile düşük gecikmeli çıkarımı dengeleyen mimarilere duyulan ihtiyaçla sürekli gelişiyor. Bu karşılaştırma, DAMO-YOLO ve Ultralytics YOLO26 modellerinin teknik inceliklerini derinlemesine ele alarak mimari yeniliklerini, eğitim metodolojilerini ve ideal kullanım senaryolarını inceliyor.
İster uç cihazlara görü modelleri dağıtıyor, ister yüksek verimli bulut hatları oluşturuyor ol, modern yapay zeka geliştirme sürecinde bu modeller arasındaki nüansları anlaman, bilinçli mimari kararlar vermen için kritik önem taşır.
DAMO-YOLO: Ölçeklenebilir Sinirsel Mimari Arama
Alibaba Group tarafından geliştirilen DAMO-YOLO, 23 Kasım 2022'de yayınlandı. Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun tarafından tasarlanan bu model, Sinirsel Mimari Arama (NAS) kullanarak verimli mimarilerin otomatik keşfine yoğun bir şekilde odaklanıyor.
Orijinal araştırmalarını ArXiv makalelerinde inceleyebilir veya kaynak koduna DAMO-YOLO GitHub deposundan göz atabilirsin.
Temel Mimari Özellikler
DAMO-YOLO, gerçek zamanlı nesne algılamanın sınırlarını zorlamak için tasarlanmış birkaç teknik yenilik sunuyor:
- MAE-NAS Omurgalar: DAMO-YOLO, en uygun omurgaları bulmak için Çok Amaçlı Evrimsel arama yöntemini kullanır. Bu NAS yaklaşımı, belirli donanımlarda algılama doğruluğu ile çıkarım hızı arasında kesin bir denge kuran mimariler keşfeder.
- Verimli RepGFPN: Hava görüntüleri gibi karmaşık sahneleri analiz ederken oldukça faydalı olan ve özellik birleştirmeyi önemli ölçüde iyileştiren ağır bir boyun tasarımı.
- ZeroHead Tasarımı: Nihai tahmin katmanlarının hesaplama karmaşıklığını en aza indiren, büyük ölçüde basitleştirilmiş bir algılama başlığı.
- AlignedOTA ve Bilgi Damıtma: DAMO-YOLO, etiket atama belirsizliklerini çözmek için Hizalanmış Optimal Taşıma Ataması (AlignedOTA) kullanır ve daha büyük öğretmen ağlarını kullanarak daha küçük öğrenci modellerinin doğruluğunu artırmak için sağlam bir bilgi damıtma stratejisiyle birleştirir.
DAMO-YOLO hakkında daha fazla bilgi edin
Ultralytics Avantajı: YOLO26
14 Ocak 2026'da Ultralytics bünyesinden Glenn Jocher ve Jing Qiu tarafından yayınlanan YOLO26, erişilebilir ve yüksek performanslı görü yapay zekasının zirvesini temsil ediyor. YOLO11 ve YOLOv10 mirası üzerine inşa edilen YOLO26; uç cihaz odaklı dağıtım, çok modlu çok yönlülük ve benzersiz kullanım kolaylığı için sıfırdan tasarlandı.
YOLO26 Yenilikleri
Ultralytics YOLO26, onu modern bilgisayarlı görü uygulamaları için kesin tercih haline getiren birkaç çığır açıcı özellik sunuyor:
- Uçtan Uca NMS-İçermeyen Tasarım: YOLO26, NMS (Non-Maximum Suppression) son işlemeyi yerel olarak ortadan kaldırır. İlk olarak YOLOv10'da öncülük edilen bu uçtan uca yaklaşım, dağıtım hatlarını büyük ölçüde basitleştirir ve deterministik, düşük gecikmeli çıkarım sağlar.
- %43'e Varan Daha Hızlı CPU Çıkarımı: Uç bilişim için mimari olarak optimize edilen YOLO26, uç cihazlarda ve standart CPU üzerinde olağanüstü hız sunar; bu da onu pille çalışan IoT cihazları için mükemmel hale getirir.
- MuSGD Optimize Edici: LLM eğitiminden (Moonshot AI'ın Kimi K2 modeli gibi) esinlenen YOLO26, SGD ve Muon hibritini bünyesine katar. Bu, büyük dil modeli eğitimindeki kararlılığı bilgisayarlı görüye taşıyarak daha hızlı ve güvenilir bir yakınsama sağlar.
- DFL Kaldırma: Dağılımsal Odak Kaybı (Distribution Focal Loss) kaldırılarak model grafiği basitleştirilir, bu da ONNX ve TensorRT gibi formatlara sorunsuz dışa aktarıma olanak tanır.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone operasyonları ve tarım için kritik bir özellik olan küçük nesne tanımada belirgin iyileştirmeler sağlar.
YOLO26, çoklu modlar genelinde özelleştirilmiş iyileştirmeler içerir: Örnek Segmentasyonu için çok ölçekli bir proto, Poz Tahmini için Kalıntı Log-Olabilirlik Tahmini (RLE) ve Yönelimli Sınırlayıcı Kutu (OBB) algılamasında sınır sorunlarını hafifletmek için gelişmiş açı kaybı.
YOLO26 hakkında daha fazla bilgi edin
Performans Karşılaştırması
Bu modelleri değerlendirirken doğruluk (mAP) ve hesaplama verimliliği (Hız/FLOPs) arasındaki denge çok önemlidir. Aşağıdaki tablo, bu modellerin endüstri standardı olan COCO veri kümesi kullanılarak nasıl karşılaştırıldığını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Yukarıda görüldüğü üzere YOLO26, önemli ölçüde daha az parametre ve FLOP ile sürekli olarak daha yüksek doğruluk sunar; bu da hem eğitim hem de çıkarım için çok daha verimli bir mimari sağlar.
Eğitim Verimliliği ve Kullanılabilirlik
DAMO-YOLO'nun Karmaşıklıkları
DAMO-YOLO rekabetçi bir doğruluk elde etse de eğitim metodolojisi oldukça karmaşıktır. Sinirsel Mimari Arama (NAS) ve ağır bilgi damıtma süreçlerine bağımlılık, özel bir model eğitmenin genellikle önemli miktarda GPU kaynağı ve uzmanlık gerektirdiği anlamına gelir. Büyük bir öğretmen modelini eğitip bunu daha küçük bir öğrenci modeline damıtma şeklindeki bu çok aşamalı süreç, özel veri kümeleri üzerinde hızlıca yineleme yapmaya çalışan çevik mühendislik ekipleri için bir darboğaz oluşturabilir.
Modern ve Akıcı Ultralytics Deneyimi
Conversely, Ultralytics YOLO26 is designed for "zero-to-hero" usability. The entire training, validation, and deployment lifecycle is abstracted behind a clean, unified Python API and CLI. Furthermore, YOLO26 requires significantly less CUDA memory during training compared to transformer-based models like RT-DETR, allowing researchers to train state-of-the-art models on consumer-grade hardware.
İşte Ultralytics SDK kullanarak bir YOLO26 modelini eğitmenin, değerlendirmenin ve dışa aktarmanın ne kadar kolay olduğuna dair bir örnek:
from ultralytics import YOLO
# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Evaluate the model's performance on the validation set
metrics = model.val()
# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
# Export the model to ONNX format for deployment
model.export(format="onnx")Kodsuz bir ortamı tercih eden ekipler için Ultralytics Platform, veri kümesi etiketleme, bulut eğitimi ve sorunsuz dağıtım için sezgisel bir arayüz sağlar.
Gerçek Dünya Uygulamaları
Doğru mimariyi seçmek, büyük ölçüde hedef dağıtım ortamına ve donanım kısıtlamalarına bağlıdır.
Endüstriyel Kalite Kontrol
Yüksek hızlı üretim otomasyonu için DAMO-YOLO, özel GPU donanımlarında iyi performans gösterebilir. Ancak modern montaj hatları için YOLO26 tercih edilen seçenektir. Uçtan Uca NMS-İçermeyen tasarımı, görsel verileri robotik aktüatörlerle gerçek zamanlı olarak senkronize ederken hayati önem taşıyan deterministik ve titreşimsiz bir gecikme sağlar.
Uç Yapay Zekası ve Mobil Cihazlar
Bilgisayarlı görüyü pille çalışan cihazlara dağıtmak aşırı verimlilik gerektirir. DAMO-YOLO özel RepGFPN boyunlarına güvenirken, YOLO26n (Nano) özellikle uç bilişim için optimize edilmiştir. DFL kaldırma özelliği ve %43 daha hızlı CPU çıkarımı onu akıllı kameralar, mobil uygulamalar ve güvenlik alarm sistemleri için en üstün çözüm haline getirir.
Çok Modlu Proje Gereksinimleri
Eğer bir proje sadece nesne algılamadan daha fazlasını gerektiriyorsa (örneğin poz tahmini kullanarak spor branşındaki oyuncu mekaniklerini analiz etmek veya örnek segmentasyonu kullanarak tam piksel sınırlarını çıkarmak gibi), YOLO26 tüm bu görevler için tek ve birleşik bir kod tabanı içinde yerel destek sağlar. DAMO-YOLO ise yalnızca sınırlayıcı kutu algılama ile sınırlıdır.
Kullanım Durumları ve Öneriler
DAMO-YOLO ile YOLO26 arasında seçim yapmak, senin özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman DAMO-YOLO Seçilmeli
DAMO-YOLO şunlar için güçlü bir tercihtir:
- Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.
Ne Zaman YOLO26 Seçilmeli
YOLO26 şunlar için önerilir:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Sonuç
Her iki mimari de derin öğrenme alanında önemli başarıları temsil ediyor. DAMO-YOLO, belirli donanım kıyaslamaları için uyarlanmış Sinirsel Mimari Arama ve damıtma tekniklerinin gücüne büyüleyici bir bakış sunuyor.
Ancak üretime hazır bir çözüm arayan geliştiriciler, araştırmacılar ve işletmeler için Ultralytics YOLO26 üstün bir seçenek olarak öne çıkıyor. Uçtan uca NMS-içermeyen tasarımı, devasa CPU çıkarım kazanımları, çok modlu çok yönlülüğü ve iyi bakılan Ultralytics ekosistemine entegrasyonu, onu günümüzün gerçek dünyadaki bilgisayarlı görü zorluklarını çözmek için en sağlam ve pratik araç haline getiriyor.
Ultralytics ekosistemindeki diğer modelleri keşfetmek isteyen kullanıcılar için YOLO11, YOLOv8 ve transformer tabanlı RT-DETR için kapsamlı belgelendirme mevcuttur.