İçeriğe geç

DAMO-YOLO ve YOLO26: Yeni Nesil Gerçek Zamanlı Nesne Algılama Mimarilerini Analiz Etmek

Bilgisayar görüşü alanı, yüksek doğruluğu düşük gecikmeli çıkarım ile dengeleyen mimarilere duyulan ihtiyaçla sürekli gelişmektedir. Bu karşılaştırma, DAMO-YOLO ve Ultralytics YOLO26'nın mimari yeniliklerini, eğitim metodolojilerini ve ideal kullanım durumlarını inceleyerek teknik inceliklerine derinlemesine bakar.

İster görüntü modellerini kenar cihazlara dağıtıyor olun, ister yüksek verimli bulut hatları inşa ediyor olun, bu modeller arasındaki nüansları anlamak, modern yapay zeka geliştirmede bilinçli mimari kararlar almak için çok önemlidir.

DAMO-YOLO: Büyük Ölçekte Sinirsel Mimari Arama

DAMO-YOLO, Alibaba Group tarafından geliştirilmiş olup 23 Kasım 2022'de yayınlanmıştır. Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun tarafından tasarlanan bu model, Sinirsel Mimari Arama (NAS) kullanarak verimli mimarilerin otomatik keşfine büyük ölçüde odaklanmaktadır.

Orijinal araştırmayı ArXiv makalelerinde inceleyebilir veya kaynak kodunu DAMO-YOLO GitHub deposunda keşfedebilirsiniz.

Temel Mimari Özellikler

DAMO-YOLO, gerçek zamanlı nesne algılamanın sınırlarını zorlamak üzere tasarlanmış çeşitli teknik yenilikler sunmaktadır:

  • MAE-NAS Backbone'ları: DAMO-YOLO, optimal backbone'ları bulmak için Çok Amaçlı Evrimsel arama kullanır. Bu NAS yaklaşımı, belirli donanımlarda algılama doğruluğunu çıkarım hızıyla kesin bir şekilde dengeleyen mimarileri keşfeder.
  • Verimli RepGFPN: Özellik birleştirmeyi önemli ölçüde iyileştiren, hava görüntüleri gibi karmaşık sahneleri analiz ederken oldukça faydalı olan ağır bir neck tasarımı.
  • ZeroHead Tasarımı: Nihai tahmin katmanlarının hesaplama karmaşıklığını minimize eden, büyük ölçüde basitleştirilmiş bir algılama başlığı.
  • AlignedOTA ve Damıtma: DAMO-YOLO, etiket atama belirsizliklerini çözmek için Hizalı Optimal Taşıma Ataması (AlignedOTA) kullanır ve daha büyük öğretmen ağları kullanarak daha küçük öğrenci modellerinin doğruluğunu artırmak için sağlam bir bilgi damıtma geliştirme stratejisiyle eşleştirilmiştir.

DAMO-YOLO hakkında daha fazla bilgi edinin

Ultralytics Avantajı: YOLO26

Ultralytics'ten Glenn Jocher ve Jing Qiu tarafından 14 Ocak 2026'da yayınlanan YOLO26, erişilebilir, yüksek performanslı yapay görme yapay zekasının zirvesini temsil etmektedir. YOLO11 ve YOLOv10 mirası üzerine inşa edilen YOLO26, uçtan uca dağıtım, çok modlu çok yönlülük ve benzersiz kullanım kolaylığı için sıfırdan tasarlanmıştır.

YOLO26 Yenilikleri

Ultralytics YOLO26, onu modern bilgisayar görüşü uygulamaları için kesin bir tercih haline getiren çığır açan çeşitli özellikler sunmaktadır:

  • Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) ön işleme sonrası adımını doğal olarak ortadan kaldırır. Başlangıçta YOLOv10'da öncülük edilen bu uçtan uca yaklaşım, dağıtım hatlarını önemli ölçüde basitleştirir ve deterministik, düşük gecikmeli çıkarım sağlar.
  • Yüzde 43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilişim için mimari olarak optimize edilmiş YOLO26, uç cihazlarda ve standart CPU'larda olağanüstü hız sunarak pille çalışan IoT cihazları için mükemmel bir çözüm sunar.
  • MuSGD Optimizasyonu: LLM eğitiminden (Moonshot AI'nin Kimi K2'si gibi) esinlenilen YOLO26, SGD ve Muon'un bir hibritini içerir. Bu, büyük dil modeli eğitim kararlılığını bilgisayar görüşüne getirerek daha hızlı ve daha güvenilir yakınsama sağlar.
  • DFL Kaldırma: Distribution Focal Loss'un kaldırılmasıyla model grafiği basitleştirilir, bu da ONNX ve TensorRT gibi formatlara sorunsuz dışa aktarımı mümkün kılar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone operasyonları ve tarım için kritik bir özellik olan küçük nesne tanımada önemli iyileştirmeler sağlar.

Göreve Özel İyileştirmeler

YOLO26, birden fazla modalitede özel iyileştirmeler içerir: Instance Segmentation için çok ölçekli bir proto, Pose Estimation için Artık Log-Olasılık Tahmini (RLE) ve Oriented Bounding Box (OBB) algılamasında sınır sorunlarını azaltmak için gelişmiş açı kaybı.

YOLO26 hakkında daha fazla bilgi edinin

Performans Karşılaştırması

Bu modelleri değerlendirirken, doğruluk (mAP) ve hesaplama verimliliği (Hız/FLOPs) arasındaki denge çok önemlidir. Aşağıdaki tablo, bu modellerin endüstri standardı COCO veri kümesi kullanılarak nasıl karşılaştırıldığını göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Yukarıda görüldüğü gibi, YOLO26, önemli ölçüde daha az parametre ve FLOPs ile sürekli olarak daha yüksek doğruluk sunarak hem eğitim hem de çıkarım için çok daha verimli bir mimariyle sonuçlanır.

Eğitim Verimliliği ve Kullanılabilirlik

DAMO-YOLO'nun Karmaşıklıkları

DAMO-YOLO rekabetçi doğruluk elde etse de, eğitim metodolojisi oldukça karmaşıktır. Sinirsel Mimari Arama (NAS) ve yoğun bilgi damıtma kullanımı, özel bir model eğitmenin genellikle önemli GPU kaynakları ve uzmanlık bilgisi gerektirdiği anlamına gelir. Bu çok aşamalı süreç (büyük bir öğretmen modelini daha küçük bir öğrenci modeline damıtmak), özel veri kümeleri üzerinde hızlı bir şekilde yineleme yapmaya çalışan çevik mühendislik ekipleri için bir darboğaz oluşturabilir.

Kolaylaştırılmış Ultralytics Deneyimi

Tersine, Ultralytics YOLO26, "sıfırdan kahramana" kullanım kolaylığı için tasarlanmıştır. Tüm eğitim, doğrulama ve dağıtım yaşam döngüsü, temiz, birleşik bir Python API ve CLI arkasında soyutlanmıştır. Ayrıca, YOLO26, RT-DETR gibi transformatör tabanlı modellere kıyasla eğitim sırasında önemli ölçüde daha az CUDA belleği gerektirerek araştırmacıların tüketici sınıfı donanımlarda son teknoloji modelleri eğitmesine olanak tanır.

Ultralytics SDK kullanarak bir YOLO26 modelini eğitmenin, değerlendirmenin ve dışa aktarmanın ne kadar basit olduğuna dair bir örnek aşağıdadır:

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the model's performance on the validation set
metrics = model.val()

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export the model to ONNX format for deployment
model.export(format="onnx")

Kodsuz bir ortamı tercih eden ekipler için Ultralytics Platform, veri kümesi açıklama, bulut eğitimi ve sorunsuz dağıtım için sezgisel bir arayüz sağlar.

Gerçek Dünya Uygulamaları

Doğru mimariyi seçmek, hedef dağıtım ortamına ve donanım kısıtlamalarına büyük ölçüde bağlıdır.

Endüstriyel Kalite Kontrol

Yüksek hızlı üretim otomasyonu için DAMO-YOLO, özel GPU donanımında iyi performans gösterebilir. Ancak, YOLO26 modern montaj hatları için tercih edilen seçenektir. Onun Uçtan Uca NMS-Free tasarımı, görsel verileri robotik aktüatörlerle gerçek zamanlı senkronize ederken çok önemli olan deterministik, titreşimsiz gecikme sağlar.

Kenar Yapay Zeka ve Mobil Cihazlar

Bilgisayar görüşünü pille çalışan cihazlara dağıtmak aşırı verimlilik gerektirir. DAMO-YOLO belirli RepGFPN neck'lerine dayanırken, YOLO26n (Nano) özellikle uç bilişim için optimize edilmiştir. DFL kaldırma özelliği ve yüzde 43 daha hızlı CPU çıkarımı, onu akıllı kameralar, mobil uygulamalar ve güvenlik alarm sistemleri için nihai çözüm haline getirir.

Çok Modlu Proje Gereksinimleri

Bir proje sadece nesne algılamadan daha fazlasını gerektiriyorsa—örneğin, poz tahmini kullanarak spor dallarında oyuncu mekaniklerini analiz etmek veya örnek segmentasyonu kullanarak kesin piksel sınırlarını çıkarmak gibi—YOLO26, tüm bu görevler için tek, birleşik bir kod tabanı içinde yerel destek sağlar. DAMO-YOLO, sınırlayıcı kutu algılama ile sıkı bir şekilde sınırlıdır.

Kullanım Durumları ve Öneriler

DAMO-YOLO ve YOLO26 arasında seçim yapmak, belirli proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

Ne Zaman DAMO-YOLO Seçmeli

DAMO-YOLO şunlar için güçlü bir seçimdir:

  • Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.

YOLO26 Ne Zaman Seçilmeli

YOLO26 şunlar için önerilir:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Sonuç

Her iki mimari de derin öğrenme alanında önemli başarıları temsil etmektedir. DAMO-YOLO, belirli donanım kıyaslamaları için özel olarak tasarlanmış Sinirsel Mimari Arama (NAS) ve damıtma tekniklerinin gücüne büyüleyici bir bakış sunar.

Ancak, üretim ortamına hazır bir çözüm arayan geliştiriciler, araştırmacılar ve işletmeler için Ultralytics YOLO26 üstün bir seçenek olarak öne çıkmaktadır. Uçtan uca NMS içermeyen tasarımı, büyük CPU çıkarım kazançları, çok modlu çok yönlülüğü ve iyi yönetilen Ultralytics ekosistemine entegrasyonu, onu günümüzün gerçek dünya bilgisayar görüşü sorunlarını çözmek için en sağlam ve pratik araç haline getirmektedir.

Ultralytics ekosistemi içindeki diğer modelleri keşfetmek isteyen kullanıcılar için YOLO11, YOLOv8 ve transformatör tabanlı RT-DETR için kapsamlı dokümantasyon mevcuttur.


Yorumlar