YOLO26 ve DAMO-YOLO: Gerçek Zamanlı Nesne Tespit Edicilerin Teknik Bir Karşılaştırması

En son teknoloji bir bilgisayarlı görü modeli seçerken, çıkarım hızı, doğruluk ve dağıtım kolaylığı arasında optimum dengeyi bulmak kritiktir. Bu kapsamlı rehber, görü yapay zekası dünyasındaki iki önde gelen modeli karşılaştırıyor: Ultralytics YOLO26 ve DAMO-YOLO. Her iki mimari de gerçek zamanlı nesne tespitinin sınırlarını zorlasa da, temel tasarım felsefeleri ve kullanım amaçları önemli ölçüde farklılık gösterir.

Mimari Yenilikler ve Tasarım

Ultralytics YOLO26: Uçtan Uca Görü Standardı

Glenn Jocher ve Jing Qiu tarafından Ultralytics bünyesinde geliştirilen ve 14 Ocak 2026'da yayınlanan YOLO26, YOLO ailesinde büyük bir sıçramayı temsil ediyor. Uç bilişim için sıfırdan tasarlanmış olup, en gelişmiş LLM eğitim pratiklerini ileri seviye görü mimarileriyle kusursuz bir şekilde birleştirir.

YOLO26'nın temel mimari atılımları şunlardır:

  • Uçtan Uca NMS-İçermeyen Tasarım: YOLOv10 çalışmalarının üzerine inşa edilen YOLO26, doğal olarak uçtan ucadır. Post-processing sırasında Maksimum Olmayan Bastırma (NMS) adımını tamamen ortadan kaldırarak deterministik gecikme süresini garanti eder ve dağıtım hatlarını büyük ölçüde basitleştirir.
  • DFL Kaldırılması: Dağılım Odaklı Kaybın (DFL) kaldırılması, model grafiğini sadeleştirir. Bu, ONNX ve TensorRT gibi dağıtım çerçevelerine aktarımı çok daha akıcı hale getirir ve düşük güç tüketen uç cihazlarla daha iyi uyumluluk sağlar.
  • MuSGD Optimize Edici: Moonshot AI'ın Kimi K2 modelinden esinlenen bu Stokastik Gradyan İnişi (SGD) ve Muon melezi, LLM eğitim yeniliklerini bilgisayarlı görüye taşıyarak şaşırtıcı derecede kararlı bir eğitim ve hızlı yakınsama sağlar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone tabanlı hava görüntü analizi ve karmaşık robotik sistemleri için kritik bir ihtiyaç olan küçük nesne tanımada kayda değer iyileştirmeler sunar.

YOLO26 hakkında daha fazla bilgi edin

DAMO-YOLO: Ölçeklenebilir Sinirsel Mimari Arama

Alibaba Group'tan Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun tarafından geliştirilen (23 Kasım 2022'de yayınlanan) DAMO-YOLO, büyük ölçüde otomatik mimari keşfine odaklanır. arXiv makalelerinde detaylandırılan çalışma, katı gecikme bütçeleri altında en iyi ana gövdeleri bulmak için Sinirsel Mimari Arama (NAS) kullanır.

DAMO-YOLO'nun temel mimari özellikleri şunlardır:

  • MAE-NAS Ana Gövde: Doğruluk ile hedef dağıtım hızı arasında denge kuran ana gövdeleri otomatik olarak tasarlamak için Çok Amaçlı Evrimsel arama kullanır.
  • Verimli RepGFPN: Farklı ölçeklerde özellik füzyonunu optimize eden, karmaşık görsel sahneleri işleme konusunda son derece yetenekli, sağlam ve ağır bir boyun tasarımıdır.
  • ZeroHead: Nihai tahmin katmanlarında hesaplama yükünü en aza indirmek için tasarlanmış, büyük ölçüde basitleştirilmiş bir tespit kafasıdır.

DAMO-YOLO hakkında daha fazla bilgi edin

Doğru Mimarinin Seçimi

DAMO-YOLO'nun NAS odaklı mimarisi belirli, önceden tanımlanmış donanım kısıtlamaları için mükemmel olsa da, YOLO26'nın NMS-içermeyen tasarımı ve DFL kaldırma özelliği, onu çok çeşitli uç ve bulut ortamlarında çok daha esnek ve öngörülebilir bir seçenek haline getirir.

Performans ve Metrik Karşılaştırması

Standart COCO veri seti üzerinde eğitilmiş model varyantlarının doğrudan karşılaştırılması, belirgin performans profillerini ortaya koymaktadır. Aşağıdaki tablo, doğruluk (mAP), hız ve hesaplama alanı (parametreler ve FLOP'lar) arasındaki dengeleri özetlemektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Performans Analizi

Verileri analiz ederken performans dengesi, modern uygulamalar için büyük ölçüde YOLO26 lehine eğilmektedir. Nano varyant (YOLO26n), yalnızca 2.4M parametre ile son derece hafiftir ve NVIDIA T4 GPU üzerinde 1.7 ms gibi çok yüksek hızlar sunar. Dahası, YOLO26 özellikle %43'e kadar daha hızlı CPU çıkarımı sağlamak üzere tasarlanmıştır, bu da onu özel GPU hızlandırıcıları olmayan uç cihazlar için tartışmasız bir şampiyon yapar.

DAMO-YOLOt, saf mAP konusunda YOLO26n'yi biraz geride bıraksa da, bunu neredeyse dört kat daha fazla parametre sayısı (8.5M) gerektirerek yapar. Daha büyük varyantlara geçtiğimizde, YOLO26, daha küçük bir bellek alanı, eğitim sırasında daha düşük CUDA bellek kullanımı ve çok daha hızlı TensorRT hızları sağlarken DAMO-YOLO'dan istikrarlı bir şekilde daha iyi performans gösterir.

Ekosistem, Kullanılabilirlik ve Eğitim Verimliliği

Bir makine öğrenimi modelinin gerçek gücü sadece ham metriklerinde değil, geliştiriciler ve araştırmacılar tarafından ne kadar kolay kullanılabilir olduğunda yatar.

Ultralytics Avantajı

Bir Ultralytics modeli seçmek, yüksek düzeyde geliştirilmiş, geliştirici odaklı bir ekosisteme erişimi garanti eder. Veri artırma, hiperparametre ayarı ve sağlam deney takibi içeren karmaşık iş akışları, sezgisel komutlarla basitleştirilmiştir.

Dahası, YOLO26 eşsiz bir esneklik sunar. DAMO-YOLO kesinlikle bir nesne tespit ediciyken, YOLO26 kutudan çıktığı anda birden fazla alanda kapsamlı ve göreve özel iyileştirmeler sağlar:

Eğitim Metodolojileri

DAMO-YOLO'nun eğitimi genellikle büyük bir "öğretmen" modelinin daha küçük bir "öğrenci" modelini eğittiği karmaşık bir damıtma sürecini içerir. Bu teknik marjinal doğruluk kazanımları sağlasa da, kapsamlı GPU belleği ve daha uzun eğitim döngüleri gerektirir.

Buna karşılık, YOLO26 için bellek gereksinimleri önemli ölçüde daha düşüktür. MuSGD optimize edici tarafından desteklenen YOLO26, standart tüketici sınıfı donanımlarda hızlı ve verimli bir şekilde eğitilir. PyTorch destekli Ultralytics Python API'sini kullanarak bir YOLO26 modelini ne kadar kolay eğitebileceğin aşağıdadır:

from ultralytics import YOLO

# Initialize the natively end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the optimized, NMS-free model
model.export(format="onnx")
Diğer Modelleri Keşfetmek

Ultralytics ekosistemindeki diğer modern mimarileri keşfetmek istersen, son derece yetenekli YOLO11 eski sistemler için harika bir seçenek olmaya devam ediyor. Alternatif olarak, transformer tabanlı mimarilerle ilgilenen araştırmacılar RT-DETR modelini inceleyebilirler.

Gerçek Dünya Uygulamaları

Bu mimariler arasında seçim yapmak nihayetinde dağıtım ortamına bağlıdır.

Uç Yapay Zekası ve IoT Cihazları

Akıllı perakende kameraları, otomatik tarımsal monitörler veya robotik için hesaplama kaynakları kesinlikle sınırlıdır. Burada YOLO26 kesin seçimdir. %43 daha hızlı CPU çıkarımı, tamamen NMS-içermeyen hattı ve küçük parametre ayak izi, kritik doğruluğu feda etmeden Raspberry Pi gibi uç cihazlarda sorunsuz çalışmasını sağlar.

Yüksek Hızlı Üretim ve Kalite Kontrol

Hızlı tempolu üretim otomasyonu hatlarında, hızlı hareket eden konveyör bantlarındaki kusurları tespit etmek minimum, deterministik gecikme gerektirir. DAMO-YOLO belirli GPU konfigürasyonlarında yeterince iyi performans gösterse de, geleneksel NMS post-processing'in getirdiği değişken gecikme süresi, robotik aktüatörlerin senkronizasyonunu bozabilir. YOLO26'nın uçtan uca yapısı, tutarlı ve öngörülebilir çerçeve işleme sürelerini garanti ederek yüksek hızlı endüstriyel robotik sistemlere kusursuz bir entegrasyon sağlar.

Drone ve Hava Görüntüleri

Yüksek irtifalardan küçük nesneleri tespit etmek oldukça zordur. YOLO26'daki ProgLoss ve STAL entegrasyonu, küçük nesne tanımayı önemli ölçüde iyileştirir. İster vahşi yaşamı takip et, ister İHA'lardan trafik sıkışıklığını analiz et; YOLO26, DAMO-YOLO dahil olmak üzere eski mimarilerin sıklıkla gözden kaçırdığı daha küçük piksel alanına sahip nesneleri tutarlı bir şekilde tanımlar.

Kullanım Durumları ve Öneriler

YOLO26 ile DAMO-YOLO arasında seçim yapmak, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Ne Zaman YOLO26 Seçilmeli

YOLO26 aşağıdakiler için güçlü bir seçimdir:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Ne Zaman DAMO-YOLO Seçilmeli

DAMO-YOLO şunlar için önerilir:

  • Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.

Sonuç

DAMO-YOLO, belirli donanım hedefleri için Sinirsel Mimari Arama yetenekleri üzerine büyüleyici bir çalışma olmaya devam etse de, Ultralytics YOLO26 modern yapay zeka uygulayıcıları için üstün ve çok yönlü bir çözüm olarak durmaktadır. Uçtan uca NMS-içermeyen mimarisi, önemli ölçüde daha düşük bellek gereksinimleri, hibrit MuSGD optimize edicisi ve kusursuz bir şekilde yönetilen ekosistemiyle YOLO26, geliştiricilerin en son teknolojiye sahip görü sistemlerini her zamankinden daha hızlı ve güvenilir bir şekilde oluşturmasını ve dağıtmasını sağlar.

Yorumlar