YOLO26 veYOLO: Gerçek Zamanlı Nesne Algılamanın Evrimi

Bilgisayar görüşü alanı, hız ve doğruluk sınırlarını sürekli olarak zorlayan yeni mimarilerle hızla gelişmektedir. Bu zaman çizelgesindeki iki önemli dönüm noktası, 2022 yılının sonlarında Alibaba Group tarafından geliştirilen YOLO ve 2026 Ultralytics tarafından piyasaya sürülen son teknoloji ürünü model YOLO26'dır.

YOLO , YOLO Neural Architecture Search (NAS) gibi yenilikçi kavramlarıYOLO , YOLO26 ise yerel uçtan uca işleme ve kenar öncelikli tasarıma doğru bir paradigma değişikliğini temsil ediyor. Bu ayrıntılı karşılaştırma, geliştiricilerin nesne algılama ihtiyaçları için doğru aracı seçmelerine yardımcı olmak amacıyla bu iki güçlü modelin mimari farklılıklarını, performans ölçütlerini ve dağıtım gerçeklerini inceliyor.

Performans Metrikleri Karşılaştırması

Aşağıdaki tablo, YOLO26 ileYOLO performansını karşılaştırmaktadır. YOLO26 mimarisinin en önemli özelliği olan, özellikle CPU işlemlerdeki önemli çıkarım hızı artışına dikkat edin.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

Ultralytics : Yeni Standart

Ultralytics tarafından Ocak 2026'da piyasaya sürülen YOLO26, YOLO11 ve YOLOv8'nin mirasını temel alarak algılama sürecinde radikal değişiklikler getirmiştir. Temel tasarım felsefesi, dağıtım ve eğitimdeki darboğazları ortadan kaldırmaya odaklanarak, hem üst düzey GPU'lar hem de kısıtlı kenar cihazları için en verimli model olmasını sağlamaktadır.

Temel Yenilikler

Uçtan Uca NMS Tasarım: Önceki nesiller veYOLO gibi rakiplerinden farklı olarak, YOLO26 doğal olarak uçtan uca bir tasarımdır. Non-Maximum Suppression (NMS) son işlemine olan ihtiyacı ortadan kaldırır. Bu, gecikme varyansını azaltır ve dağıtım süreçlerini basitleştirir. Bu çığır açan yaklaşım ilk olarak YOLOv10'de ilk kez ortaya çıkan çığır açan bir yaklaşımdır.
MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitimindeki son gelişmelerden esinlenerek, YOLO26 SGD Muon'un bir karışımını kullanır. Bu optimizer, eğitim sırasında daha fazla kararlılık ve daha hızlı yakınsama sağlayarak, optimum doğruluğa ulaşmak için gereken hesaplama maliyetini azaltır.
Edge-First Optimizasyonu: Dağıtım Odak Kaybı (DFL) kaldırıldığında, model mimarisi ONNX CoreML gibi formatlara daha kolay aktarılabilmesi için basitleştirilir. Bu, önceki sürümlerle karşılaştırıldığında CPU hızının %43 oranında artmasına katkıda bulunur ve Raspberry Pi veya cep telefonları gibi cihazlar için ideal hale getirir.
Geliştirilmiş Küçük Nesne Algılama: ProgLoss ve STAL (Ölçek Duyarlı Eğitim Uyarlanabilir Kayıp) entegrasyonu, tek aşamalı dedektörlerdeki yaygın bir zayıflığı gidererek küçük nesneler üzerinde performansı önemli ölçüde artırır.

Kolaylaştırılmış Dağıtım

YOLO26, NMS ortadan kaldırdığı için, dışa aktarılan modeller karmaşık son işlem kodları içermeyen saf sinir ağlarıdır. Bu, C++ veya mobil ortamlara entegrasyonu önemli ölçüde kolaylaştırır ve mantık hatalarına daha az eğilimli hale getirir.

Kod Örneği

YOLO26 ile kullanıcı deneyimi, sadeleştirilmiş Ultralytics Python ile tutarlı kalır.

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

YOLO26 hakkında daha fazla bilgi edinin

YOLO: NAS Destekli Meydan Okuyan

Alibaba'nın DAMO Akademisi tarafından geliştirilen YOLO, backbone tasarlamak için Nöral Mimari Arama (NAS) teknolojisini kullanarak 2022 yılında büyük yankı uyandırdı. Yazarlar, ağ yapısını manuel olarak oluşturmak yerine, MAE-NAS (Yardımcı Kenar Yöntemi) kullanarak belirli gecikme kısıtlamaları altında verimli mimarileri otomatik olarak keşfettiler.

Temel Özellikler

MAE-NAS Backbone: Ağ yapısı, bilgi akışını en üst düzeye çıkarırken hesaplama maliyetini en aza indirmek için matematiksel olarak optimize edildi.
RepGFPN: Farklı ölçekler arasında özellik birleştirmeyi iyileştirmek için yeniden parametreleştirme kullanan verimli bir Özellik Piramit Ağı.
ZeroHead: Ağın sonundaki parametre sayısını azaltmayı amaçlayan hafif bir algılama kafası tasarımı.
AlignedOTA: Modelin, eğitim sırasında hangi bağlantı kutularının gerçek nesnelere karşılık geldiğini daha iyi anlamasına yardımcı olan bir etiket atama stratejisi.

YOLO , zamanına göre mükemmel bir performansYOLO de, daha büyük bir öğretmen modelinin daha küçük öğrenci modelini yönlendirdiği karmaşık damıtma eğitim sürecine dayanması, Ultralytics "sıfırdan eğitim" özelliklerine kıyasla özel eğitimi daha fazla kaynak gerektiren bir hale getiriyor.

Detaylı Karşılaştırma

Mimarlık ve Eğitim İstikrarı

En belirgin fark, optimizasyon yaklaşımında yatmaktadır.YOLO , en iyi yapıyı bulmak için NAS'aYOLO . Bu, teorik olarak yüksek verimli FLOP'lar sağlayabilir, ancak genellikle değiştirilmesi veya hata ayıklaması zor mimarilerle sonuçlanır.

YOLO26 ise, MuSGD Optimizer ile güçlendirilmiş, el yapımı, sezgisel mimari iyileştirmeler (DFL ve NMS başlığın kaldırılması gibi) kullanır. Bu optimizer, LLM'lerde sıklıkla görülen istikrarı bilgisayar görüşüne getirir. Geliştiriciler için bu, YOLO26'nın hiperparametre ayarlamasına daha az duyarlı olduğu ve özel veri kümelerinde güvenilir bir şekilde yakınsama sağladığı anlamına gelir.

Çıkarım Hızı ve Kaynak Verimliliği

YOLO , TensorRT kullanarak GPU YOLO , YOLO26 daha geniş bir yaklaşım benimser. DFL ve NMS kaldırılması, YOLO26'nın CPU'larda üstün performans göstermesini ve öncekilerden %43'e varan hız artışı elde etmesini NMS . Bu, kenar cihazlarının özel GPU'lara sahip olmayabileceği perakende analitiği veya akıllı şehirler gibi uygulamalar için çok önemlidir.

Ayrıca, YOLO26'nın eğitim sırasındaki bellek gereksinimleri genellikle daha düşüktür.YOLO , en iyi sonuçları elde etmek için damıtma içinYOLO ağır bir öğretmen modelinin eğitilmesini gerektirirken, YOLO26 doğrudan SOTA sonuçları elde ederek önemli ölçüde GPU ve elektrikten tasarruf sağlar.

Çok Yönlülük ve Ekosistem

Ultralytics en büyük avantajı çok yönlülüğüdür.YOLO öncelikle bir nesneYOLO . Buna karşın, YOLO26 mimarisi aşağıdakiler dahil olmak üzere çok çeşitli bilgisayar görme görevlerini doğal olarak destekler:

Örnek Segmentasyonu (özel semantik kayıplarla)
Poz Tahmini (daha iyi doğruluk için RLE kullanarak)
Yönlendirilmiş Sınır Kutusu (OBB) (hava görüntülerinde çok önemli)
Görüntü Sınıflandırması

Bu, tek bir geliştirme ekibinin birden fazla farklı sorun için tek bir API ve tek bir çerçeve kullanmasına olanak tanıyarak teknik borcu önemli ölçüde azaltır.

Karşılaştırma Tablosu: Özellikler

Özellik	YOLO26	DAMO-YOLO
Yayın Tarihi	Ocak 2026	Kasım 2022
Mimari	Uçtan uca, NMS	NAS tabanlı, Ankarsız
Son İşlem	Yok (Model Çıktısı = Nihai)	Non-Maximum Suppression (NMS)
Optimize edici	MuSGD (SGD Müon)	SGD AdamW
Eğitim Süreci	Tek aşamalı, Sıfırdan eğitim	Karmaşık Damıtma (Öğretmen-Öğrenci)
Desteklenen Görevler	detect, segment, Poz, obb, classify	Algılama
Uç Optimizasyon	Yüksek (DFL yok, CPU için optimize edilmiş)	Orta (TensorRT )

Sonuç

Her iki mimari de nesne algılama tarihinin önemli noktalarını temsil ediyor.YOLO , otomatik mimari arama ve yeniden parametrelendirmenin gücünüYOLO . Ancak YOLO26, pratik AI uygulamasının geleceğini temsil ediyor.

NMS ortadan kaldırarak, MuSGD gibi LLM sınıfı optimize ediciler sunarak ve segmentasyon, poz ve algılama için birleşik bir çözüm sağlayarak, Ultralytics performans ve kullanım kolaylığı arasında üstün bir denge sunar. Endüstriyel otomasyondan mobil uygulamalara kadar gerçek dünya uygulamaları geliştiren geliştiriciler için, sağlam ekosistem, kapsamlı belgeler ve Ultralytics , YOLO26'yı açıkça tavsiye edilen bir seçenek haline getirir.

Diğer karşılaştırmalarla ilgilenenler için, YOLO11 YOLO karşılaştırabilir veya RT-DETR gibi transformatör tabanlı alternatifleri inceleyebilirsiniz. RT-DETRgibi alternatifleri inceleyebilirsiniz.

Yazarlık ve Referanslar

YOLO26

Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2026-01-14
Belgeler:YOLO26 Dokümantasyonu

DAMO-YOLO

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Makale:arXiv:2211.15444