YOLO26 veYOLO: Gerçek Zamanlı Nesne Algılamanın Evrimi
Bilgisayar görüşü alanı, hız ve doğruluk sınırlarını sürekli olarak zorlayan yeni mimarilerle hızla gelişmektedir. Bu zaman çizelgesindeki iki önemli dönüm noktası, 2022 yılının sonlarında Alibaba Group tarafından geliştirilen YOLO ve 2026 Ultralytics tarafından piyasaya sürülen son teknoloji ürünü model YOLO26'dır.
YOLO , YOLO Neural Architecture Search (NAS) gibi yenilikçi kavramlarıYOLO , YOLO26 ise yerel uçtan uca işleme ve kenar öncelikli tasarıma doğru bir paradigma değişikliğini temsil ediyor. Bu ayrıntılı karşılaştırma, geliştiricilerin nesne algılama ihtiyaçları için doğru aracı seçmelerine yardımcı olmak amacıyla bu iki güçlü modelin mimari farklılıklarını, performans ölçütlerini ve dağıtım gerçeklerini inceliyor.
Performans Metrikleri Karşılaştırması
Aşağıdaki tablo, YOLO26 ileYOLO performansını karşılaştırmaktadır. YOLO26 mimarisinin en önemli özelliği olan, özellikle CPU işlemlerdeki önemli çıkarım hızı artışına dikkat edin.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Ultralytics : Yeni Standart
Ultralytics tarafından Ocak 2026'da piyasaya sürülen YOLO26, YOLO11 ve YOLOv8'nin mirasını temel alarak algılama sürecinde radikal değişiklikler getirmiştir. Temel tasarım felsefesi, dağıtım ve eğitimdeki darboğazları ortadan kaldırmaya odaklanarak, hem üst düzey GPU'lar hem de kısıtlı kenar cihazları için en verimli model olmasını sağlamaktadır.
Temel Yenilikler
- Uçtan Uca NMS Tasarım: Önceki nesiller veYOLO gibi rakiplerinden farklı olarak, YOLO26 doğal olarak uçtan uca bir tasarımdır. Non-Maximum Suppression (NMS) son işlemine olan ihtiyacı ortadan kaldırır. Bu, gecikme varyansını azaltır ve dağıtım süreçlerini basitleştirir. Bu çığır açan yaklaşım ilk olarak YOLOv10'de ilk kez ortaya çıkan çığır açan bir yaklaşımdır.
- MuSGD Optimizer: Büyük Dil Modeli (LLM) eğitimindeki son gelişmelerden esinlenerek, YOLO26 SGD Muon'un bir karışımını kullanır. Bu optimizer, eğitim sırasında daha fazla kararlılık ve daha hızlı yakınsama sağlayarak, optimum doğruluğa ulaşmak için gereken hesaplama maliyetini azaltır.
- Edge-First Optimizasyonu: Dağıtım Odak Kaybı (DFL) kaldırıldığında, model mimarisi ONNX CoreML gibi formatlara daha kolay aktarılabilmesi için basitleştirilir. Bu, önceki sürümlerle karşılaştırıldığında CPU hızının %43 oranında artmasına katkıda bulunur ve Raspberry Pi veya cep telefonları gibi cihazlar için ideal hale getirir.
- Geliştirilmiş Küçük Nesne Algılama: ProgLoss ve STAL (Ölçek Duyarlı Eğitim Uyarlanabilir Kayıp) entegrasyonu, tek aşamalı dedektörlerdeki yaygın bir zayıflığı gidererek küçük nesneler üzerinde performansı önemli ölçüde artırır.
Kolaylaştırılmış Dağıtım
YOLO26, NMS ortadan kaldırdığı için, dışa aktarılan modeller karmaşık son işlem kodları içermeyen saf sinir ağlarıdır. Bu, C++ veya mobil ortamlara entegrasyonu önemli ölçüde kolaylaştırır ve mantık hatalarına daha az eğilimli hale getirir.
Kod Örneği
YOLO26 ile kullanıcı deneyimi, sadeleştirilmiş Ultralytics Python ile tutarlı kalır.
from ultralytics import YOLO
# Load the nano model
model = YOLO("yolo26n.pt")
# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)
# Export to ONNX for edge deployment
path = model.export(format="onnx")
YOLO26 hakkında daha fazla bilgi edinin
YOLO: NAS Destekli Meydan Okuyan
Alibaba'nın DAMO Akademisi tarafından geliştirilen YOLO, backbone tasarlamak için Nöral Mimari Arama (NAS) teknolojisini kullanarak 2022 yılında büyük yankı uyandırdı. Yazarlar, ağ yapısını manuel olarak oluşturmak yerine, MAE-NAS (Yardımcı Kenar Yöntemi) kullanarak belirli gecikme kısıtlamaları altında verimli mimarileri otomatik olarak keşfettiler.
Temel Özellikler
- MAE-NAS Backbone: Ağ yapısı, bilgi akışını en üst düzeye çıkarırken hesaplama maliyetini en aza indirmek için matematiksel olarak optimize edildi.
- RepGFPN: Farklı ölçekler arasında özellik birleştirmeyi iyileştirmek için yeniden parametreleştirme kullanan verimli bir Özellik Piramit Ağı.
- ZeroHead: Ağın sonundaki parametre sayısını azaltmayı amaçlayan hafif bir algılama kafası tasarımı.
- AlignedOTA: Modelin, eğitim sırasında hangi bağlantı kutularının gerçek nesnelere karşılık geldiğini daha iyi anlamasına yardımcı olan bir etiket atama stratejisi.
YOLO , zamanına göre mükemmel bir performansYOLO de, daha büyük bir öğretmen modelinin daha küçük öğrenci modelini yönlendirdiği karmaşık damıtma eğitim sürecine dayanması, Ultralytics "sıfırdan eğitim" özelliklerine kıyasla özel eğitimi daha fazla kaynak gerektiren bir hale getiriyor.
Detaylı Karşılaştırma
Mimarlık ve Eğitim İstikrarı
En belirgin fark, optimizasyon yaklaşımında yatmaktadır.YOLO , en iyi yapıyı bulmak için NAS'aYOLO . Bu, teorik olarak yüksek verimli FLOP'lar sağlayabilir, ancak genellikle değiştirilmesi veya hata ayıklaması zor mimarilerle sonuçlanır.
YOLO26 ise, MuSGD Optimizer ile güçlendirilmiş, el yapımı, sezgisel mimari iyileştirmeler (DFL ve NMS başlığın kaldırılması gibi) kullanır. Bu optimizer, LLM'lerde sıklıkla görülen istikrarı bilgisayar görüşüne getirir. Geliştiriciler için bu, YOLO26'nın hiperparametre ayarlamasına daha az duyarlı olduğu ve özel veri kümelerinde güvenilir bir şekilde yakınsama sağladığı anlamına gelir.
Çıkarım Hızı ve Kaynak Verimliliği
YOLO , TensorRT kullanarak GPU YOLO , YOLO26 daha geniş bir yaklaşım benimser. DFL ve NMS kaldırılması, YOLO26'nın CPU'larda üstün performans göstermesini ve öncekilerden %43'e varan hız artışı elde etmesini NMS . Bu, kenar cihazlarının özel GPU'lara sahip olmayabileceği perakende analitiği veya akıllı şehirler gibi uygulamalar için çok önemlidir.
Ayrıca, YOLO26'nın eğitim sırasındaki bellek gereksinimleri genellikle daha düşüktür.YOLO , en iyi sonuçları elde etmek için damıtma içinYOLO ağır bir öğretmen modelinin eğitilmesini gerektirirken, YOLO26 doğrudan SOTA sonuçları elde ederek önemli ölçüde GPU ve elektrikten tasarruf sağlar.
Çok Yönlülük ve Ekosistem
Ultralytics en büyük avantajı çok yönlülüğüdür.YOLO öncelikle bir nesneYOLO . Buna karşın, YOLO26 mimarisi aşağıdakiler dahil olmak üzere çok çeşitli bilgisayar görme görevlerini doğal olarak destekler:
- Örnek Segmentasyonu (özel semantik kayıplarla)
- Poz Tahmini (daha iyi doğruluk için RLE kullanarak)
- Yönlendirilmiş Sınır Kutusu (OBB) (hava görüntülerinde çok önemli)
- Görüntü Sınıflandırması
Bu, tek bir geliştirme ekibinin birden fazla farklı sorun için tek bir API ve tek bir çerçeve kullanmasına olanak tanıyarak teknik borcu önemli ölçüde azaltır.
Karşılaştırma Tablosu: Özellikler
| Özellik | YOLO26 | DAMO-YOLO |
|---|---|---|
| Yayın Tarihi | Ocak 2026 | Kasım 2022 |
| Mimari | Uçtan uca, NMS | NAS tabanlı, Ankarsız |
| Son İşlem | Yok (Model Çıktısı = Nihai) | Non-Maximum Suppression (NMS) |
| Optimize edici | MuSGD (SGD Müon) | SGD AdamW |
| Eğitim Süreci | Tek aşamalı, Sıfırdan eğitim | Karmaşık Damıtma (Öğretmen-Öğrenci) |
| Desteklenen Görevler | detect, segment, Poz, obb, classify | Algılama |
| Uç Optimizasyon | Yüksek (DFL yok, CPU için optimize edilmiş) | Orta (TensorRT ) |
Sonuç
Her iki mimari de nesne algılama tarihinin önemli noktalarını temsil ediyor.YOLO , otomatik mimari arama ve yeniden parametrelendirmenin gücünüYOLO . Ancak YOLO26, pratik AI uygulamasının geleceğini temsil ediyor.
NMS ortadan kaldırarak, MuSGD gibi LLM sınıfı optimize ediciler sunarak ve segmentasyon, poz ve algılama için birleşik bir çözüm sağlayarak, Ultralytics performans ve kullanım kolaylığı arasında üstün bir denge sunar. Endüstriyel otomasyondan mobil uygulamalara kadar gerçek dünya uygulamaları geliştiren geliştiriciler için, sağlam ekosistem, kapsamlı belgeler ve Ultralytics , YOLO26'yı açıkça tavsiye edilen bir seçenek haline getirir.
Diğer karşılaştırmalarla ilgilenenler için, YOLO11 YOLO karşılaştırabilir veya RT-DETR gibi transformatör tabanlı alternatifleri inceleyebilirsiniz. RT-DETRgibi alternatifleri inceleyebilirsiniz.
Yazarlık ve Referanslar
YOLO26
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2026-01-14
- Belgeler:YOLO26 Dokümantasyonu
DAMO-YOLO
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Makale:arXiv:2211.15444