Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 ve RTDETRv2#

Bilgisayarlı görü dünyası sürekli gelişmekte ve uygulayıcılara kritik bir seçim sunmaktadır: son derece optimize edilmiş Evrişimli Sinir Ağlarını (CNN'ler) mı kullanmalısın yoksa daha yeni olan Transformer tabanlı mimarileri mi benimsemelisin? Bu alandaki iki önemli aday, en gelişmiş Ultralytics YOLO26 ve Baidu'nun RTDETRv2 modelidir. Her iki model de gerçek zamanlı nesne algılamanın sınırlarını zorlamakta ancak temel olarak farklı mimari felsefelere dayanmaktadır.

Bu kılavuz, bir sonraki bilgisayarlı görü projen için en iyi temeli seçmene yardımcı olmak adına her iki modele derinlemesine teknik bir bakış sunar, yapılarını, performans metriklerini ve ideal kullanım senaryolarını karşılaştırır.

Link to this sectionUltralytics YOLO26: Uç Birim Öncelikli Görü Yapay Zekasının Zirvesi#

Ultralytics tarafından geliştirilen YOLO26, YOLO ailesi için devasa bir nesil atlamasını temsil ediyor. Ocak 2026'da piyasaya sürülen model; hız, doğruluk ve hem bulut hem de uç (edge) ortamlarda sorunsuz dağıtım için özel olarak tasarlandı.

Link to this sectionMimari Yenilikler ve Güçlü Yönler#

YOLO26, onu sadece Transformer modellerinden değil, aynı zamanda YOLO11 gibi önceki yinelemelerden de ayıran birkaç çığır açan özellik sunar:

  • Uçtan Uca NMS'siz Tasarım: YOLO26, son işlem sırasında geleneksel NMS (Non-Maximum Suppression) ihtiyacını ortadan kaldırır. YOLOv10 gibi modellerde öncülük edilen bu tamamen uçtan uca yaklaşım, çıkarım gecikmesi değişkenliğini azaltır ve özellikle uç donanımlarda dağıtım mantığını basitleştirir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Merkezi olmayan yapay zekaya yönelik artan ihtiyacın farkında olan YOLO26, Raspberry Pi gibi özel GPU'lardan yoksun cihazlar için yüksek düzeyde optimize edilmiştir.
  • DFL Kaldırılması: Distribution Focal Loss (DFL) özelliğinin çıkarılmasıyla YOLO26, basitleştirilmiş bir dışa aktarma süreci sunar ve düşük güçlü uç cihazlar ve mikrodenetleyicilerle uyumluluğu önemli ölçüde artırır.
  • MuSGD Optimize Edici: Büyük Dil Modeli (LLM) eğitimi ile bilgisayarlı görü arasındaki boşluğu dolduran YOLO26, MuSGD optimize edicisini kullanır. Moonshot AI'ın Kimi K2 modelinden esinlenen bu SGD ve Muon melezi, sağlam bir eğitim kararlılığı ve daha hızlı yakınsama sağlar.
  • ProgLoss + STAL: Gelişmiş kayıp fonksiyonları, küçük nesne tanımada dikkat çekici iyileştirmeler getirir. Bu durum, hava görüntü analizi ve Nesnelerin İnterneti (IoT) sensörlerine güvenen endüstriler için kritiktir.

YOLO26 hakkında daha fazla bilgi edin

Link to this sectionGörü Görevlerinde Çok Yönlülük#

YOLO26, yalnızca sınırlayıcı kutularla sınırlı modellerin aksine, çok yönlü bir güç merkezidir. Örnek bölümleme için anlamsal segmentasyon kaybı ve çok ölçekli proto, poz tahmini için Residual Log-Likelihood Estimation (RLE) ve Yönelimli Sınırlayıcı Kutu (OBB) görevlerindeki sınır sorunlarını çözmek için özel açı kaybı gibi göreve özel iyileştirmeler içerir.

Uç Dağıtım Stratejisi

Uç cihazlara dağıtım yaparken YOLO26n (Nano) veya YOLO26s (Small) varyantlarını kullanmalısın. Bu modelleri CoreML veya TFLite formatına aktarmak, DFL'nin kaldırılması ve NMS'siz mimari sayesinde sorunsuzdur ve iOS ile Android üzerinde gerçek zamanlı performansı garanti eder.

Link to this sectionRTDETRv2: Gerçek Zamanlı Algılama Transformer'larını Geliştirme#

Baidu araştırmacıları tarafından geliştirilen RTDETRv2, orijinal RT-DETR çerçevesi üzerine inşa edilmiştir. Algılama Transformer'larının (DETR'ler), gerçek zamanlı senaryolarda oldukça optimize edilmiş CNN'lerin hızı ve doğruluğu ile rekabet edebileceğini ve bazen bunları aşabileceğini kanıtlamayı amaçlar.

Link to this sectionMimari ve Yetenekler#

RTDETRv2, görüntüleri küresel bağlamı anlamak için öz-dikkat mekanizmalarından yararlanarak CNN'lerden doğal olarak farklı şekilde işleyen Transformer tabanlı bir mimari kullanır.

  • Bag-of-Freebies: v2 yinelemesi, çıkarım maliyetini artırmadan temel performansı iyileştiren bir dizi optimize edilmiş eğitim tekniği (bag-of-freebies) sunar.
  • Küresel Bağlam Farkındalığı: Transformer dikkat katmanları sayesinde RTDETRv2, örtüşen veya gizlenmiş nesneleri ayırt etmek için küresel bağlamın gerekli olduğu karmaşık sahneleri anlamada doğal olarak yeteneklidir.

RTDETR hakkında daha fazla bilgi edinin

Link to this sectionTransformer Modellerinin Sınırlamaları#

Güçlü olsalar da, RTDETRv2 gibi Transformer tabanlı algılama modelleri genellikle pratik dağıtımda zorluklarla karşılaşır. Verimli CNN'lere kıyasla eğitim sırasında genellikle daha yüksek CUDA bellek gereksinimleri sergilerler. Ayrıca, dikkat katmanlarının gerektirdiği karmaşık işlemler nedeniyle bunları çeşitli uç ortamlara entegre etmek hantal olabilir, bu da YOLO26 gibi modelleri kaynak kısıtlı dağıtımlar için çok daha çekici hale getirir.

Link to this sectionPerformans Karşılaştırması#

Bu modelleri karşılaştırmalı olarak değerlendirmek, en son CNN optimizasyonlarının somut faydalarını ortaya koyuyor. Aşağıdaki tablo, standart kriterler üzerindeki performanslarını özetlemektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

Görüldüğü üzere, YOLO26 tüm boyut varyantlarında RTDETRv2'den sürekli olarak daha iyi performans göstermektedir. YOLO26x, RTDETRv2-x'e (54.3 mAP, 15.03 ms, 76M parametre) kıyasla daha düşük gecikme (TensorRT üzerinde 11.8 ms) ve önemli ölçüde daha az parametre (55.7M) ile 57.5 mAP gibi dikkate değer bir sonuç elde eder.

Link to this sectionKullanım Durumları ve Öneriler#

YOLO26 ve RT-DETR arasında seçim yapmak; projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionNe Zaman YOLO26 Seçilmeli#

YOLO26 şunlar için güçlü bir tercihtir:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionUltralytics Avantajı#

Doğru makine öğrenimi mimarisini seçmek denklemin sadece bir parçasıdır; çevredeki ekosistem, bir ekibin prototiplemeden üretime ne kadar hızlı geçebileceğini belirler.

Link to this sectionKullanım Kolaylığı ve Eğitim Verimliliği#

Ultralytics Python API oldukça modern ve akıcı bir deneyim sunar. Karmaşık modelleri eğitmek artık uzun, standart kodlar gerektirmez. Dahası, YOLO26'nın eğitim verimliliği önemli ölçüde daha iyidir ve RTDETRv2'nin bellek yoğun dikkat mekanizmalarından çok daha az GPU VRAM'i kullanır, bu da tüketici sınıfı donanımlarda bile daha büyük yığın boyutlarına izin verir.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Execute high-speed, NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for seamless deployment
model.export(format="onnx")

Link to this sectionİyi Bakılan Bir Ekosistem#

Geliştiriciler, Ultralytics modellerini kullanarak Weights & Biases ve Comet ML gibi modern izleme araçlarıyla yerel olarak entegre olan, aktif olarak bakımı yapılan bir çerçeveye erişim sağlarlar. Kodsuz bir yaklaşımı tercih edenler için Ultralytics Platform; bulut tabanlı eğitim, veri seti yönetimi ve tek tıkla dağıtım imkanı sunar.

Link to this sectionPerformans Dengesi#

YOLO26, çıkarım hızı ve doğruluk arasında benzersiz bir denge kurar. NMS'nin kaldırılması ve MuSGD optimize edicisi ile birleştiğinde, hem küçük nesnelerde oldukça doğru (ProgLoss + STAL sayesinde) hem de üretimde son derece hızlı çalışan bir modeli dağıtmanı sağlar, bu da onu günümüzün neredeyse tüm bilgisayarlı görü uygulamaları için üstün bir seçim haline getirir.

Link to this sectionEkosistemdeki Diğer Modeller#

YOLO26 ve RTDETRv2 gerçek zamanlı algılamanın en ileri noktasını kapsasa da, eski hatların bakımını yapan veya farklı verimlilik eğrilerini keşfeden geliştiriciler, yerleşik kurumsal ortamlar için YOLOv8 modelini veya EfficientDet gibi diğer mimarileri değerlendirebilirler. Ancak, yeni bir girişim için YOLO26 kesin tavsiyemizdir.

Katkıda Bulunanlar

Yorumlar