Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 ile RTDETRv2 karşılaştırması#

Bilgisayarlı görü alanı hızla genişleyerek geliştiricilere sağlam görü tabanlı uygulamalar oluşturmaları için sayısız seçenek sunuyor. Gerçek zamanlı nesne algılama dünyasında, Evrişimli Sinir Ağları (CNN'ler) ile Vision Transformer'lar (ViT'ler) arasındaki tartışma her zamankinden daha belirgin. Bu teknik karşılaştırma, iki önde gelen mimariyi derinlemesine inceliyor: son derece optimize edilmiş CNN çerçevelerinin zirvesini temsil eden YOLO11 ve Detection Transformer ailesinin güçlü bir yinelemesi olan RTDETRv2.

Bu kılavuz, mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını analiz ederek makine öğrenimi mühendislerinin bilinçli kararlar almasına yardımcı olmayı amaçlıyor. Her iki model de doğruluk sınırlarını zorlasa da, Ultralytics YOLO modelleri genellikle gerçek dünya üretimi için hız, ekosistem desteği ve kullanım kolaylığı açısından üstün bir denge sunar.

Link to this sectionYOLO11: Gerçek Dünya Çok Yönlülüğü için Kıyaslama#

Ultralytics tarafından sunulan YOLO11, hızlı, doğru ve inanılmaz derecede çok yönlü bir model sunmak için yılların temel araştırmalarının üzerine inşa edilmiştir. Nesne algılama, örnek segmentasyonu, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) çıkarma işlemlerini yerel olarak sorunsuz bir şekilde gerçekleştirmek üzere tasarlanmıştır.

YOLO11 hakkında daha fazla bilgi edinin

Link to this sectionMimari ve Güçlü Yönler#

YOLO11, geliştirilmiş bir CNN omurgasına ve gelişmiş uzamsal özellik piramitlerine sahiptir, bu da onu son derece kaynak verimli kılar. Hem eğitim hem de çıkarım sırasında minimum bellek ayak izi sunarak, katı donanım kısıtlamalarına sahip ortamlarda başarıyla çalışır. Ultralytics Platform, YOLO11 için yerel destek sağlayarak farklı MLOps araçlarını bir araya getirme gereksinimi olmadan model izlemeyi, veri etiketlemeyi ve bulut eğitimini kolaylaştırır.

Uç bilişimi hedefleyen geliştiriciler için YOLO11, ultra düşük gecikme süresi sunar. Hafif yapısı, Raspberry Pi'lerden tüketici sınıfı cep telefonlarına kadar çeşitli cihazlarda verimli bir şekilde çalışmasını sağlar ve bu da onu akıllı perakende, üretim kalite kontrolü ve otomatik trafik yönetimi için bir standart haline getirir.

Link to this sectionRTDETRv2: Baidu'dan Gerçek Zamanlı Transformer'lar#

RTDETRv2 (Gerçek Zamanlı Detection Transformer sürüm 2), Baidu'nun transformatör tabanlı mimarileri gerçek zamanlı görevler için uygulanabilir hale getirme çabasını temsil eder. Orijinal RT-DETR üzerine inşa edilerek, çıkarım gecikmesini artırmadan temel doğruluğu iyileştirmek için bir "bag-of-freebies" yaklaşımını bünyesine katar.

RTDETR hakkında daha fazla bilgi edinin

Link to this sectionMimari ve Güçlü Yönler#

Geleneksel CNN'lerin aksine RTDETRv2, kendi kendine dikkat mekanizmalarına sahip bir kodlayıcı-kod çözücü mimarisi kullanarak bir görüntüdeki küresel bağlamı yakalamasına olanak tanır. Bu, özellikle örtüşmelerin sık görüldüğü kalabalık sahnelerde avantajlıdır. RTDETRv2, işlem sonrası NMS (Non-Maximum Suppression) ihtiyacını ortadan kaldırır ve bunun yerine bire bir iki parçalı eşleştirme için eğitim sırasında Macar eşleştirmesine dayanır.

Ancak transformatör modelleri, VRAM ve CUDA belleği konusunda açgözlülükleriyle bilinir. RTDETRv2'yi sıfırdan eğitmek veya özel veri kümelerinde ince ayar yapmak genellikle önemli ölçüde üst düzey GPU kümeleri gerektirir; bu da Ultralytics modellerinin hafif eğitim ayak izine kıyasla daha küçük ve çevik ekipler için bir engel teşkil edebilir.

Link to this sectionPerformans ve Metrik Analizi#

Bu modelleri standart COCO veri kümesinde değerlendirirken, parametreler, FLOP'lar ve ham doğruluk arasında net ödünleşimler gözlemliyoruz.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

Link to this sectionSonuçların İncelenmesi#

Tabloda görüldüğü gibi, YOLO11 inanılmaz bir performans/boyut oranı sağlar. YOLO11x, önemli ölçüde daha az parametre (56,9M'ye karşı 76M) ve çok daha az hesaplama FLOP'u (194,9B'ye karşı 259B) kullanırken RTDETRv2-x'e (54,3) kıyasla daha yüksek bir mAPval (54,7) elde eder.

Dahası, YOLO11'in T4 TensorRT üzerindeki çıkarım hızları son derece yüksektir. YOLO11s çıkarımı sadece 2,5ms'de tamamlarken, en küçük RTDETRv2-s 5,03ms sürer. Bu, YOLO11'i kare işleme süresinin temel darboğaz olduğu yüksek hızlı, gerçek zamanlı video analitiği akışları için kesin tercih haline getirir.

Transformatörlerin Maliyeti

RTDETRv2, dikkat katmanları aracılığıyla mükemmel doğruluk sağlasa da, bu mekanizmalar görüntü çözünürlüğü ile karesel olarak ölçeklenir ve hem eğitim hem de çıkarım sırasında daha yüksek VRAM tüketimine yol açar. YOLO11, hiper verimli evrişimli bloklarıyla bunun önüne geçer.

Link to this sectionEğitim Ekosistemi ve Kullanılabilirlik#

Bir Ultralytics modeli benimsemenin temel avantajı, çevresindeki ekosistemde yatar. RTDETRv2'yi eğitmek genellikle karmaşık araştırma düzeyi depolar arasında gezinmeyi, karmaşık iki parçalı eşleştirme kaybı ağırlıklarını ayarlamayı ve önemli bellek yükünü yönetmeyi gerektirir.

Conversely, Ultralytics focuses heavily on developer experience. The unified Python API abstracts away boilerplate code, integrating seamlessly with tools like Weights & Biases for experiment tracking, and handling data augmentations automatically.

İşte ultralytics paketini kullanarak bir modeli eğitmenin ve dışa aktarmanın ne kadar kolay olduğu:

from ultralytics import YOLO

# Initialize YOLO11 model with pre-trained weights
model = YOLO("yolo11n.pt")

# Train the model efficiently on a local GPU or cloud instance
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Utilize CUDA GPU
)

# Export the trained model to ONNX for widespread deployment
export_path = model.export(format="onnx")

Eğitildikten sonra bir YOLO11 modelini ONNX, OpenVINO veya CoreML gibi biçimlere aktarmak yalnızca tek bir komut gerektirir ve görü hattınızın farklı donanım arka uçlarında zahmetsizce ölçeklenebilmesini sağlar.

Çoklu Görev Yetenekleri

RTDETRv2'nin yalnızca sınırlayıcı kutu algılamasına odaklandığını, ancak YOLO11 mimarisinin yerel olarak poz tahmini ve örnek segmentasyonunu desteklediğini ve böylece birden fazla görü görevini tek bir model ailesinde birleştirmenize olanak tanıdığını unutma.

Link to this sectionKullanım Durumları ve Öneriler#

YOLO11 ile RT-DETR arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionYOLO11 Ne Zaman Seçilmeli#

YOLO11 şunlar için güçlü bir tercihtir:

  • Üretim Uç Dağıtımı: Güvenilirliğin ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
  • Çok Görevli Görüntü Uygulamaları: Tek bir birleşik çerçeve içinde algılama, segmentasyon, pose estimation ve OBB gerektiren projeler.
  • Hızlı Prototipleme ve Dağıtım: Veri toplamadan üretime kadar olan süreci, kolaylaştırılmış Ultralytics Python API kullanarak hızla ilerletmesi gereken ekipler.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionGeleceğe Bakış: YOLO26'nın Gücü#

YOLO11 mükemmel bir üretim seçeneği olsa da, mutlak en son teknolojiyi arayan ekipler YOLO26 seçeneğini ciddi şekilde değerlendirmelidir. Ocak 2026'da piyasaya sürülen YOLO26, ilk olarak YOLOv10'da öncülük edilen bir Uçtan Uca NMS'siz Tasarım'ı doğrudan çekirdeğine dahil ederek mimari boşluğu kapatır ve işlem sonrası gecikmeyi ve dağıtım mantığı karmaşıklığını tamamen ortadan kaldırır.

YOLO26 ayrıca birkaç devrim niteliğinde özellik sunar:

  • MuSGD Optimize Edici: Moonshot AI'ın Kimi K2'sinin LLM eğitim tekniklerinden esinlenen bu SGD ve Muon melezi, inanılmaz derecede kararlı eğitim ve önemli ölçüde daha hızlı yakınsama sağlar.
  • DFL Kaldırma: Dağılım Odaklı Kayıp (Distribution Focal Loss), daha temiz ve basitleştirilmiş bir dışa aktarma süreci için kaldırılmış olup, düşük güçlü uç cihaz uyumluluğunu büyük ölçüde iyileştirmiştir.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, drone gözetimi, tarımsal izleme ve IoT uç sensörleri için kritik bir gereksinim olan küçük nesne tanımada kayda değer iyileştirmeler sağlar.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU'lara sahip olmayan dağıtımlar için YOLO26, CPU yürütme için özel olarak optimize edilmiş olup önceki nesillerden çok daha üstün performans gösterir.

YOLO26 hakkında daha fazla bilgi edin

Daha geniş bir mimari yelpazesini keşfetmek isteyenler için Ultralytics dokümantasyonu, yaygın olarak benimsenen YOLOv8, YOLOv5 ve açık kelime dağarcıklı algılama uygulamaları için YOLO-World gibi özel modeller hakkında bilgiler sağlar. Sonuç olarak, ister YOLO11'in kanıtlanmış kararlılığına ister YOLO26'nın çığır açan yeniliklerine öncelik verin, Ultralytics ekosistemi bilgisayarlı görü çözümlerinizi hayata geçirmeniz için benzersiz araçlar sunar.

Yorumlar