Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 ve RTDETRv2#

Bilgisayarlı görü dünyası, gerçek zamanlı nesne tespiti alanındaki en son teknolojiyi sürekli olarak yeniden tanımlayan yeni mimarilerle baş döndürücü bir hızla ilerliyor. Bu evrimdeki iki önemli dönüm noktası YOLOv10 ve RTDETRv2'dir. Her iki model de geleneksel tespit hatlarındaki temel bir darboğazı, yani NMS (Non-Maximum Suppression) son işleme ihtiyacını ortadan kaldırarak çözmeyi hedefliyor, ancak bu zorluğa tamamen farklı mimari yaklaşımlarla yaklaşıyorlar.

Bu teknik karşılaştırma, geliştiricilerin ve araştırmacıların bir sonraki görü yapay zekası projeleri için doğru aracı seçmelerine yardımcı olmak amacıyla mimarileri, eğitim metodolojileri ve ideal dağıtım senaryoları hakkında derinlemesine bir analiz sunar.

Link to this sectionYOLOv10: NMS-Free Öncüsü#

Tsinghua Üniversitesi'ndeki araştırmacılar tarafından geliştirilen YOLOv10, mimari verimliliğe ve son işleme darboğazlarının kaldırılmasına odaklanıyor. NMS içermeyen eğitim için tutarlı ikili atamalar getirerek, çıkarım gecikmesini önemli ölçüde düşürürken rekabetçi bir performans elde ediyor.

Link to this sectionTeknik Özellikler#

Link to this sectionMimari ve Metodolojiler#

YOLOv10'un birincil atılımı, bütünsel verimlilik ve doğruluk odaklı model tasarımıdır. Çeşitli bileşenleri her iki perspektiften de optimize ederek hesaplama yükünü büyük ölçüde azaltır. Tutarlı ikili atama stratejisi, modelin NMS'ye güvenmeden eğitilmesini sağlar ve bu da sadeleştirilmiş, uçtan uca bir dağıtım hattına dönüşür. Bu, modelleri ONNX veya TensorRT gibi uç cihaz formatlarına aktarırken, son işleme operasyonlarının beklenmedik gecikmelere yol açabileceği durumlarda özellikle faydalıdır.

Link to this sectionGüçlü ve Zayıf Yönler#

Model, özellikle küçük varyantlarda (N ve S) olağanüstü hız-doğruluk dengelerine sahiptir. Minimum gecikme süresi, onu yüksek hızlı uç ortamlar için ideal kılar. Bununla birlikte, YOLOv10 saf tespit hızında mükemmel olsa da, yalnızca tespite yönelik özel bir model olarak kalmaktadır. Örnek segmentasyonu veya poz tahmini gerektiren ekiplerin daha çok yönlü çerçevelere yönelmeleri gerekecektir.

YOLOv10 hakkında daha fazla bilgi edin

Link to this sectionRTDETRv2: Detection Transformer'ı Geliştirmek#

Orijinal Real-Time Detection Transformer üzerine inşa edilen RTDETRv2, temelini geliştirmek için bir "bag of freebies" (ücretsiz araçlar bütünü) içerir ve transformer'ların gerçek zamanlı senaryolarda CNN'lerle rekabet edebileceğini gösterir.

Link to this sectionTeknik Özellikler#

Link to this sectionMimari ve Metodolojiler#

RTDETRv2, görsel özellik çıkarımı için bir Evrişimli Sinir Ağı (CNN) backbone yapısını, kapsamlı sahne anlayışı için bir Transformer encoder-decoder ile birleştiren hibrit bir mimari kullanır. Transformer'ın self-attention mekanizması, modelin görüntüyü küresel olarak görmesini sağlayarak karmaşık sahneleri, örtüşen nesneleri ve yoğun kalabalıkları yönetmede oldukça etkili olmasını sağlar.

Link to this sectionGüçlü ve Zayıf Yönler#

Transformer mimarisi, özellikle daha büyük parametre ölçeklerinde mükemmel doğruluk sağlar ve nihai tespitleri NMS olmadan yerel olarak verir. Ancak bu bir maliyetle gelir. Transformer modelleri geleneksel olarak eğitim sırasında önemli ölçüde daha fazla CUDA belleği gerektirir ve saf CNN mimarilerine kıyasla yakınsaması daha yavaş olabilir. RTDETRv2 çıkarım hızlarını iyileştirmiş olsa da, genellikle hafif YOLO varyantlarından daha fazla bellek tüketir.

RTDETRv2 hakkında daha fazla bilgi edin

Link to this sectionPerformans Karşılaştırması#

Performans metriklerini değerlendirmek, her bir modelin nerede öne çıktığına dair daha net bir resim sunar. Aşağıdaki tablo, COCO veri setindeki yeteneklerini vurgulamaktadır:

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

Verileri analiz ederken, YOLOv10 karşılaştırılabilir boyutlarda parametre verimliliği ve TensorRT çıkarım hızında kesin bir üstünlüğü koruyor. RTDETRv2-x, doğruluk açısından devasa YOLOv10x ile eşleşiyor ancak yaklaşık 20 milyon daha fazla parametre ve önemli ölçüde daha yüksek FLOP gerektiriyor.

Link to this sectionKullanım Durumları ve Öneriler#

YOLOv10 ve RT-DETR arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.

Link to this sectionNe Zaman YOLOv10 Seçilmeli#

YOLOv10 şunlar için güçlü bir seçimdir:

  • NMS'siz Gerçek Zamanlı Tespit: Non-Maximum Suppression (NMS) olmadan uçtan uca tespitten yararlanan ve dağıtım karmaşıklığını azaltan uygulamalar.
  • Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile tespit doğruluğu arasında güçlü bir denge gerektiren projeler.
  • Tutarlı Gecikme Süreli Uygulamalar: robotik veya otonom sistemler gibi öngörülebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları.

Link to this sectionRT-DETR Ne Zaman Seçilmeli#

RT-DETR şunlar için önerilir:

  • Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
  • Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
  • Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.

Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#

Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Link to this sectionUltralytics Avantajı: Ekosistem ve İnovasyon#

YOLOv10 ve RTDETRv2 sağlam tespit yetenekleri sunsa da, bir model seçmek genellikle çevresindeki yazılım ekosistemi ile ilgilidir. Ultralytics Platform, derin öğrenmenin karmaşıklıklarını soyutlayan sorunsuz ve birleşik bir arayüz sağlar.

Link to this sectionYeni Standart: Ultralytics YOLO26#

Mutlak en iyi performansı arayan geliştiriciler için Ultralytics YOLO26, son mimari gelişmelerin zirvesini temsil eder. 2026'nın başlarında piyasaya sürülen YOLO26, YOLOv10 tarafından öncülük edilen Uçtan Uca NMS-Free Tasarımı devralarak, daha hızlı ve daha basit bir dağıtım için NMS son işlemesini tamamen ortadan kaldırır.

Neden YOLO26 Seçmelisin?

YOLO26, MuSGD Optimizer (SGD ve Muon'un bir melezi) aracılığıyla LLM eğitim yeniliklerini bilgisayarlı görü alanına getirir; bu da daha kararlı bir eğitim ve daha hızlı yakınsama sağlar. Ayrıca %43'e kadar Daha Hızlı CPU Çıkarımı ile övünür ve bu da onu uç bilişim için birinci tercih haline getirir.

Ayrıca YOLO26, küçük nesne tanımada kayda değer iyileştirmeler için ProgLoss + STAL teknolojisini sunar ve özel YOLOv10'un aksine, aşırı çok yönlülük sunar. Nesne tespiti, segmentasyon, poz ve yönlendirilmiş sınırlayıcı kutular (OBB) işlemlerini, anlamsal segmentasyon kaybı ve poz için Residual Log-Likelihood Estimation (RLE) gibi görev spesifik iyileştirmelerle yerel olarak destekler. Dahası, Distribution Focal Loss (DFL) bileşeninin kaldırılması, basitleştirilmiş dışa aktarım ve daha iyi düşük güçlü cihaz uyumluluğu sağlar.

YOLO26 hakkında daha fazla bilgi edin

Link to this sectionKullanım Kolaylığı ve Eğitim Verimliliği#

Ultralytics YOLO11 gibi eski nesil modellerle veya en yeni YOLO26 ile denemeler yapıyor olsan, modern Python API, eğitim sırasında daha düşük bellek kullanımı ve son derece hızlı iş akışları sağlar.

from ultralytics import RTDETR, YOLO

# Train the end-to-end YOLOv10 model
model_yolo = YOLO("yolov10n.pt")
model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Alternatively, evaluate RTDETR within the same API
model_rtdetr = RTDETR("rtdetr-l.pt")
results = model_rtdetr.predict("https://ultralytics.com/images/bus.jpg")

İyi bakılan ekosistem, hiperparametre ayarlama için araçlar sağlar ve kapsamlı takip çözümleri ile model dağıtım seçenekleri ile kusursuz bir şekilde entegre olur.

Link to this sectionSonuç#

Hem YOLOv10 hem de RTDETRv2, NMS içermeyen nesne tespiti arayışında zorlu dönüm noktalarını temsil eder. RTDETRv2, transformer'ların daha yüksek bellek gereksinimlerine rağmen mükemmel küresel bağlam kavrayışıyla gerçek zamanlı gecikme süresine ulaşabileceğini kanıtlıyor. YOLOv10, kaynak kısıtlı tespit görevleri için özel olarak tasarlanmış, oldukça verimli ve hızlı bir CNN alternatifi sunar.

Ancak dengeli bir performans, çok görevli çok yönlülük ve en olgun ekosistem için geliştiricilerin Ultralytics YOLO26'dan yararlanmaları şiddetle tavsiye edilir. Bu model, seleflerinin mimari yeniliklerini, görüntü yapay zekasını dağıtmayı sorunsuz bir gerçekliğe dönüştüren sağlam ve kullanıcı dostu araçlarla mükemmel bir şekilde birleştirir.

Yorumlar