Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 ve RTDETRv2: Gerçek Zamanlı Nesne Tespiti için Teknik Bir Karşılaştırma#

Bilgisayarlı görü dünyası, Evrişimli Sinir Ağları (CNN'ler) ve Görsel Transformerlar (ViT'ler) arasındaki rekabetin etkisiyle hızla gelişmeye devam ediyor. Bu teknik karşılaştırma, iki ağır siklet mimariyi derinlemesine inceliyor: oldukça optimize edilmiş bir CNN tabanlı nesne tespit modeli olan YOLOv7 ve son teknoloji bir Gerçek Zamanlı Tespit Transformer'ı olan RTDETRv2.

Mimari farklılıklarını, performans metriklerini ve ideal dağıtım senaryolarını analiz ederek, bu yapay zeka modellerini üretim hatlarına entegre ederken bilinçli kararlar alabilirsin.

Link to this sectionYOLOv7: Bag-of-Freebies CNN Mimarisi#

YOLOv7, geleneksel YOLO ailesine paradigma değiştiren birçok yapısal optimizasyon getirerek, bir dizi "eğitilebilir bedava özellikler (trainable bag-of-freebies)" ile gerçek zamanlı nesne tespitinin sınırlarını zorladı.

Temel Özellikler: Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
Kurum: Institute of Information Science, Academia Sinica
Tarih: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: WongKinYiu/yolov7

Link to this sectionMimari ve Güçlü Yönler#

YOLOv7, başarısını Genişletilmiş Verimli Katman Birleştirme Ağı (E-ELAN) mimarisine borçludur. Bu yapısal tasarım, modelin orijinal gradyan yolunu bozmadan daha çeşitli özellikleri öğrenmesini sağlar. Ayrıca, doğruluğu düşürmeden çıkarım hızını optimize eden planlanmış yeniden parametrelendirilmiş evrişimleri içerir. Eğitilebilir bedava özellikler yaklaşımı, hız ve doğruluk arasında etkileyici dengeler kurmasını sağlayarak sunucu sınıfı GPU'larda gerçek zamanlı nesne tespiti görevleri için son derece uygun hale getirir.

YOLOv7 aynı zamanda oldukça çok yönlüdür. Standart sınırlayıcı kutu tespitinin ötesinde, depo poz tahmini ve örnek bölümleme için branşlar sunarak uyarlanabilirliğini kanıtlar.

Link to this sectionSınırlamalar#

Birçok eski CNN modeli gibi, YOLOv7 de son işleme (post-processing) için Maksimum Olmayan Baskılama (NMS) yöntemine güvenir. NMS, özellikle kalabalık sahnelerde değişken gecikme süreleri ortaya çıkarır; bu durum, uç cihazlarda katı gerçek zamanlı garantileri zorlaştırabilir.

YOLOv7 hakkında daha fazla bilgi edinin

Link to this sectionRTDETRv2: Gerçek Zamanlı Transformerların İlerletilmesi#

RTDETRv2, orijinal RT-DETR çerçevesi üzerine inşa edilerek, transformerların gerçek zamanlı gecikme sürelerinde YOLO mimarileriyle rekabet edebileceğini ve aynı zamanda yüksek uzamsal doğruluğu koruyabildiğini daha da kanıtlar.

Temel Özellikler: Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang, Yi Liu
Kurum: Baidu
Tarih: 2024-07-24
Arxiv: https://arxiv.org/abs/2407.17140
GitHub: lyuwenyu/RT-DETR

Link to this sectionMimari ve Güçlü Yönler#

RTDETRv2, Görsel Transformerlar için önemli bir adım ileriye işaret eder. Esnek bir sorgu seçme süreci ve çok ölçekli özellikleri hızla işlemek için verimli bir hibrit kodlayıcı kullanır. Özellikle Tespit Transformerları (DETR'ler) için özel olarak hazırlanmış yeni bir "bedava özellikler" seti sunarak, uzamsal akıl yürütmeyi sınırlarına kadar zorlar. Doğal olarak NMS-free (NMS içermeyen) yapısı sayesinde, zorlu akıllı şehir uygulamaları ve otonom sürüş için kritik bir özellik olan deterministik çıkarım süreleri sağlar.

Link to this sectionSınırlamalar#

Gelişmelerine rağmen, RTDETRv2 transformer tabanlı mimarilerin geleneksel yüklerini taşır. Hem eğitim hem de çıkarım sırasında CNN'lere kıyasla önemli ölçüde daha yüksek CUDA belleği talep eder. Ayrıca, eğitim yakınsama süreleri belirgin şekilde daha uzundur ve çok miktarda yüksek kaliteli etiketlenmiş veri (COCO veri seti gibi) ile ağır hesaplama kaynakları gerektirir.

RTDETRv2 hakkında daha fazla bilgi edin

Link to this sectionPerformans Karşılaştırması#

Bu modelleri kıyaslarken hassasiyeti, ham çıkarım hızını ve hesaplama ayak izini kapsayan bütünsel bir resme bakmalıyız. Aşağıda doğrudan bir karşılaştırma tablosu yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
Kıyaslamaları Yorumlama

RTDETRv2-x, %54.3 ile mutlak en yüksek mAPval değerini talep etse de, devasa 259 milyar FLOP gerektirir. Buna karşılık, YOLOv7 mimarileri mükemmel bir temel sağlar ancak saf ağ gecikme metriklerinde tam olarak yakalanamayan eski NMS yükü sorunundan muzdariptir.

Link to this sectionUltralytics Avantajı: Ekosistem ve Evrim#

YOLOv7 ve RTDETRv2 güçlü özellikler sunsa da, bunları üretim ortamlarında dağıtmak genellikle lojistik sürtünmeleri ortaya çıkarır. İşte Ultralytics ekosistemi tam bu noktada öne çıkar. Kesintisiz uçtan uca entegrasyon için tasarlanan Ultralytics çerçevesi, geliştiricilere bilgisayarlı görü hatlarının tipik karmaşıklıklarını soyutlayan birleşik bir API sunar.

Link to this sectionBenzersiz Çok Yönlülük ve Bellek Verimliliği#

Devasa miktarda VRAM tüketen katı transformer modellerinin aksine, Ultralytics YOLO modelleri sıkı bir bellek verimliliğini korur. Bu, erişilebilir donanımlar üzerinde hızlı model eğitimi yapılmasını sağlar. Ekosistem, tek bir kod tabanından görüntü sınıflandırma ve yönlendirilmiş sınırlayıcı kutu (OBB) tespiti dahil olmak üzere birçok bilgisayarlı görü görevini destekleyerek RTDETRv2'nin şu anda eksik olduğu bir esneklik sunar.

Link to this sectionKesintisiz Dağıtım#

Araştırmadan üretime geçiş, sağlam dağıtım seçenekleri gerektirir. Ultralytics API, endüstri standardı formatlara tek tıkla model dışa aktarmayı doğal olarak yönetir. İster platformlar arası uyumluluk için ONNX, ister maksimum GPU hızlandırması için TensorRT hedefliyor ol, süreç tamamen otomatik ve güvenilirdir.

Link to this sectionNihai Yükseltme: Ultralytics YOLO26#

YOLOv7 ve RTDETRv2 arasında kararsız kalan geliştiriciler için en iyi yol aslında yapay görmedeki yeni standarttır: Ultralytics YOLO26. Ocak 2026'da piyasaya sürülen YOLO26, CNN'lerin hızı ile transformerların gelişmiş akıl yürütme yeteneği arasındaki boşluğu doldururken, her ikisinin zayıf yönlerini tamamen ortadan kaldırır.

YOLO26 hakkında daha fazla bilgi edin

YOLO26, hem sunucu hem de uç cihaz dağıtımları için özel olarak hazırlanmış çığır açan yenilikler sunar:

  • Uçtan Uca NMS-Free (NMS içermeyen) Tasarım: İlk kez YOLOv10 ile öncülük edilen YOLO26, NMS son işleme aşamasını tamamen kaldırır. Bu, bir transformer'ın zahmetli hesaplama yükü olmaksızın RTDETRv2'nin deterministik gecikmesini sağlar.
  • MuSGD Optimize Edici: (Moonshot AI'ın Kimi K2'si gibi) büyük dil modeli eğitim tekniklerinden esinlenen YOLO26, SGD ve Muon hibrit bir yapı kullanır. Bu, ViT'lerin kullandığı standart AdamW uygulamalarına kıyasla benzeri görülmemiş bir eğitim kararlılığı ve önemli ölçüde daha hızlı yakınsama süreleri sunar.
  • ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, küçük nesne tanımada kayda değer iyileştirmeler sağlar ve robotik otomasyon için kritik öneme sahip olan RTDETRv2'nin çok ölçekli özellik avantajlarıyla doğrudan rekabet eder.
  • Uç Cihaz Optimizasyonu ve DFL Kaldırma: Dağılım Odaklı Kayıp (DFL) değerini kaldırarak, YOLO26 çıktı kafasını düzene sokar ve %43'e kadar daha hızlı CPU çıkarımı sağlar; bu da onu ağır transformer modellerine göre uç cihazlarda çok daha dağıtılabilir kılar.

Link to this sectionUltralytics ile Eğitim Örneği#

Ultralytics Python API'sinin basitliği sayesinde, son teknoloji YOLO26 modelini sadece birkaç satır kodla eğitebilirsin:

from ultralytics import YOLO

# Load the highly efficient YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 dataset
# The framework automatically manages data augmentation and hyperparameter tuning
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")

# Effortlessly export to TensorRT for deployment
model.export(format="engine", dynamic=True)

Link to this sectionİdeal Kullanım Senaryoları#

Doğru mimariyi seçmek, büyük ölçüde dağıtım kısıtlamalarına ve donanım kullanılabilirliğine bağlıdır:

Ne zaman YOLOv7 düşünmelisin:

  • YOLOv7'nin yerleşik bir temel olarak kabul edildiği eski araştırma projelerinde.
  • Ham GPU hızlandırmasının bol olduğu ve NMS gecikme dalgalanmalarının kabul edilebilir olduğu ortamlarda.

Ne zaman RTDETRv2 düşünmelisin:

  • Mutlak maksimum mAP gerektiren üst düzey sunucu dağıtımlarında.
  • Deterministik çıkarım gecikmesinin (NMS-free) kesinlikle gerekli olduğu ve transformer omurgasını destekleyecek VRAM'e sahip olduğun senaryolarda.

Ne zaman Ultralytics YOLO26 seçmelisin:

  • Neredeyse her zaman. RTDETRv2'nin NMS içermeyen determinizmini sunar, YOLOv7'nin hızını ve doğruluğunu aşar, önemli ölçüde daha az VRAM kullanır ve zahmetsiz veri seti yönetimi, eğitim ve dağıtım için Ultralytics Platform ile tam entegredir.
Diğer Modelleri Keşfet

Diğer mimarilerin nasıl performans gösterdiğini merak mı ediyorsun? YOLO11 ve YOLOv8 gibi önceki nesillere dair derinlemesine incelemelerimizi keşfet veya projenin doğruluğunu maksimize etmek için hiperparametre ayarlama yönteminden nasıl yararlanabileceğini öğren.

Yorumlar