Link to this sectionYOLOv8 ve RTDETRv2#
Bilgisayarlı görü dünyası sürekli gelişiyor ve yeni mimariler, gerçek zamanlı nesne algılamada mümkün olanın sınırlarını zorluyor. Önemli ölçüde ilgi gören iki belirgin model, Ultralytics YOLOv8 ve Baidu'nun RTDETRv2'sidir. Bu kılavuz, bu iki güçlü model arasında kapsamlı bir teknik karşılaştırma sunarak mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını inceliyor.
Link to this sectionYOLOv8'e Genel Bakış#
Ultralytics YOLOv8, YOLO (You Only Look Once) model ailesinde önemli bir dönüm noktasını temsil eder. Çok çeşitli görevler için olağanüstü hız, doğruluk ve kullanım kolaylığı sunmak adına yılların temel araştırmaları üzerine inşa edilmiştir.
Temel Özellikler:
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 10 Ocak 2023
- GitHub: Ultralytics Deposu
- Dokümanlar: YOLOv8 Dokümantasyonu
Link to this sectionMimari ve Güçlü Yönler#
YOLOv8, hem öznitelik çıkarımını hem de sınırlayıcı kutu regresyonunu optimize eden sadeleştirilmiş bir mimari sunar. Tahmin başlığını basitleştiren ve eğitim sırasında gereken hiperparametre ayarı sayısını azaltan, çapa içermeyen (anchor-free) bir dedektördür. Bu mimari, çıkarım hızı ile ortalama hassasiyet (mAP) arasında harika bir performans dengesi sağlayarak hem uç cihazlarda hem de bulut sunucularında gerçek dünya dağıtımı için oldukça uygun hale gelir.
Ayrıca YOLOv8, eğitim sırasında transformatör tabanlı mimarilere kıyasla önemli ölçüde daha düşük bellek gereksinimleri gerektirir. Bu, geliştiricilerin bellek yetersizliği hatalarıyla karşılaşmadan modelleri standart tüketici GPU'larında eğitmesine olanak tanır.
Link to this sectionÇok Yönlülük#
YOLOv8'in belirleyici güçlü yönlerinden biri doğal çok yönlülüğüdür. Birçok model yalnızca sınırlayıcı kutulara odaklansa da, YOLOv8 nesne algılama, örnek bölümleme, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutu (OBB) algılama için kullanıma hazır destek sunar.
YOLOv8 hakkında daha fazla bilgi edinin
Link to this sectionRTDETRv2'ye Genel Bakış#
RTDETRv2 (Gerçek Zamanlı Algılama Transformatörü sürüm 2), Vision Transformer'ların güçlü dikkat mekanizmalarını gerçek zamanlı nesne algılama uygulamalarına getirmeyi amaçlayarak orijinal RT-DETR üzerine inşa edilmiştir.
Temel Özellikler:
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Kurum: Baidu
- Tarih: 24-07-2024
- Arxiv: 2407.17140
- GitHub: RT-DETR Deposu
- Dokümanlar: RTDETRv2 README
Link to this sectionMimari ve Güçlü Yönler#
RTDETRv2, bir Evrişimli Sinir Ağı (CNN) ana gövdesini (backbone) bir transformatör kodlayıcı-kod çözücü yapısıyla birleştiren hibrit bir mimariden yararlanır. Bu, modelin öz-dikkat mekanizmaları aracılığıyla karmaşık uzamsal ilişkileri ve küresel bağlamı yakalamasına olanak tanır. "Ücretsiz hediyeler çantası" (bag-of-freebies) eğitim stratejilerini kullanarak, RTDETRv2 COCO veri kümesi gibi standart karşılaştırmalı test veri kümelerinde rekabetçi mAP puanlarına ulaşır.
Link to this sectionZayıf Yönler#
Yüksek doğruluğuna rağmen, RTDETRv2'nin transformatör tabanlı yapısı, saf CNN mimarilerine kıyasla daha yüksek bellek tüketimi ve daha yavaş eğitim süreleri getirir. Transformatörler doğası gereği daha fazla VRAM gerektirir, bu da onları kaynakları kısıtlı donanımlarda eğitmeyi zorlaştırır. Ayrıca, RTDETRv2 algılamada güçlü olsa da, Ultralytics ekosisteminin doğasında bulunan çok görevli çok yönlülükten (poz ve bölümleme gibi) yoksundur.
RTDETRv2 hakkında daha fazla bilgi edin
Link to this sectionPerformans Karşılaştırması#
Üretim için modelleri değerlendirirken, model boyutu, çıkarım hızı ve doğruluk arasındaki denge çok önemlidir. Aşağıdaki tablo, YOLOv8 ve RTDETRv2 varyantlarının doğrudan bir karşılaştırmasını sunar.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
Hızlar bir Amazon EC2 P4d örneği kullanılarak ölçülmüştür. CPU çıkarımı ONNX ile yapılırken, GPU hızları TensorRT ile test edilmiştir.
Link to this sectionKullanım Durumları ve Öneriler#
YOLOv8 ve RT-DETR arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionYOLOv8 Ne Zaman Seçilmeli#
YOLOv8 şunlar için güçlü bir tercihtir:
- Çok Yönlü Çoklu Görev Dağıtımı: Ultralytics ekosistemi içinde algılama, segmentasyon, sınıflandırma ve poz tahmini için kanıtlanmış bir modele ihtiyaç duyan projeler.
- Yerleşik Üretim Sistemleri: Halihazırda YOLOv8 mimarisi üzerine kurulu, istikrarlı ve iyi test edilmiş dağıtım hatlarına sahip mevcut üretim ortamları.
- Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından yararlanan uygulamalar.
Link to this sectionRT-DETR Ne Zaman Seçilmeli#
RT-DETR şunlar için önerilir:
- Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
- Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
- Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionUltralytics Avantajı#
Bir model seçmek ham metriklerin ötesine geçer; çevreleyen yazılım ekosistemi geliştirici üretkenliği için çok önemlidir. Ultralytics ekosistemi, tüm makine öğrenimi yaşam döngüsünü basitleştiren birleşik bir Python API'si sağlayarak kullanım kolaylığı ile tanınır.
Veri kümesi yönetiminden dağıtık eğitime kadar, Ultralytics karmaşık standart kod bloklarını ortadan kaldırır. Geliştiriciler, kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve Hugging Face gibi platformlar ve izleme araçlarıyla kesintisiz entegrasyondan yararlanırlar. Bu iyi bakılan ekosistem, aktif geliştirmeyi, sık güncellemeleri ve güçlü topluluk desteğini garanti eder.
Ayrıca, eğitim verimliliği Ultralytics YOLO modellerinin bir işaretidir. Hızlı yakınsama ve eğitim süreci sırasında daha düşük bellek ayak izi için optimize edilmişlerdir, bu da RTDETRv2 gibi transformatör tabanlı dedektörlere kıyasla deney döngülerini önemli ölçüde hızlandırır.
Link to this sectionGeleceğe Bakış: YOLO26'nın Gücü#
YOLOv8 bir güç merkezi olarak kalmaya devam etse de, mutlak en son teknolojiyi arayan geliştiriciler, Ocak 2026'da piyasaya sürülen ve merakla beklenen YOLO26 sürümüne yükseltmeyi düşünmelidir. YOLO26, birkaç çığır açan yenilikle teknolojinin zirvesini yeniden tanımlıyor:
- Uçtan Uca NMS-Free Tasarım: YOLO26, Non-Maximum Suppression (NMS) sonrası işlemini ortadan kaldırarak daha hızlı ve daha deterministik dağıtım iş akışları sağlar.
- DFL Kaldırma: Distribution Focal Loss'un kaldırılması, modeli daha iyi uç ve düşük güçlü cihaz uyumluluğu için sadeleştirir.
- MuSGD Optimizer: LLM eğitim yeniliklerini entegre eden MuSGD optimize edici, daha kararlı eğitim çalışmaları ve daha hızlı yakınsama sağlar.
- %43'e kadar Daha Hızlı CPU Çıkarımı: Özel GPU'lardan yoksun ortamlar için ağır şekilde optimize edilmiştir.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonları, hava görüntüleme ve robotik için kritik olan küçük nesne tanımada kayda değer iyileşmeler sağlar.
Ultralytics paketi içinde keşfedilmeye değer diğer modern alternatifler arasında, eski projeler için güçlü performans sunan YOLO11 yer alır, ancak tüm yeni dağıtımlar için YOLO26 önerilir.
Link to this sectionKod Örneği: Eğitim ve Çıkarım#
Ultralytics API'sinin basitliği, sadece birkaç satır Python koduyla modelleri yükleyebileceğin, eğitebileceğin ve dağıtabileceğin anlamına gelir. Aşağıdaki örneği çalıştırmadan önce PyTorch kurulu olduğundan emin ol.
from ultralytics import YOLO
# Load a pretrained YOLOv8 small model
model = YOLO("yolov8s.pt")
# Train the model on your custom dataset
# Memory efficient training allows for larger batch sizes
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, batch=16)
# Run inference on a test image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the results
results[0].show()
# Export seamlessly for edge deployment
export_path = model.export(format="onnx")Ultralytics, ONNX, TensorRT ve CoreML dahil olmak üzere çok sayıda formata tek tıkla dışa aktarmayı destekleyerek farklı donanım mimarilerinde model dağıtım seçeneklerini basitleştirir.
Link to this sectionSonuç#
Hem YOLOv8 hem de RTDETRv2, gerçek zamanlı nesne algılama için etkileyici yetenekler sunar. RTDETRv2, küresel bağlamı yakalamada transformatörlerin gücünü gösterir ve bu da onu çıkarım hızı ile bellek yükünün birincil kısıtlamalar olmadığı karmaşık uzamsal akıl yürütme görevleri için uygun hale getirir.
Ancak, hız, doğruluk ve kaynak verimliliğinin olağanüstü dengesine öncelik veren geliştiriciler için Ultralytics YOLO modelleri üstün seçenek olmaya devam etmektedir. YOLOv8'in hafif yapısı, benzersiz kullanım kolaylığı, birden fazla görüntüleme görevindeki çok yönlülüğü ve gelişen açık kaynak ekosistemi ile birleştiğinde, onu ölçeklenebilir üretim ortamları için tercih edilen çözüm haline getirir. Uç performansın zirvesini arayanlar için, yeni piyasaya sürülen YOLO26, endüstriye liderlik etmeye devam eden eşsiz NMS-free verimlilik sunar.