Link to this sectionRTDETRv2 ve YOLO11: Gerçek Zamanlı Nesne Algılama Mimarilerine Derin Bir Bakış#
Bilgisayarlı görü dünyası sürekli gelişiyor; yeni mimariler, uç cihazlarda ve bulut sunucularında mümkün olanın sınırlarını zorluyor. Mevcut gerçek zamanlı nesne algılama alanındaki en önemli iki rakip RTDETRv2 ve YOLO11'dir. Her iki model de üstün performans sunsa da, temel olarak farklı mimari felsefeleri temsil ederler: Transformer tabanlı yaklaşım ile yüksek düzeyde optimize edilmiş Evrişimli Sinir Ağı (CNN).
Bu kapsamlı teknik karşılaştırmada, her iki modelin mimarilerini, performans metriklerini, eğitim yöntemlerini ve ideal kullanım durumlarını inceleyerek bir sonraki yapay zeka uygulamanız için bilinçli bir karar vermenize yardımcı olacağız.
Link to this sectionRTDETRv2: Transformer Tabanlı Meydan Okuyan#
Orijinal Real-Time Detection Transformer'ın bir evrimi olarak tanıtılan RTDETRv2, görsel verileri işlemek için dikkat (attention) mekanizmalarından yararlanır. Görüntü parçalarını diziler olarak ele alarak, karmaşık sahnelerdeki yoğun örtüşen nesneleri tespit etmek için oldukça faydalı olan küresel bir görüntü bağlamı anlayışı sağlar.
Model Detayları:
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Organizasyon: Baidu
- Tarih: 2024-07-24
- Arxiv: 2407.17140
- GitHub: RT-DETR Deposu
- Dokümanlar: RTDETRv2 Dokümantasyonu
Link to this sectionMimari Güçlü ve Zayıf Yönler#
RTDETRv2'nin temel yeniliği uçtan uca NMS içermeyen mimarisidir. NMS'yi (Non-Maximum Suppression) ortadan kaldırarak işlem sonrası hattını basitleştirir. Ayrıca, çok ölçekli özellik çıkarma yetenekleri orijinal RT-DETR modeline kıyasla geliştirilmiş olup, farklı boyutlardaki nesneleri daha iyi tanımlamasını sağlar.
Bununla birlikte, Transformer'lara dayandığı için RTDETRv2 genellikle eğitim sırasında çok daha yüksek bellek gereksinimlerine sahiptir. Transformer'lar genellikle daha yavaş yakınsar ve geleneksel CNN'lere kıyasla önemli ölçüde daha fazla CUDA belleği gerektirir, bu da onları tüketici sınıfı donanımlarda çalışan veya kısıtlı edge AI ortamlarına dağıtım yapan araştırmacılar için daha az erişilebilir kılar.
RTDETR hakkında daha fazla bilgi edinin
Link to this sectionUltralytics YOLO11: CNN Verimliliğinin Zirvesi#
Yılların temel araştırmaları üzerine inşa edilen Ultralytics, YOLO11'i YOLO serisinde ileriye doğru atılmış devasa bir adım olarak piyasaya sürdü. CNN mimarisini benzeri görülmemiş bir hız ve doğruluk elde edecek şekilde rafine ederken, topluluğun beklediği esnekliği ve geliştirici dostu ekosistemi koruyor.
Model Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 27 Eylül 2024
- GitHub: Ultralytics Deposu
Link to this sectionUltralytics Avantajı#
YOLO11, Performans Dengesi ile öne çıkar. Hız ve doğruluk arasında olağanüstü bir denge kurarak, büyük cloud computing kümelerinden hafif mobil cihazlara kadar çeşitli gerçek dünya dağıtım senaryoları için son derece çok yönlü olmasını sağlar.
Dahası, Ultralytics YOLO modelleri eğitim ve çıkarım sırasında daha düşük bellek kullanımlarıyla ünlüdür. VRAM'i kolayca tüketebilen Transformer modellerinin aksine, YOLO11 standart GPU'larda daha büyük yığın boyutlarına izin verir. Ayrıca, YOLO11 sadece nesne algılama ile sınırlı değildir; Instance Segmentation, Image Classification, Pose Estimation ve Oriented Bounding Boxes (OBB) için yerel desteğiyle inanılmaz bir Çok Yönlülük sunar.
YOLO11 hakkında daha fazla bilgi edinin
Link to this sectionPerformans ve Metrik Karşılaştırması#
Ham sayıları karşılaştırdığımızda, RTDETRv2'nin etkileyici bir doğruluk elde etmesine rağmen, YOLO11'in özellikle TensorRT üzerinde üstün çıkarım hızlarıyla çok daha ayrıntılı model boyutu seçenekleri sunduğu açıkça görülmektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Tabloda görüldüğü gibi, YOLO11x modeli, RTDETRv2-x varyantına kıyasla daha az FLOP (259B yerine 194.9B) kullanırken ve TensorRT üzerinde daha hızlı çıkarım (15.03ms yerine 11.3ms) sunarken %54.7'lik üstün bir mAPval elde eder. Nano ve küçük YOLO11 varyantları, Raspberry Pi gibi kısıtlı cihazlar için benzersiz hafif seçenekler sunar.
Link to this sectionEkosistem, Kullanım Kolaylığı ve Eğitim#
Ultralytics modellerinin belirleyici özelliği, kolaylaştırılmış kullanıcı deneyimidir. ultralytics Python paketi, data augmentation, dağıtık eğitim ve model dışa aktarma gibi ağır işleri halleden birleşik ve sezgisel bir API sağlar. RTDETRv2'nin araştırma deposu önemli miktarda şablon (boilerplate) ve yapılandırma gerektirirken, Ultralytics "sıfırdan profesyonelliğe" bir hat sağlar.
İlginç bir şekilde, Ultralytics ekosistemi o kadar sağlamdır ki, RT-DETR modellerini YOLO modelleriyle birlikte çalıştırmayı yerel olarak destekler! Bu, deneyleri zahmetsizce izlemek için Weights & Biases ve Comet ML entegrasyonları dahil olmak üzere Ultralytics'in Bakımlı Ekosisteminden yararlanmanı sağlar.
from ultralytics import RTDETR, YOLO
# Load an RTDETR model seamlessly through the Ultralytics API
model_rtdetr = RTDETR("rtdetr-l.pt")
# Load a highly optimized YOLO11 model
model_yolo = YOLO("yolo11n.pt")
# Train YOLO11 with highly efficient memory usage
results = model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained YOLO model to ONNX format
model_yolo.export(format="onnx")Eğitim verimliliği makine öğreniminde çok önemlidir. Ultralytics modelleri, hızla yakınsayan önceden eğitilmiş ağırlıklar kullanır. Veri kümelerini, eğitim çalışmalarını ve dağıtım uç noktalarını kod yazmadan yönetmek için, entegre bir MLOps deneyimi için Ultralytics Platformunu keşfet.
Link to this sectionGerçek Dünya Uygulamaları#
Bu mimariler arasında seçim yapmak genellikle projenin özel dağıtım kısıtlamalarına bağlıdır.
RTDETRv2'nin Öne Çıktığı Yerler: RTDETRv2'nin Transformer omurgası, küresel bağlamın gerekli olduğu yoğun ve ağır şekilde gizlenmiş nesnelerin bulunduğu senaryolarda oldukça etkilidir. Genellikle akademik araştırmalarda ve hesaplama bütçesinin ham dikkat tabanlı ilişki eşlemesinden daha az önemli olduğu uygulamalarda değerlendirilir.
YOLO11'in Hakim Olduğu Yerler: YOLO11, pratik, gerçek dünya dağıtımlarının tartışmasız şampiyonudur. Minimal bellek ayak izi ve ışık hızındaki çıkarım süreleri onu şu alanlar için ideal kılar:
- Akıllı Üretim: Endüstriyel bilgisayarlar kullanarak üretim hatlarında gerçek zamanlı hata tespiti yapmak.
- Tarım: Gerçek zamanlı ürün sağlığı izleme ve otomatik hasat robotikleri için drone'lara dağıtmak.
- Perakende Analitiği: Devasa sunucu çiftliklerine ihtiyaç duymadan sıra yönetimi ve envanter takibi için birden fazla kamera akışını aynı anda işlemek.
Link to this sectionKullanım Durumları ve Öneriler#
RT-DETR ve YOLO11 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionRT-DETR Ne Zaman Seçilmeli#
RT-DETR şunlar için güçlü bir seçimdir:
- Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
- Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
- Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.
Link to this sectionYOLO11 Ne Zaman Seçilmeli#
YOLO11 şunlar için önerilir:
- Üretim Uç Dağıtımı: Güvenilirliğin ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
- Çok Görevli Görüntü Uygulamaları: Tek bir birleşik çerçeve içinde algılama, segmentasyon, pose estimation ve OBB gerektiren projeler.
- Hızlı Prototipleme ve Dağıtım: Veri toplamadan üretime kadar olan süreci, kolaylaştırılmış Ultralytics Python API kullanarak hızla ilerletmesi gereken ekipler.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionGeleceğe Bakış: YOLO26'nın Gelişi#
Yeni bir projeye başlıyorsan, görü yapay zekasının bir sonraki neslini de düşünmelisin: Ultralytics YOLO26. Ocak 2026'da piyasaya sürülen YOLO26, her iki dünyanın da en iyilerini birleştirir. YOLOv10 içinde öncülük edilen Uçtan Uca NMS-Free Tasarımı tanıtır, tıpkı RTDETRv2 gibi işlem sonrası gecikmesini tamamen ortadan kaldırır, ancak bir CNN'in benzersiz hızıyla.
YOLO26, LLM eğitim yeniliklerinden ilham alan MuSGD Optimizer özelliğine sahiptir, inanılmaz derecede kararlı ve hızlı yakınsama sağlar ve Distribution Focal Loss (DFL) özelliğini kaldırarak %43'e kadar Daha Hızlı CPU Çıkarımı sunar. Küçük nesne tanımayı büyük ölçüde geliştiren özelleşmiş ProgLoss + STAL kayıp fonksiyonlarıyla YOLO26, modern her bilgisayarlı görü hattı için nihai öneridir.
İster kanıtlanmış çok yönlülüğü için YOLO11'i, ister dikkat mekanizmaları için RTDETRv2'yi, isterse uç performans için son teknoloji YOLO26'yı seç, Ultralytics dokümantasyonu bilgisayarlı görü yolculuğunda başarılı olmak için gereken tüm kaynakları sağlar.