Link to this sectionRTDETRv2 ile YOLOv10 Karşılaştırması#
Bilgisayarlı görü alanındaki evrim, büyük ölçüde hız ve doğruluk dengesini kurma arayışıyla şekillenmiştir. Geleneksel olarak, gerçek zamanlı nesne algılama hatları, çakışan sınırlayıcı kutuları filtrelemek için bir son işleme adımı olarak Maksimum Olmayan Baskılama (NMS) yöntemine güvenmiştir. Ancak NMS, gecikme darboğazlarına ve karmaşık hiperparametre ayarlarına yol açar. Son zamanlarda, bu sorunu yerel olarak çözmek için iki farklı mimari yaklaşım ortaya çıkmıştır: RTDETRv2 gibi Transformer tabanlı modeller ve YOLOv10 gibi CNN tabanlı modeller.
Bu kılavuz, her iki modelin mimarilerini, performans metriklerini ve ideal kullanım durumlarını analiz ederek kapsamlı bir teknik karşılaştırma sunar ve aynı zamanda Ultralytics ekosistemindeki en son yeniliklerin modern dağıtım için nasıl nihai çözümü sunduğunu vurgular.
Link to this sectionRTDETRv2: Gerçek Zamanlı Algılama Transformer'ları#
RTDETRv2, Vision Transformer'ların küresel bağlam anlayışını, geleneksel olarak YOLO modellerinin hakim olduğu gerçek zamanlı hız gereksinimleriyle birleştirmeyi amaçlayan orijinal RT-DETR mimarisi üzerine inşa edilmiştir.
Temel Özellikler:
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Kurum: Baidu
- Tarih: 24-07-2024
- Arxiv: https://arxiv.org/abs/2407.17140
- GitHub: https://github.com/lyuwenyu/RT-DETR/tree/main/rtdetrv2_pytorch
Link to this sectionMimari ve Eğitim Metodolojileri#
RTDETRv2 utilizes an end-to-end transformer architecture that inherently avoids NMS. It improves upon its predecessor by introducing a "Bag-of-Freebies" approach, optimizing the training strategy and incorporating multi-scale detection capabilities. The model uses a CNN backbone to extract feature maps (visual details like edges and textures), which are then processed by a transformer encoder-decoder structure. This allows the model to analyze the whole image context simultaneously, making it highly effective at understanding complex scenes where objects are densely packed or overlapping.
Link to this sectionGüçlü ve Zayıf Yönler#
Güçlü Yönler:
- Global Context: The attention mechanism allows the model to excel in complex, cluttered environments.
- NMS'siz: Nesne koordinatlarını doğrudan tahmin ederek dağıtım sürecini basitleştirir.
- Yüksek Doğruluk: COCO veri kümesinde mükemmel bir ortalama hassasiyet (mAP) elde eder.
Zayıf Yönler:
- Resource Intensive: Transformer architectures typically require significantly more CUDA memory during training compared to CNNs, making them expensive to fine-tune on standard hardware.
- Inference Speed Variability: While fast, the heavy attention calculations can lead to lower FPS in computer vision on edge devices lacking dedicated AI accelerators.
RTDETRv2 hakkında daha fazla bilgi edin
Link to this sectionYOLOv10: Gerçek Zamanlı Uçtan Uca Nesne Algılama#
YOLOv10 represents a major shift in the YOLO object detection lineage by addressing the long-standing NMS bottleneck directly within a CNN framework.
Temel Özellikler:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri.
- Organizasyon: Tsinghua University
- Tarih: 23-05-2024
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
Link to this sectionMimari ve Eğitim Metodolojileri#
YOLOv10'un temel yeniliği, NMS'siz eğitim için tutarlı ikili atamalarıdır. Eğitim sırasında iki algılama başlığı kullanır: zengin denetim sinyalleri sağlamak için çoktan çoğa atamaya sahip (geleneksel YOLO'lar gibi) bir başlık ve NMS ihtiyacını ortadan kaldırmak için bire bir atamaya sahip başka bir başlık. Çıkarım sırasında, yalnızca bire bir başlık kullanılır ve bu da uçtan uca bir süreçle sonuçlanır. Ayrıca yazarlar, hesaplama fazlalığını azaltmak için çeşitli bileşenleri kapsamlı bir şekilde optimize ederek bütünsel bir verimlilik-doğruluk odaklı model tasarım stratejisi uygulamışlardır.
Link to this sectionGüçlü ve Zayıf Yönler#
Güçlü Yönler:
- Extreme Speed: By removing NMS and optimizing the architecture, YOLOv10 achieves incredibly low inference latency.
- Efficiency: Requires fewer parameters and FLOPs to achieve comparable accuracy to other models, making it highly suitable for constrained environments.
- NMS-Free Deployments: Streamlines integration into edge applications like smart surveillance.
Zayıf Yönler:
- İlk Nesil Konsept: Bu özel NMS'siz mimariyi uygulayan ilk YOLO olarak temelleri atmıştır, ancak YOLO11 ve YOLO26 gibi sonraki modellerde görülen çok görevli çok yönlülük ve optimizasyon için yer bırakmıştır.
YOLOv10 hakkında daha fazla bilgi edin
Link to this sectionPerformans Karşılaştırması#
Üretim için modelleri değerlendirirken, doğruluk ile hesaplama maliyeti arasındaki denge kritik öneme sahiptir. Aşağıdaki tablo, çeşitli RTDETRv2 ve YOLOv10 boyutları arasındaki performans ödünleşimlerini vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
While RTDETRv2 offers robust accuracy, YOLOv10 demonstrates a remarkable advantage in latency and parameter efficiency, particularly in its smaller variants (Nano and Small), making it highly attractive for edge computing and AIoT applications.
If you are deploying on server-grade GPUs where batch size and VRAM are less constrained, the larger models (like -x or -l) maximize accuracy. For edge devices like Raspberry Pi or mobile phones, prioritize nano (-n) or small (-s) variants to maintain real-time frame rates.
Link to this sectionKullanım Durumları ve Öneriler#
RT-DETR ve YOLOv10 arasında seçim yapmak; projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionRT-DETR Ne Zaman Seçilmeli#
RT-DETR şunlar için güçlü bir seçimdir:
- Transformer Tabanlı Algılama Araştırması: NMS olmadan uçtan uca nesne algılama için dikkat mekanizmalarını ve transformer mimarilerini keşfeden projeler.
- Esnek Gecikmeli Yüksek Doğruluklu Senaryolar: Algılama doğruluğunun en önemli öncelik olduğu ve biraz daha yüksek çıkarım gecikmesinin kabul edilebilir olduğu uygulamalar.
- Büyük Nesne Algılama: Transformer'ların küresel dikkat mekanizmasının doğal bir avantaj sağladığı, ağırlıklı olarak orta-büyük nesnelerin olduğu sahneler.
Link to this sectionNe Zaman YOLOv10 Seçilmeli#
YOLOv10 şunlar için önerilir:
- NMS'siz Gerçek Zamanlı Tespit: Non-Maximum Suppression (NMS) olmadan uçtan uca tespitten yararlanan ve dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile tespit doğruluğu arasında güçlü bir denge gerektiren projeler.
- Tutarlı Gecikme Süreli Uygulamalar: robotik veya otonom sistemler gibi öngörülebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionUltralytics Avantajı: YOLO26 ile Tanışın#
While both RTDETRv2 and YOLOv10 offer compelling academic advancements, deploying them in real-world scenarios requires a robust, well-maintained software ecosystem. The Ultralytics Platform provides an unparalleled developer experience, combining ease of use, extensive documentation, and powerful tools for data annotation and deployment.
2026 yılında mutlak en son teknolojiyi arayan geliştiriciler için Ultralytics YOLO26 nihai öneridir. Her iki mimariden en iyi fikirleri sentezlerken çığır açan iyileştirmeler sunar:
- Uçtan Uca NMS'siz Tasarım: YOLOv10 tarafından öncülük edilen konsepte dayanan YOLO26, NMS son işlemini yerel olarak ortadan kaldırır ve bu da daha hızlı, daha basit dağıtım mantığı ve sıfır gecikme varyansı ile sonuçlanır.
- DFL Kaldırma: Dağılım Odaklı Kaybı (Distribution Focal Loss) kaldırarak, YOLO26 model dışa aktarımını basitleştirir ve uç cihazlar ve düşük güç tüketen cihazlarla uyumluluğu önemli ölçüde artırır.
- MuSGD Optimize Edici: SGD ve Muon'un bir hibriti olan (LLM eğitim yeniliklerinden esinlenmiştir) bu yeni optimize edici, geleneksel yöntemlere kıyasla daha kararlı eğitim ve önemli ölçüde daha hızlı yakınsama sağlar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU'su olmayan ortamlar için dikkatle optimize edilmiştir, böylece yüksek performanslı görüntü yapay zekasını demokratikleştirir.
- ProgLoss + STAL: These advanced loss functions yield notable improvements in small-object recognition, which is critical for applications using drones and IoT sensors.
- Eşsiz Çok Yönlülük: Yalnızca sınırlayıcı kutularla sınırlı modellerin aksine, YOLO26 örnek bölümleme, poz tahmini, görüntü sınıflandırma ve OBB algılama dahil olmak üzere tam bir görev paketini destekler ve Pose için Artık Log-Olabilirlik Tahmini (RLE) gibi göreve özel iyileştirmelerle tamamlanır.
YOLO26 hakkında daha fazla bilgi edin
Link to this sectionPython ile Sorunsuz Uygulama#
Ultralytics Python API kullanarak bu modelleri eğitmek ve dağıtmak sorunsuz olacak şekilde tasarlanmıştır. Bellek gereksinimleri, transformer ağırlıklı mimarilere kıyasla eğitim sırasında önemli ölçüde daha düşüktür ve standart donanımlarda güçlü modeller eğitmeni sağlar.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 model (recommended)
# Alternatively, load a YOLOv10 model using YOLO('yolov10n.pt')
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Easily export to various formats for edge deployment
model.export(format="onnx", simplify=True)Whether you are implementing security alarm systems or conducting medical image analysis, choosing a model backed by the active Ultralytics community ensures you have the tools, hyperparameter tuning guides, and continuous updates needed to succeed. While YOLOv10 and RTDETRv2 paved the way for NMS-free architectures, YOLO26 perfects the formula, offering the best balance of performance, versatility, and production readiness.