Link to this sectionRTDETRv2 ile DAMO-YOLO Karşılaştırması#
Bilgisayarlı görü alanı sürekli gelişiyor; araştırmacılar ve mühendisler hız, doğruluk ve verimlilik arasında mükemmel dengeyi kuran modeller geliştirmek için çabalıyorlar. Bu alanda büyük yankı uyandıran iki önemli mimari, Baidu tarafından geliştirilen RTDETRv2 ve Alibaba Group tarafından hazırlanan DAMO-YOLO'dur. Her iki model de gerçek zamanlı nesne tespiti sınırlarını zorluyor, ancak etkileyici sonuçlarına ulaşmak için temelden farklı mimari felsefeleri benimsiyorlar.
Bu teknik karşılaştırmada, mimarilerine, eğitim metodolojilerine ve gerçek dünya dağıtım yeteneklerine derinlemesine ineceğiz. Ayrıca bu modellerin daha geniş ekosistem karşısında, özellikle de yüksek düzeyde optimize edilmiş Ultralytics Platform ve son teknoloji YOLO26 mimarisi ile nasıl bir konumda olduklarını inceleyeceğiz.
Link to this sectionMimari Yenilikler#
Bu modellerin temel mekanizmalarını anlamak, üretim ortamları için doğru aracı seçmekle görevli makine öğrenimi mühendisleri için çok önemlidir.
Link to this sectionRTDETRv2: Transformer Yaklaşımı#
Orijinal RT-DETR'in başarısının üzerine inşa edilen RTDETRv2, hibrit bir kodlayıcı ve bir transformer kod çözücü kullanır. Bu tasarım, modelin küresel bağlamı oldukça etkili bir şekilde işlemesini sağlayarak yoğun sahnelerde üst üste binen nesneleri ayırt etmede son derece başarılı olmasını sağlar. Bu mimarinin en önemli avantajı, yerel NMS-free (Baskılayıcı Olmayan/Non-Maximum Suppression gerektirmeyen) tasarımıdır. NMS son işleme adımını ortadan kaldıran RTDETRv2, çıkarım hattını basitleştirir ve farklı donanım yapılandırmalarında daha kararlı gecikme süreleri sağlar.
RTDETRv2 hakkında daha fazla bilgi edin
Link to this sectionDAMO-YOLO: CNN Verimliliğini Geliştirme#
Öte yandan DAMO-YOLO, oldukça başarılı olan CNN tabanlı YOLO soy ağacına dayanmaya devam eder ancak birkaç çığır açan geliştirme sunar. Omurgasını optimize etmek ve maksimum özellik çıkarma verimliliği sağlamak için Nöral Mimari Arama (NAS) özelliğinden yararlanır. Ayrıca, verimli bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) ve ZeroHead tasarımı ile birlikte AlignedOTA ve damıtma (distillation) geliştirme tekniklerini içerir. Bu yenilikler, DAMO-YOLO'nun son derece rekabetçi bir mAPval puanını korurken hızlı çıkarım hızlarına ulaşmasını sağlar.
DAMO-YOLO hakkında daha fazla bilgi edin
RTDETRv2 NMS olmadan küresel özellik anlayışı için dikkat mekanizmalarından yararlanmaya odaklanırken, DAMO-YOLO NAS ve gelişmiş damıtma yoluyla geleneksel CNN verimliliğini maksimize eder; standart son işlemeyi gerektirir ancak belirli donanımlarda belirgin hız avantajları sunar.
Link to this sectionPerformans ve Metrik Karşılaştırması#
Dağıtım için modelleri değerlendirirken, ortalama Hassasiyet (mAP), çıkarım hızı ve parametre sayısı gibi performans metrikleri çok önemlidir. Aşağıda iki model ailesinin ayrıntılı bir karşılaştırması yer almaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
| RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
| RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
| RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Link to this sectionSonuçların Analizi#
Tabloda görüldüğü gibi, RTDETRv2-x, 54.3 mAPval değeri ile en yüksek doğruluğa ulaşarak transformer mimarisinin COCO veri kümesi gibi karmaşık doğrulamalardaki gücünü sergiliyor. Ancak bu, önemli ölçüde daha yüksek parametre (76M) ve FLOP maliyetiyle geliyor.
Buna karşılık, DAMO-YOLOt (Tiny) son derece hafiftir ve yalnızca 8.5M parametre gerektirir, bu da onu CUDA belleğinin ciddi şekilde kısıtlı olduğu ortamlar için inanılmaz derecede hızlı bir seçenek haline getirir. DAMO-YOLO, eski uç cihazlar için genellikle hız ve doğruluk arasında uygun bir denge sağlar.
Link to this sectionEkosistem, Kullanılabilirlik ve Ultralytics Avantajı#
Resmi RT-DETR GitHub ve DAMO-YOLO GitHub gibi bağımsız depolar bu modelleri eğitmek için ham kod sunsa da, bunları üretim hatlarına entegre etmek genellikle kapsamlı bir standart kod (boilerplate) ve manuel optimizasyon gerektirir.
İşte Ultralytics ekosistemi geliştirici deneyimini tam olarak bu noktada büyük ölçüde basitleştirir. Ultralytics, RTDETRv2 gibi modelleri doğrudan birleşik API'sine entegre ederek kullanıcıların modelleri tek bir kod satırıyla eğitmesine, doğrulamas olmasına ve dışa aktarmasına olanak tanır. Ayrıca Ultralytics modelleri, ağır transformer tabanlı bağımsız depolara kıyasla eğitim sırasında minimum bellek gereksinimleriyle bilinir.
Link to this sectionKod Örneği: Kesintisiz Entegrasyon#
Ultralytics Python kütüphanesinden çıkarım yapmak için ne kadar kolay yararlanabileceğini burada görebilirsin. İster bir transformer modeli ister son teknoloji bir CNN kullanıyor ol, API tutarlı kalmaya devam eder.
from ultralytics import RTDETR, YOLO
# Load an RTDETRv2 model for complex scene understanding
model_rtdetr = RTDETR("rtdetr-l.pt")
# Load the latest Ultralytics YOLO26 model for ultimate edge performance
model_yolo26 = YOLO("yolo26n.pt")
# Run inference on a sample image effortlessly
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")
results_yolo = model_yolo26("https://ultralytics.com/images/bus.jpg")
# Display the results
results_yolo[0].show()Using the Ultralytics API, you can seamlessly export your trained models to formats like TensorRT, ONNX, or CoreML with a simple model.export(format="engine") command, drastically reducing deployment friction.
Link to this sectionİdeal Kullanım Senaryoları#
Bu mimariler arasında seçim yapmak tamamen senin özel proje gereksinimlerine bağlıdır:
- RTDETRv2, VRAM'in bol olduğu sunucu tarafı işlemlerinde mükemmeldir. Küresel bağlam farkındalığı, tıkanıklıkların sık görüldüğü tıbbi görüntüleme ve yoğun kalabalık analizi için mükemmeldir.
- DAMO-YOLO, gömülü IoT uygulamaları ve düşük parametre sayısı ile yüksek FPS'nin katı gereksinimler olduğu hızlı hareket eden endüstriyel denetim hatları için son derece uygundur.
Link to this sectionGelecek: Ultralytics YOLO26#
Hem RTDETRv2 hem de DAMO-YOLO'nun kendi değerleri olsa da, bilgisayarlı görü alanı hızla ilerlemektedir. Yeni projeler için en son Ultralytics YOLO26, hız, doğruluk ve geliştirici deneyiminin nihai sentezini temsil eder.
YOLO26 adopts an End-to-End NMS-Free Design, capturing the primary benefit of transformers without the massive computational overhead. It incorporates the innovative MuSGD Optimizer—inspired by Large Language Model training—for stable, fast convergence. Furthermore, with DFL Removal (Distribution Focal Loss removed for simplified export and better edge/low-power device compatibility), YOLO26 achieves up to 43% faster CPU inference, making it the undisputed champion for edge computing. Additionally, ProgLoss + STAL provides improved loss functions with notable improvements in small-object recognition, critical for IoT, robotics, and aerial imagery.
Yalnızca sınırlayıcı kutularla sınırlı modellerin aksine YOLO26 ailesi, örnek segmentasyonu ve poz tahmini işlemlerinden yönlendirilmiş sınırlayıcı kutulara (OBB) kadar uzanan görevleri destekleyerek benzersiz bir çok yönlülük sunar ve tüm bunlar sezgisel Ultralytics Platform aracılığıyla sorunsuz bir şekilde yönetilir.
Platform üzerinde YOLO26'yı keşfet
Link to this sectionModel Detayları ve Referanslar#
Link to this sectionRTDETRv2#
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Organizasyon: Baidu
- Tarih: 2024-07-24
- Arxiv: 2407.17140
- GitHub: RT-DETR Deposu
Link to this sectionDAMO-YOLO#
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: 2211.15444v2
- GitHub: DAMO-YOLO Deposu
Diğer karşılaştırmaları keşfetmek isteyen kullanıcılar, bu modellerin Ultralytics ailesinin önceki nesillerine karşı nasıl performans gösterdiğini görmek için RTDETRv2 vs. YOLO11 veya DAMO-YOLO vs. YOLOv8 rehberlerimize göz atabilir.