İçeriğe geç

RTDETRv2 vs YOLO: Nesne Algılama için Teknik Bir Karşılaştırma

Başarılı bilgisayarla görme uygulamaları için en uygun nesne algılama modelini seçmek kritik öneme sahiptir. Ultralytics çok çeşitli modeller sunar ve bu sayfa, nesne algılama alanındaki iki gelişmiş model olan RTDETRv2 ve YOLO arasında ayrıntılı bir teknik karşılaştırma sunar. Bu analiz, proje gereksinimlerinize göre iyi bilgilendirilmiş bir karar vermenize yardımcı olacaktır.

RTDETRv2: Transformatör Tabanlı Yüksek Doğruluklu Algılama

RTDETRv2(Real-Time Detection Transformer v2), Baidu tarafından geliştirilen, yüksek doğruluğu ve verimli gerçek zamanlı performansıyla bilinen son teknoloji ürünü bir nesne algılama modelidir. 2023-04-17 tarihinde Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu tarafından"DETRs Beat YOLOs on Real-time Object Detection" adlı makalede tanıtılan RTDETRv2, sağlam özellik çıkarımı ve küresel bağlam anlayışı elde etmek için bir Vision Transformer (ViT) mimarisinden yararlanmaktadır.

Mimari ve Özellikler

RTDETRv2, geleneksel CNN tabanlı dedektörlere kıyasla görüntülerdeki küresel bağlamı daha etkili bir şekilde yakalamasını sağlayan transformatör tabanlı mimarisiyle öne çıkmaktadır. Bu mimari, özellikle daha geniş bağlamı anlamanın çok önemli olduğu karmaşık sahnelerde üstün doğruluk sağlar. Model PyTorch 'ta uygulanmıştır ve GitHub'da mevcuttur.

Performans

RTDETRv2, en büyük varyantı olan RTDETRv2-x için 54,3 mAPval50-95 değerine ulaşarak etkileyici performans ölçümleri sergilemektedir. Çıkarım hızları da rekabetçidir, bu da onu yetenekli donanım kullanıldığında gerçek zamanlı uygulamalar için uygun hale getirir.

Güçlü ve Zayıf Yönler

Güçlü yönler:

  • Yüksek Doğruluk: Transformatör mimarisi mükemmel nesne algılama doğruluğu sağlar.
  • Gerçek Zamanlı Yetenek: Özellikle TensorRT hızlandırması ile yüksek çıkarım hızlarına ulaşır.
  • Etkili Bağlamsal Öğrenme: Görüntü Dönüştürücüler, görüntülerdeki küresel bağlamı yakalama konusunda mükemmeldir.

Zayıflıklar:

  • Daha Büyük Model Boyutu: RTDETRv2 modelleri, özellikle daha büyük varyantlar, daha fazla hesaplama kaynağı gerektiren önemli sayıda parametreye ve FLOP'a sahiptir.
  • Hesaplama Talebi: Hız için optimize edilmiş olsa da, çok kısıtlı kaynaklara sahip cihazlarda dağıtım için diğer bazı modeller kadar hafif olmayabilir.

Kullanım Örnekleri

RTDETRv2, yüksek doğruluğa öncelik veren ve önemli hesaplama kaynaklarına erişimi olan uygulamalar için idealdir:

RTDETRv2 hakkında daha fazla bilgi edinin

YOLO: Verimli ve Hızlı Nesne Algılama

Alibaba Group tarafından geliştirilen ve 2022-11-23 tarihinde Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun tarafından"DAMO-YOLO: Ölçeklenebilir ve Doğru Nesne Algılamayı Yeniden Düşünmek" başlıklı makalede tanıtılanYOLO(DAMO serisi YOLO), rekabetçi doğruluğu korurken hız ve verimlilik için tasarlanmıştır. YOLO gerçek zamanlı performansa odaklanır ve GitHub'da mevcuttur.

Mimari ve Özellikler

YOLO , verimliliği artırmak için Nöral Mimari Arama (NAS) omurgaları, verimli bir RepGFPN ve bir ZeroHead dahil olmak üzere çeşitli yenilikçi teknikler içerir. Bu mimari seçimler, hızına ve azaltılmış hesaplama taleplerine katkıda bulunarak onu gerçek zamanlı uygulamalar ve uç dağıtımlar için mükemmel bir seçim haline getirir.

Performans

YOLO , çeşitli donanım platformlarında çok hızlı performans sunarak çıkarım hızında üstünlük sağlar. Doğruluğu RTDETRv2'den biraz daha düşük olsa da, özellikle hızlı işlem gerektiren uygulamalar için hız ve doğruluk arasında cazip bir denge sağlar.

Güçlü ve Zayıf Yönler

Güçlü yönler:

  • Yüksek Hız: Son derece hızlı çıkarım için optimize edilmiştir, gerçek zamanlı sistemler için idealdir.
  • Verimlilik: Daha küçük model boyutları ve daha düşük hesaplama gereksinimleri onu uç cihazlar için uygun hale getirir.
  • Ölçeklenebilirlik: Çeşitli dağıtım senaryoları için ölçeklenebilir ve uyarlanabilir olacak şekilde tasarlanmıştır.

Zayıflıklar:

  • Doğruluk: Doğru olmakla birlikte, özellikle en yüksek hassasiyet gerektiren senaryolarda RTDETRv2 ile aynı üst düzey mAP puanlarına ulaşamayabilir.
  • Bağlamsal Anlama: CNN merkezli olduğundan, son derece karmaşık sahnelerde küresel bağlamı dönüştürücü tabanlı modeller kadar etkili bir şekilde yakalayamayabilir.

Kullanım Örnekleri

YOLO , hız ve verimliliğin çok önemli olduğu ve daha az güçlü donanımlarda dağıtımın gerekli olduğu uygulamalar için çok uygundur:

  • Gerçek Zamanlı Video Gözetimi: Anında algılama gerektiren güvenlik alarm sistemleri gibi uygulamalar için idealdir.
  • Uç Bilişim: Raspberry Pi ve NVIDIA Jetson gibi uç cihazlarda dağıtım için mükemmeldir.
  • Hızlı İşleme Uygulamaları: Robotik(ROS Quickstart) ve hızlı karar verme gerektiren diğer uygulamalar için uygundur.
  • Mobil Dağıtımlar: Mobil uygulamalar ve kaynak kısıtlı ortamlar için yeterince verimli.

YOLO hakkında daha fazla bilgi edinin

Model Karşılaştırma Tablosu

Model boyut(piksel) mAPval
50-95
CPU ONNX
(ms)
SpeedT4TensorRT10
(ms)
params(M) FLOPs(B)
RTDETRv2-s 640 48.1 - 5.03 20 60
RTDETRv2-m 640 51.9 - 7.51 36 100
RTDETRv2-l 640 53.4 - 9.76 42 136
RTDETRv2-x 640 54.3 - 15.03 76 259
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

Sonuç

Hem RTDETRv2 hem de YOLO , her biri farklı avantajlara sahip güçlü nesne algılama modelleridir. RTDETRv2, maksimum doğruluğun öncelikli olduğu ve hesaplama kaynaklarının mevcut olduğu durumlarda öne çıkar. YOLO, özellikle uç cihazlarda gerçek zamanlı işleme ve verimli dağıtım gerektiren uygulamalar için tercih edilen seçimdir.

Diğer seçenekleri düşünen kullanıcılar için Ultralytics , aşağıdakiler de dahil olmak üzere geniş bir model yelpazesi sunar:

RTDETRv2, YOLO veya diğer Ultralytics modelleri arasındaki seçim, doğruluk, hız ve mevcut kaynaklar arasındaki dengeyi dikkatlice göz önünde bulundurarak bilgisayarla görme projenizin özel ihtiyaçlarına dayanmalıdır. Daha fazla ayrıntı ve uygulama kılavuzları için Ultralytics Belgelerine ve Ultralytics GitHub deposuna bakın.

📅1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar