YOLOv7 ve RT-DETRv2: Ayrıntılı Teknik Karşılaştırma
Doğru nesne algılama modelini seçmek, herhangi bir bilgisayarla görü projesi için kritik bir karardır ve doğruluk, hız ve hesaplama maliyeti arasındaki ödünleşimleri dengeler. Bu sayfa, yüksek verimli bir CNN tabanlı dedektör olan YOLOv7 ile son teknoloji ürünü bir transformatör tabanlı model olan RT-DETRv2 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. Bilinçli bir seçim yapmanıza yardımcı olmak için mimari farklılıklarını, performans kıyaslamalarını ve ideal kullanım durumlarını inceleyeceğiz.
YOLOv7: Hız ve Doğruluk İçin Optimize Edildi
YOLOv7, YOLO serisinde önemli bir kilometre taşını temsil ediyor ve piyasaya sürüldüğü sırada gerçek zamanlı nesne algılama için yeni bir standart belirlemek üzere yeni eğitim stratejileri ve mimari optimizasyonlar sunuyor.
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- Belgeler: https://docs.ultralytics.com/models/yolov7/
Mimari ve Temel Özellikler
YOLOv7'nin mimarisi, çıkarım maliyetlerini artırmadan performansı artırmak için çeşitli temel yenilikleri içeren güçlü bir CNN temeli üzerine kurulmuştur. Backbone'u, ağın çeşitli özellikleri öğrenme yeteneğini geliştiren Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) içerir. Önemli bir katkı, nihai modelin doğruluğunu artırmak için eğitim sırasında uygulanan gelişmiş optimizasyon tekniklerini (yardımcı başlıklar ve kaba-ince kılavuzlu etiket ataması gibi) içeren bir "eğitilebilir bedava hediyeler çantası" kavramıdır. Bu stratejiler, YOLOv7'nin hız ve hassasiyet arasında dikkat çekici bir denge kurmasını sağlar.
Performans ve Kullanım Alanları
YOLOv7, GPU donanımındaki olağanüstü performansıyla ünlüdür ve gerçek zamanlı çıkarım için yüksek kare hızı (FPS) sağlar. Bu, düşük gecikmenin kritik olduğu uygulamalar için mükemmel bir seçimdir.
-
Güçlü Yönler:
- Mükemmel Hız-Doğruluk Takası: Gerçek zamanlı görevler için ideal olan güçlü bir mAP ve çıkarım hızı kombinasyonu sağlar.
- Verimli Eğitim: çıkarım sırasında hesaplama yükünü artırmadan doğruluğu artırmak için "bedava hediyeler"den yararlanır.
- Kanıtlanmış Performans: MS COCO gibi standart veri kümelerinde yerleşik ve iyi bir şekilde kıyaslanmıştır.
-
Zayıflıklar:
- Karmaşıklık: Mimari ve gelişmiş eğitim tekniklerini tam olarak anlamak ve özelleştirmek karmaşık olabilir.
- Kaynak Yoğun: Daha büyük YOLOv7 modelleri, eğitim için önemli miktarda GPU kaynağı gerektirir.
- Sınırlı Çok Yönlülük: Öncelikli olarak nesne algılama için tasarlanmıştır ve entegre çoklu görev desteğine sahip modellerin aksine, diğer görevler için topluluk tarafından yönlendirilen uzantılara sahiptir.
YOLOv7 hakkında daha fazla bilgi edinin
RT-DETRv2: Gerçek Zamanlı Algılama Dönüştürücü v2
RT-DETRv2 (Gerçek Zamanlı Algılama Dönüştürücü v2), gerçek zamanlı performansı korurken yüksek doğruluk elde etmek için dönüştürücülerin gücünden yararlanan Baidu'nun son teknoloji bir nesne tespit aracıdır.
- Yazarlar: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang ve Yi Liu
- Kuruluş: Baidu
- Tarih: 2023-04-17
- Arxiv: https://arxiv.org/abs/2304.08069
- GitHub: https://github.com/lyuwenyu/RT-DETR/tree/main/rtdetrv2_pytorch
Mimari ve Temel Özellikler
RT-DETRv2, geleneksel CNN'lerden daha etkili bir şekilde bir görüntü içindeki küresel bağlamı ve ilişkileri yakalamasına olanak tanıyan Vision Transformer (ViT) mimarisine dayanmaktadır. Başlangıç özellik çıkarımı için bir CNN backbone'u ve algılama için dönüştürücü tabanlı bir kodlayıcı-kod çözücü kullanan hibrit bir tasarıma sahiptir. Bu model aynı zamanda, YOLOX gibi modellere benzer şekilde, önceden tanımlanmış bağlantı kutularına olan ihtiyacı ortadan kaldırarak algılama hattını basitleştiren bağlantısızdır.
Performans ve Kullanım Alanları
RT-DETRv2'nin temel avantajı, özellikle önemli tıkanıklık veya karmaşıklık içeren karmaşık sahnelerdeki nesneleri tespit etmede yüksek doğruluğudur.
-
Güçlü Yönler:
- Yüksek Doğruluk: Transformer mimarisi, global görüntü bağlamını etkili bir şekilde işleyerek üstün nesne algılama doğruluğu sağlar.
- Güçlü Özellik Gösterimi: Karmaşık ayrıntıları ve nesneler arasındaki ilişkileri anlamada üstündür.
-
Zayıflıklar:
- Yüksek Hesaplama Maliyeti: RT-DETRv2 gibi Transformer tabanlı modeller, özellikle eğitim sırasında hesaplama açısından yoğundur. Genellikle CNN tabanlı modellere kıyasla önemli ölçüde daha fazla CUDA belleği ve daha uzun eğitim süreleri gerektirirler.
- Bazı Donanımlarda Daha Yavaş Çıkarım: Gerçek zamanlı performans için optimize edilmiş olsa da, tüm donanım yapılandırmalarında YOLOv7 gibi yüksek düzeyde optimize edilmiş CNN'lerin ham hızına ulaşamayabilir.
RT-DETR hakkında daha fazla bilgi edinin
Performans Karşılaştırması: YOLOv7 - RT-DETRv2
Aşağıdaki tablo, farklı model varyantlarının nicel bir karşılaştırmasını sunmaktadır. RT-DETRv2-x en yüksek mAP'ye ulaşır, ancak bu, YOLOv7x'e kıyasla daha fazla parametre, daha yüksek FLOP'lar ve daha yavaş çıkarım hızı pahasına gelir. YOLOv7, hem yüksek hız hem de güçlü doğruluk gerektiren uygulamalar için güçlü bir rakip olmasını sağlayan daha dengeli bir profil sunar.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
RTDETRv2-s | 640 | 48.1 | - | 5.03 | 20 | 60 |
RTDETRv2-m | 640 | 51.9 | - | 7.51 | 36 | 100 |
RTDETRv2-l | 640 | 53.4 | - | 9.76 | 42 | 136 |
RTDETRv2-x | 640 | 54.3 | - | 15.03 | 76 | 259 |
Neden Ultralytics YOLO Modellerini Seçmelisiniz?
Hem YOLOv7 hem de RT-DETRv2 güçlü modeller olsa da, YOLOv8 ve en son Ultralytics YOLO11 gibi daha yeni Ultralytics YOLO modelleri, daha modern, çok yönlü ve geliştirici dostu bir çözüm sunar.
- Kullanım Kolaylığı: Ultralytics modelleri, basit bir Python API'si, kapsamlı belgelendirme ve basit CLI komutları içeren, kolaylaştırılmış bir kullanıcı deneyimi düşünülerek tasarlanmıştır.
- İyi Yönetilen Ekosistem: Aktif geliştirme, sağlam bir açık kaynak topluluğu, sık güncellemeler ve uçtan uca MLOps için Ultralytics HUB gibi araçlarla sorunsuz entegrasyondan yararlanın.
- Performans Dengesi: Ultralytics modelleri, kenar AI cihazlarından bulut sunucularına kadar çok çeşitli gerçek dünya senaryoları için uygun olmalarını sağlayan hız ve doğruluk arasında mükemmel bir denge sağlar.
- Bellek Verimliliği: Ultralytics YOLO modelleri, verimli bellek kullanımı için optimize edilmiştir. Genellikle bellek yoğun ve eğitilmesi daha yavaş olduğu bilinen RT-DETR gibi transformer tabanlı modellere kıyasla eğitim ve çıkarım için daha az CUDA belleği gerektirirler.
- Çok Yönlülük: YOLOv8 ve YOLO11 gibi modeller, kullanıma hazır nesne tespiti, segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne tespiti (OBB) özelliklerini destekleyen gerçek çoklu görev çerçeveleridir.
- Eğitim Verimliliği: COCO gibi veri kümelerinde kullanıma hazır, önceden eğitilmiş ağırlıklarla verimli eğitim süreçlerinin keyfini çıkarın, bu da daha hızlı yakınsama ve daha kısa geliştirme süresi sağlar.
Sonuç
Hem YOLOv7 hem de RT-DETRv2, her biri farklı avantajlara sahip, zorlu nesne algılama modelleridir. YOLOv7, GPU'larda gerçek zamanlı hız gerektiren uygulamalarda mükemmeldir ve performans ve verimliliğin harika bir dengesini sunar. RT-DETRv2, doğruluğun en önemli olduğu ve otonom sürüşlü araçlarda yapay zeka veya tıbbi görüntüleme analizleri gibi hesaplama kaynaklarının daha az kısıtlayıcı olduğu senaryolar için onu tercih edilen seçenek haline getirerek doğruluğun sınırlarını zorlar.
Ancak, modern, hepsi bir arada bir çözüm arayan geliştiriciler ve araştırmacılar için, YOLOv8 ve YOLO11 gibi Ultralytics modelleri genellikle en çekici seçeneği sunar. Son teknoloji performansı, olağanüstü kullanım kolaylığı, daha düşük bellek gereksinimleri, çoklu görev yönlülüğü ve kapsamlı, iyi desteklenen bir ekosistemi birleştirerek, onları çok çeşitli bilgisayarlı görü projeleri için ideal bir seçim haline getirir.
Diğer Model Karşılaştırmaları
Daha fazla inceleme için, YOLOv7, RT-DETR ve diğer önde gelen modelleri içeren bu karşılaştırmaları göz önünde bulundurun:
- YOLOv7 - YOLOv8 karşılaştırması
- YOLOv7 - YOLOv5 karşılaştırması
- RT-DETR - YOLOv8 Karşılaştırması
- RT-DETR - YOLOX Karşılaştırması
- YOLOv10 ve YOLO11 gibi en son modelleri keşfedin.