DAMO-YOLO ve YOLOv5: Ayrıntılı Teknik Karşılaştırma
Doğru nesne algılama modelini seçmek, doğruluk, hız ve uygulama kolaylığı arasında bir denge kuran kritik bir karardır. Bu sayfa, Alibaba Group'tan doğruluğa odaklanan bir model olan DAMO-YOLO ile olağanüstü performans ve kullanılabilirlik karışımıyla ünlü bir endüstri standardı model olan Ultralytics YOLOv5 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilgisayar görüşü projeniz için en iyi modeli seçmenize yardımcı olmak için mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını inceleyeceğiz.
DAMO-YOLO: Doğruluğa Odaklı Algılama
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arşiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Belgelendirme: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO, Alibaba Group tarafından geliştirilen bir nesne algılama modelidir. 2022'nin sonlarında tanıtılan bu model, mimarisine çeşitli yeni teknikler dahil ederek yüksek doğruluk ve verimli çıkarım arasında üstün bir denge sağlamaya odaklanır.
Mimari ve Temel Özellikler
DAMO-YOLO, algılama doğruluğunun sınırlarını zorlamak için tasarlanmış çeşitli yenilikçi bileşenler sunar:
- NAS Backbone'leri: Nesne algılama için özel olarak tasarlanmış, yüksek verimli backbone ağlarını keşfetmek ve uygulamak için Sinirsel Mimari Arama'yı (NAS) kullanır.
- Verimli RepGFPN: Model, farklı ölçeklerde gelişmiş özellik kaynaştırması için gelişmiş bir katman modülü olan Yeniden Parametrelendirilmiş Gradyan Özellik Piramidi Ağı kullanır.
- ZeroHead: Yüksek performansı korurken hesaplama yükünü en aza indirmek için tasarlanmış ayrıştırılmış bir algılama başlığına sahiptir.
- AlignedOTA: Bu yeni etiket atama stratejisi olan Hizalanmış Optimal Transport Atama, eğitim sırasında tahminler ve temel doğruluk etiketleri arasında daha iyi hizalama sağlayarak doğruluğun artmasına yol açar.
- Damıtma İyileştirmesi: Model, daha büyük, daha güçlü bir öğretmen modelinden daha küçük öğrenci modeline bilgi aktarmak için bilgi damıtma yöntemini kullanır ve performansını artırır.
Güçlü Yönler
- Yüksek Doğruluk: DAMO-YOLO, özellikle daha büyük model varyantlarıyla mükemmel algılama doğruluğunu gösteren güçlü mAP skorlarına ulaşır.
- Yenilikçi Teknikler: AlignedOTA ve RepGFPN gibi yeni yöntemlerin entegrasyonu, daha standart mimarilerin ötesinde performansı artırmasına olanak tanır.
Zayıflıklar
- Entegrasyon Karmaşıklığı: DAMO-YOLO'yu mevcut iş akışlarına entegre etmek daha karmaşık olabilir, özellikle Ultralytics ekosistemi içinde sunulan akıcı deneyimle karşılaştırıldığında.
- Ekosistem Desteği: Mevcut olmasına rağmen, dokümantasyonu ve topluluk desteği, köklü ve aktif olarak sürdürülen YOLOv5'in dokümantasyonundan ve topluluk desteğinden daha az kapsamlı olabilir.
- Görev Çok Yönlülüğü: DAMO-YOLO öncelikle nesne algılamaya odaklanmıştır ve potansiyel olarak Ultralytics modellerinde bulunan segmentasyon veya sınıflandırma gibi diğer görevler için yerleşik desteği yoktur.
Kullanım Alanları
DAMO-YOLO, yüksek tespit doğruluğunun temel gereksinim olduğu uygulamalar için çok uygundur:
- Yüksek Hassasiyetli Uygulamalar: Tıbbi görüntüleme ve bilimsel araştırma gibi ayrıntılı görüntü analizleri.
- Karmaşık Senaryolar: Nesnelerin yoğun şekilde tıkandığı veya sahnenin derinlemesine anlaşılmasını gerektiren ortamlar.
- Araştırma ve Geliştirme: Gelişmiş nesne algılama mimarilerini ve tekniklerini araştıran araştırmacılar için değerli bir araçtır.
DAMO-YOLO hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Yerleşik Endüstri Standardı
Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Belgeleme: https://docs.ultralytics.com/models/yolov5/
Ultralytics YOLOv5, piyasaya sürülmesinden sonra hızla bir endüstri ölçütü haline geldi ve olağanüstü hız, doğruluk ve dikkate değer kullanım kolaylığı dengesiyle kutlandı. Tamamen PyTorch ile geliştirilen YOLOv5, etkili özellik toplama için bir CSPDarknet53 backbone'u bir PANet boynuyla birleştiren sağlam bir mimariye sahiptir. Çeşitli model boyutları (n, s, m, l, x) aracılığıyla sunulan ölçeklenebilirliği, geliştiricilerin özel hesaplama ve performans ihtiyaçları için mükemmel dengeyi seçmelerine olanak tanır.
Güçlü Yönler
- Olağanüstü Hız ve Verimlilik: YOLOv5, hızlı çıkarım için son derece optimize edilmiştir ve bu da onu güçlü bulut GPU'larından kaynak kısıtlı uç cihazlara kadar çok çeşitli donanımlarda gerçek zamanlı uygulamalar için en iyi seçenek haline getirir.
- Kullanım Kolaylığı: YOLOv5'in temel avantajı, kolaylaştırılmış kullanıcı deneyimidir. Basit Python ve CLI arayüzleri, kapsamlı dokümantasyon ve basit bir kurulum süreci sunar.
- İyi Yönetilen Ekosistem: YOLOv5, aktif geliştirme, büyük ve yardımsever bir topluluk, sık güncellemeler ve kodsuz eğitim ve MLOps için Ultralytics HUB gibi araçlarla sorunsuz entegrasyonu içeren sağlam Ultralytics ekosistemi tarafından desteklenmektedir.
- Performans Dengesi: Çıkarım hızı ve tespit doğruluğu arasında mükemmel bir denge kurarak, çeşitli gerçek dünya dağıtım senaryoları için oldukça pratik hale getirir.
- Çok Yönlülük: YOLOv5, nesne algılamanın ötesinde, örnek segmentasyonunu ve görüntü sınıflandırmasını da destekleyerek çok amaçlı bir çözüm sunar.
- Eğitim Verimliliği: YOLOv5, verimli eğitim süreçleri, kolayca erişilebilen önceden eğitilmiş ağırlıklar sağlar ve genellikle birçok rakip mimariden daha az bellek gerektirir.
Zayıflıklar
- Doğruluk: Oldukça doğru olmasına rağmen, daha yeni modeller o zamandan beri YOLOv5'in COCO gibi standart kıyaslamalardaki mAP skorlarını aşmıştır.
- Anchor Tabanlı: Önceden tanımlanmış anchor kutularına dayanması, anchor'suz yaklaşımlara kıyasla alışılmadık nesne en boy oranlarına sahip veri kümeleri için ek ayarlama gerektirebilir.
Kullanım Alanları
YOLOv5, hız, verimlilik ve dağıtım kolaylığının kritik olduğu senaryolarda öne çıkar:
- Güvenlik Sistemleri: Hırsızlık önleme ve anomali tespiti gibi uygulamalar için gerçek zamanlı izleme.
- Robotik: Robotların çevrelerini gerçek zamanlı olarak algılamasını ve onlarla etkileşim kurmasını sağlayarak otonom navigasyon ve manipülasyon için çok önemlidir.
- Endüstriyel Otomasyon: Üretim süreçlerinde kalite kontrol ve kusur tespiti, geri dönüşüm verimliliğini ve üretim hattı izlemesini iyileştirme.
- Uç Yapay Zeka Dağıtımı: Cihaz üzerinde işleme için Raspberry Pi ve NVIDIA Jetson gibi kaynak sınırlı cihazlarda nesne algılamayı verimli bir şekilde çalıştırma.
YOLOv5 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
DAMO-YOLO ve YOLOv5'i karşılaştırırken, doğruluk ve hız arasında net bir ödünleşim ortaya çıkar. DAMO-YOLO modelleri genellikle daha yüksek mAP puanları elde ederek, saf algılama doğruluğundaki güçlerini gösterir. Bununla birlikte, YOLOv5 modelleri, özellikle daha küçük varyantlar, özellikle CPU donanımında önemli ölçüde daha hızlı çıkarım hızları sunar. Bu, YOLOv5'i düşük gecikmenin önemli olduğu gerçek zamanlı uygulamalar için daha pratik bir seçim haline getirir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Sonuç
Hem DAMO-YOLO hem de Ultralytics YOLOv5 güçlü nesne algılama modelleridir, ancak farklı önceliklere hitap ederler. DAMO-YOLO, mümkün olan en yüksek doğruluğu elde etmenin ana hedef olduğu ve geliştiricilerin daha karmaşık entegrasyonlarla başa çıkmaya istekli olduğu uygulamalar için mükemmel bir seçimdir.
Ancak, geliştiricilerin ve gerçek dünya uygulamalarının büyük çoğunluğu için Ultralytics YOLOv5 daha çekici ve pratik bir çözüm sunuyor. Hız ve doğruluk arasındaki olağanüstü denge, benzersiz Kullanım Kolaylığı ile birleştiğinde, ona inanılmaz derecede erişilebilir kılıyor. İyi Yönetilen Ekosistem, sağlam dokümantasyon, aktif topluluk desteği ve Ultralytics HUB gibi güçlü araçlar sunarak önemli bir avantaj sağlıyor. YOLOv5'in Eğitim Verimliliği ve birden fazla görüntü işleme görevindeki Çok Yönlülüğü, onu hızlı prototiplemeden üretim dağıtımına kadar uzanan projeler için son derece verimli ve geliştirici dostu bir seçim haline getiriyor.
En son gelişmelerle ilgilenenler için, YOLOv8 ve YOLO11 gibi daha yeni Ultralytics modelleri, YOLOv5'in güçlü yönlerini temel alarak daha da iyi performans ve daha fazla özellik sunar.
Diğer Model Karşılaştırmaları
Daha fazla keşif için, DAMO-YOLO, YOLOv5 ve diğer ilgili modelleri içeren bu karşılaştırmaları göz önünde bulundurun:
- DAMO-YOLO - YOLOv8 karşılaştırması
- YOLOv5 - YOLOv7 Karşılaştırması
- YOLOv5 - YOLOv8 Karşılaştırması
- YOLOv5 - YOLOv9 Karşılaştırması
- RT-DETR - YOLOv5 Karşılaştırması
- EfficientDet - YOLOv5 Karşılaştırması
- YOLOv10 ve YOLO11 gibi en son modelleri keşfedin.