DAMO-YOLO - YOLOv8 Karşılaştırması: Teknik Derinlemesine İnceleme
Nesne tespiti alanı sürekli olarak gelişiyor ve araştırmacılar ve mühendisler hız, doğruluk ve hesaplama verimliliğinin rekabet eden taleplerini dengelemeye çalışıyor. Bilgisayar görüşü topluluğunda önemli dalgalar yaratan iki önemli mimari, Alibaba Group tarafından geliştirilen DAMO-YOLO ve Ultralytics tarafından oluşturulan YOLOv8'dir.
Bu teknik karşılaştırma, her iki modelin mimari yeniliklerini, performans metriklerini ve pratik kullanılabilirliğini inceler. DAMO-YOLO, Neural Architecture Search (NAS) gibi yeni araştırma konseptlerini tanıtırken, Ultralytics YOLOv8, eğitimden dağıtıma kadar iş akışını kolaylaştıran sağlam, kullanıcı dostu bir ekosistem sunmaya odaklanır.
Performans Analizi: Hız ve Doğruluk
Bu modellerin gerçek dünya senaryolarında nasıl karşılaştırıldığını anlamak için, standart COCO veri kümesi üzerindeki performanslarını analiz ediyoruz. Aşağıdaki metrikler, ortalama Kesinlik (mAP), farklı donanımlardaki çıkarım hızı ve model karmaşıklığı arasındaki ödünleşimleri vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Temel Çıkarımlar
Veriler, dağıtım hedefine bağlı olarak farklı avantajlar ortaya koymaktadır:
- Uç Performansı: YOLOv8n (Nano) modeli, kaynak kısıtlı ortamlar için tartışmasız liderdir. Yalnızca 3,2M parametre ve 8,7B FLOP ile hem CPU hem de GPU'da en hızlı çıkarım hızlarına ulaşır. Bu, onu bellek ve gücün kıt olduğu mobil uygulamalar veya IoT cihazları için ideal kılar.
- En Yüksek Doğruluk: Hassasiyetin çok önemli olduğu uygulamalar için YOLOv8x, %53,9'luk en yüksek mAP'ye ulaşır. DAMO-YOLO modelleri iyi performans gösterse de, en büyük YOLOv8 varyantı detect doğruluk sınırını daha da zorlar.
- Gecikme Takasları: DAMO-YOLO, NAS ile optimize edilmiş backbone'u sayesinde özel GPU'larda (T4 gibi) etkileyici bir verim sergiler. Ancak, Ultralytics YOLOv8, CPU'lar dahil olmak üzere daha geniş bir donanım yelpazesinde üstün bir denge sağlayarak daha geniş bir dağıtım esnekliği sağlar.
DAMO-YOLO: Araştırma Odaklı İnovasyon
DAMO-YOLO, Alibaba Group'un araştırma girişimlerinin bir ürünüdür. Adı, yeni mimari sınırları keşfetmeye odaklanmayı yansıtan "Keşif, Macera, Momentum ve Bakış Açısı" anlamına gelir.
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:2211.15444v2
GitHub:tinyvision/DAMO-YOLO
Mimari Öne Çıkanlar
DAMO-YOLO, gecikme ve doğruluk arasındaki dengeyi optimize etmek için çeşitli gelişmiş teknolojileri entegre eder:
- MAE-NAS Backbone: Verimli ağ yapılarını otomatik olarak keşfetmek için Sinirsel Mimari Arama (NAS) kullanır ve özellikle MAE-NAS adı verilen bir yöntem kullanır.
- RepGFPN Katmanı: Farklı ölçek seviyeleri arasındaki bilgi akışını en üst düzeye çıkarmak ve farklı mesafelerdeki nesnelerin detection'ını iyileştirmek için yoğun şekilde parametrelendirilmiş bir Genelleştirilmiş Özellik Piramidi Ağı (GFPN) kullanılır.
- ZeroHead: Ağır neck'i dengelemek için model, son detect aşamasındaki hesaplama yükünü azaltan hafif bir "ZeroHead" kullanır.
- AlignedOTA: Eğitim sırasında sınıflandırma ve regresyon görevlerini hizalayan, modelin daha etkili bir şekilde yakınsamasına yardımcı olan dinamik bir etiket atama stratejisidir.
DAMO-YOLO hakkında daha fazla bilgi edinin
Ultralytics YOLOv8: Ekosistem Standardı
YOLOv8, kullanılabilirlik, çok yönlülük ve en son teknoloji performansına odaklanan YOLO mimarisinin bir iyileştirmesini temsil eder. Saf araştırma modellerinden farklı olarak YOLOv8, geliştiriciler için bir ürün olarak tasarlanmıştır ve iyi yönetilen bir ekosisteme ve entegrasyon kolaylığına vurgu yapar.
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2023-01-10
Belgeler:Ultralytics YOLOv8
Mimari Güçlü Yönler
- Çapa Olmayan Algılama: YOLOv8, çapa kutularını ortadan kaldırarak geliştiricilerin ayarlaması gereken hiperparametre sayısını azaltır ve eğitim sürecini basitleştirir.
- C2f Modülü: Mimari, C3 modülünü C2f ile değiştirerek, hafif bir ayak izini korurken daha zengin gradyan akışı bilgileri sunar.
- Ayrıştırılmış Kafa (Decoupled Head): Model, kafadaki sınıflandırma ve regresyon görevlerini ayırarak daha yüksek yerelleştirme doğruluğu elde eder.
- Birleşik Çerçeve: Belki de en güçlü mimari özelliği, birden fazla görme görevine—örnek segmentasyonu, poz tahmini, sınıflandırma ve yönlendirilmiş nesne algılama (OBB)—tek bir kod tabanı içinde yerel desteğidir.
Biliyor muydunuz?
Ultralytics, modelleri ONNX, TensorRT, CoreML ve OpenVINO gibi optimize edilmiş formatlara aktarmak için sorunsuz bir yol sağlar. Bu dışa aktarma özelliği, eğitilmiş modellerinizin neredeyse her donanım platformunda verimli bir şekilde çalışabilmesini sağlar.
YOLOv8 hakkında daha fazla bilgi edinin
Kullanılabilirlik ve Geliştirici Deneyimi
İki model arasındaki en önemli fark, kullanım kolaylığı ve çevreleyen ekosistemde yatmaktadır.
Ultralytics YOLO modelleri, "sıfırdan zirveye" deneyimiyle ünlüdür. Basit bir PIP kurulumuyla, geliştiriciler güçlü bir CLI ve Python API'sine erişebilir. Bu, genellikle karmaşık ortam kurulumları gerektiren araştırma depolarına kıyasla giriş engelini önemli ölçüde azaltır.
Eğitim Verimliliği
Ultralytics modelleri eğitim verimliliği için tasarlanmıştır. CUDA belleğini verimli bir şekilde kullanarak, daha büyük yığın boyutlarına veya tüketici sınıfı GPU'larda eğitime olanak tanırlar. Ayrıca, yüksek kaliteli önceden eğitilmiş ağırlıkların kullanılabilirliği, yakınsamayı hızlandırarak değerli işlem süresinden ve enerjiden tasarruf sağlar.
İşte sadece üç satır Python koduyla bir YOLOv8 modelini yükleyip tahmin yapmanın eksiksiz, çalıştırılabilir bir örneği:
from ultralytics import YOLO
# Load a pre-trained YOLOv8n model
model = YOLO("yolov8n.pt")
# Run inference on an image (automatically downloads image if needed)
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Show the results
for result in results:
result.show()
Aksine, DAMO-YOLO güçlü performans sunarken, genellikle daha fazla manuel yapılandırma ve araştırma odaklı çerçevelere aşinalık gerektirir, bu da onu hızlı prototipleme veya ticari entegrasyon için daha az erişilebilir hale getirir.
Sonuç: Doğru Aracı Seçmek
Hem DAMO-YOLO hem de YOLOv8, bilgisayar görüşünde olağanüstü başarılardır.
DAMO-YOLO, Neural Architecture Search ile ilgilenen ve özellikle özel omurgasının tam olarak optimize edildiği donanımlara dağıtım yapan araştırmacılar için mükemmel bir seçimdir.
Ancak, çoğu geliştirici, araştırmacı ve kuruluş için Ultralytics YOLOv8 (ve daha yeni YOLO11) üstün bir değer önerisi sunar:
- Çeşitlilik: Tek bir çerçevede Detect, Segmentasyon, Poz ve OBB işleyebilir.
- Kullanım Kolaylığı: Eşsiz dokümantasyon, basit API ve güçlü topluluk desteği.
- Dağıtım: Dışa aktarma modları için kapsamlı destek, cep telefonlarından bulut sunucularına kadar her şeyi kapsar.
- Performans Dengesi: Özellikle CPU ve Uç cihazlarda mükemmel doğruluk-hız oranı.
En son teknolojide kalmak isteyenler için, YOLOv8'in güçlü yönleri üzerine inşa edilmiş, daha da yüksek verimlilik ve doğruluk sunan YOLO11'i de incelemenizi öneririz.
Diğer Model Karşılaştırmalarını İnceleyin
Bilgisayar görüşü projeleriniz için en bilinçli kararı vermenize yardımcı olmak için, bu ek ayrıntılı karşılaştırmaları inceleyin:
- YOLO11 ve DAMO-YOLO
- RT-DETR - YOLOv8 Karşılaştırması
- YOLOv8 - YOLOv9 karşılaştırması
- YOLOv8 - YOLOv10 karşılaştırması
- YOLOv5 - DAMO-YOLO