YOLOv8 - DAMO-YOLO Karşılaştırması: Teknik Bir İnceleme
Doğru nesne algılama modelini seçmek, doğruluk, hız ve kullanım kolaylığı arasında bir denge kurmayı içerir. Bu sayfa, iki güçlü model arasında ayrıntılı bir teknik karşılaştırma sunmaktadır: Ultralytics'in son teknoloji ürünü bir modeli olan Ultralytics YOLOv8 ve Alibaba Group'un yüksek performanslı bir modeli olan DAMO-YOLO. Her iki model de mükemmel performans sunsa da, farklı tasarım felsefeleri üzerine inşa edilmişlerdir ve farklı geliştirme ihtiyaçlarına hitap etmektedirler. Bilinçli bir karar vermenize yardımcı olmak için mimarilerini, performans metriklerini ve ideal kullanım durumlarını inceleyeceğiz.
Ultralytics YOLOv8
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8, önceki YOLO sürümlerinin başarısı üzerine inşa edilmiş, son teknoloji ürünü bir modeldir. Hızlı, doğru ve kullanımı kolay olacak şekilde tasarlanmıştır, bu da onu çok çeşitli nesne algılama ve yapay görme görevleri için ideal bir seçim haline getirir. YOLOv8 sadece bir model değil, aynı zamanda eğitim ve doğrulamadan gerçek dünya uygulamalarında dağıtıma kadar yapay zeka modeli geliştirmenin tüm yaşam döngüsünü destekleyen kapsamlı bir çerçevedir.
Temel Özellikler ve Güçlü Yönler
-
Gelişmiş Mimari: YOLOv8, doğruluğu artıran ve bazı durumlarda Maksimum Olmayan Bastırma (NMS) ihtiyacını ortadan kaldırarak işlem sonrası hızı artıran, anchor'suz, ayrıştırılmış bir başlık tasarımı sunar. Gelişmiş özellik kaynaştırma için iyileştirilmiş bir CSPDarknet backbone ve yeni bir C2f boyun modülü kullanır.
-
Olağanüstü Çok Yönlülük: YOLOv8'in temel bir avantajı, tek, birleşik bir çerçeve içinde birden çok görme görevine yerel desteğidir. Nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş nesne algılamayı (OBB) sorunsuz bir şekilde yönetir. Bu çok yönlülük, onu karmaşık bilgisayarlı görü projeleri için tek duraklı bir çözüm haline getirir.
-
Kullanım Kolaylığı: Ultralytics, geliştirici deneyimine öncelik verir. YOLOv8, kapsamlı belgelendirme ve öğreticilerle desteklenen basit ve sezgisel bir Python API'si ve güçlü bir CLI ile birlikte gelir. Bu, hem yeni başlayanların hem de uzmanların modelleri eğitmesini, doğrulamasını ve dağıtmasını inanılmaz derecede kolaylaştırır.
-
İyi Yönetilen Ekosistem: YOLOv8, aktif geliştirme, sık güncellemeler ve güçlü topluluk desteği ile gelişen bir açık kaynak ekosisteminin parçasıdır. Kodsuz eğitim ve dağıtım için Ultralytics HUB ve Weights & Biases ve Comet gibi çok sayıda MLOps platformu gibi araçlarla entegre olur.
-
Performans ve Verimlilik: YOLOv8, bir dizi model boyutu (Nano'dan Ekstra Büyük'e kadar) genelinde hız ve doğruluk arasında mükemmel bir denge sunar. Uç cihazlardan bulut sunucularına kadar çeşitli donanımlarda verimli dağıtım sağlayarak hem CPU hem de GPU çıkarımı için yüksek oranda optimize edilmiştir. Ayrıca, diğer birçok mimariye kıyasla eğitim için daha az CUDA belleği gerektiren bellek verimliliği için tasarlanmıştır.
Zayıflıklar
- Tek aşamalı bir tespit aracı olarak, çoğu genel amaçlı senaryoda olağanüstü iyi performans göstermesine rağmen, bazı özel iki aşamalı tespit araçlarına kıyasla aşırı küçük veya yoğun şekilde örtüşen nesneleri tespit etmede zorluklarla karşılaşabilir.
YOLOv8 hakkında daha fazla bilgi edinin
DAMO-YOLO
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arşiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
DAMO-YOLO, Alibaba Group tarafından geliştirilen hızlı ve doğru bir nesne algılama modelidir. YOLO tarzı dedektörlerin performansını artırmak için çeşitli yeni teknikler sunar. "DAMO" adı, projenin araştırma odaklı doğasını yansıtan "Keşif, Macera, Momentum ve Bakış Açısı" anlamına gelir.
Temel Özellikler ve Güçlü Yönler
- Sinirsel Mimari Arama (NAS): DAMO-YOLO, doğruluk ve gecikme süresi arasında daha iyi bir denge sağlamaya yardımcı olan optimum bir backbone mimarisi (MAE-NAS) bulmak için NAS'tan yararlanır.
- Gelişmiş Boyun Tasarımı: Backbone'un farklı seviyelerinden özellik kaynaştırmayı geliştirmek için tasarlanmış verimli bir RepGFPN (Genelleştirilmiş Özellik Piramit Ağı) boynu içerir.
- ZeroHead: DAMO-YOLO, yüksek performansı korurken hesaplama yükünü azaltmak için hafif, birleşik bir başlık kullanan bir "ZeroHead" yaklaşımı önermektedir.
- AlignedOTA Etiket Atama: Eğitim sırasında sınıflandırma ve regresyon görevlerini hizalayarak modelin daha iyi öğrenmesine yardımcı olan AlignedOTA adlı dinamik bir etiket atama stratejisi kullanır.
- Yüksek GPU Performansı: Model, GPU çıkarımı için son derece optimize edilmiştir ve resmi kıyaslama testlerinde gösterildiği gibi, üst düzey donanımda çok düşük gecikme süresi sağlar.
Zayıflıklar
- Karmaşıklık: NAS ve özel modüller (RepGFPN, ZeroHead) gibi gelişmiş tekniklerin kullanılması, modeli özelleştirmesi veya modelin iç işleyişini anlaması gereken geliştiriciler için mimariyi daha karmaşık ve daha az sezgisel hale getirir.
- Sınırlı Çok Yönlülük: DAMO-YOLO öncelikle nesne tespiti için tasarlanmıştır. Ultralytics YOLOv8 çerçevesinde standart olan segmentasyon, sınıflandırma ve poz tahmini için yerleşik, çoklu görev desteği yoktur.
- Ekosistem ve Destek: Açık kaynaklı bir proje olmasına rağmen, ekosistemi Ultralytics'inki kadar kapsamlı veya iyi yönetilmemektedir. Belgeler yetersiz olabilir ve topluluk desteği daha az kapsamlıdır, bu da geliştiricilerin benimsemesini ve sorun gidermesini zorlaştırır.
- CPU Performansı: Model, GPU için büyük ölçüde optimize edilmiştir. CPU performansı ile ilgili bilgi ve kıyaslamalar daha az bulunur; bu da GPU olmayan donanımlardaki dağıtımlar için bir sınırlama olabilir.
DAMO-YOLO hakkında daha fazla bilgi edinin
Performans Analizi: YOLOv8 - DAMO-YOLO Karşılaştırması
Performansı karşılaştırırken, farklı donanımlarda hem doğruluğa (mAP) hem de çıkarım hızına bakmak çok önemlidir.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Tablodan şu sonuçları çıkarabiliriz:
- Doğruluk: YOLOv8 modelleri, benzer ölçeklerdeki DAMO-YOLO muadillerinden sürekli olarak daha iyi performans gösterir. Örneğin, YOLOv8m, DAMO-YOLOm'nin 49.2 mAP'sini aşarak 50.2 mAP'ye ulaşır. Daha büyük YOLOv8l ve YOLOv8x modelleri bu farkı önemli ölçüde artırır.
- Hız: DAMO-YOLO çok rekabetçi GPU hızları gösterse de, YOLOv8n genel olarak GPU'da en hızlı modeldir. En önemlisi, Ultralytics, GPU kaynaklarının kullanılamadığı birçok gerçek dünya uygulaması için hayati önem taşıyan şeffaf CPU kıyaslamaları sağlar. YOLOv8, CPU'larda mükemmel, iyi belgelenmiş bir performans sergiler.
- Verimlilik: YOLOv8 modelleri genellikle belirli doğrulukları için daha iyi bir parametre ve FLOP dengesi sunar. Örneğin, YOLOv8s, yalnızca 11.2M parametre ile 44.9 mAP elde ederken, DAMO-YOLOs benzer bir 46.0 mAP'ye ulaşmak için 16.3M parametre gerektirir.
Sonuç
DAMO-YOLO, GPU donanımında yüksek performans elde etmek için NAS gibi gelişmiş araştırma tekniklerinin gücünü sergileyen etkileyici bir modeldir. Ham GPU hızının birincil metrik olduğu ve geliştirme ekibinin daha karmaşık bir mimariyi yönetme uzmanlığına sahip olduğu uygulamalar için güçlü bir rakiptir.
Ancak, geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için Ultralytics YOLOv8 açık ve üstün seçimdir. Daha iyi bir genel paket sunar: daha yüksek doğruluk, hem CPU hem de GPU'da mükemmel performans ve çoklu görev desteği ile benzersiz çok yönlülük.
Ultralytics ekosisteminin kullanım kolaylığı, kapsamlı dokümantasyon, aktif topluluk desteği ve sorunsuz entegrasyonlar dahil olmak üzere temel avantajları, YOLOv8'i yalnızca güçlü bir model değil, aynı zamanda sağlam, gerçek dünya bilgisayar görüşü çözümleri oluşturmak için pratik ve üretken bir araç haline getirir. İster ilk projenize başlayan bir acemi, ister karmaşık sistemler dağıtan bir uzman olun, YOLOv8 başarıya daha güvenilir, verimli ve kullanıcı dostu bir yol sunar.
Diğer Modelleri İnceleyin
Diğer model karşılaştırmalarıyla ilgileniyorsanız, YOLOv8'in diğer son teknoloji mimarilere karşı nasıl bir performans sergilediğini görmek için aşağıdaki sayfalara göz atın:
- YOLOv8 - YOLOv9 karşılaştırması
- YOLOv8 - YOLOv7 karşılaştırması
- YOLOv8 - RT-DETR karşılaştırması
- YOLOv8 - YOLOv10 karşılaştırması
- YOLOv8 - YOLO11 karşılaştırması