İçeriğe geç

DAMO-YOLO ve YOLOv8: Teknik Bir Karşılaştırma

Doğru nesne algılama modelini seçmek, doğruluk, hız ve uygulama kolaylığı arasında bir denge kuran kritik bir karardır. Bu sayfa, Alibaba Group'tan yüksek performanslı bir model olan DAMO-YOLO ile çok yönlülüğü ve sağlam ekosistemi ile bilinen son teknoloji bir model olan Ultralytics YOLOv8 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilgisayar görüşü projeniz için en iyi modeli seçmenize yardımcı olmak için mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını inceleyeceğiz.

DAMO-YOLO: Alibaba'dan Hızlı ve Doğru Bir Yöntem

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arşiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Belgeler: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

Mimari ve Temel Özellikler

DAMO-YOLO, Alibaba'nın araştırmasından ortaya çıkan ve hız-doğruluk ödünleşiminin sınırlarını zorlamak için çeşitli yenilikçi teknikler sunan güçlü bir nesne dedektörüdür. Mimarisi, Neural Architecture Search (NAS)'ü gelişmiş tasarım ilkeleriyle birleştiren kapsamlı bir yaklaşımın sonucudur.

  • NAS Destekli Backbone: DAMO-YOLO, nesne algılama için özel olarak tasarlanmış, yüksek verimli özellik çıkarma yapılarını keşfetmesini sağlayan, NAS aracılığıyla oluşturulan bir backbone kullanır.
  • Verimli RepGFPN Katmanı: Minimum hesaplama yükü ile özellik kaynaştırmasını iyileştirmek için yeniden parametrelendirme teknikleriyle geliştirilmiş, Genelleştirilmiş Özellik Piramidi Ağı (GFPN) olan yeni bir katman yapısı sunar.
  • ZeroHead: Model, yüksek performansı korurken hesaplama karmaşıklığını azaltan ZeroHead adlı hafif, bağlantısız bir algılama başlığı kullanır.
  • AlignedOTA Etiket Atama: Pozitif örnekleri uygun temel doğruluk nesneleriyle daha iyi hizalayarak eğitim kararlılığını ve model doğruluğunu iyileştiren AlignedOTA adlı gelişmiş bir etiket atama stratejisi kullanır.
  • Bilgi Damıtımı: DAMO-YOLO ailesindeki daha büyük modeller, performansı daha da artırmak için bilgi damıtımı yoluyla geliştirilir.

DAMO-YOLO hakkında daha fazla bilgi edinin

Güçlü Yönler

  • GPU'da Yüksek Doğruluk ve Hız: DAMO-YOLO, GPU donanımı için yüksek düzeyde optimize edilmiştir ve mAP ile çıkarım hızı arasında mükemmel bir denge sağlayarak, GPU performansının kritik olduğu uygulamalar için güçlü bir adaydır.
  • Yenilikçi Mimari: NAS kullanımı ve RepGFPN ve ZeroHead gibi özel bileşenleri, gelişmiş araştırmaları sergiler ve yüksek verimli bir mimari sağlar.

Zayıflıklar

  • Sınırlı Ekosistem: Ultralytics YOLO ile karşılaştırıldığında, DAMO-YOLO etrafındaki ekosistem daha az gelişmiştir. Uçtan uca iş akışını basitleştiren kapsamlı dokümantasyon, eğitimler ve Ultralytics HUB gibi entegre araçlardan yoksundur.
  • Görev Özgüllüğü: DAMO-YOLO öncelikli olarak nesne algılama için tasarlanmıştır. Aynı çerçeve içinde segmentasyon, poz tahmini veya sınıflandırma gibi diğer görme görevleri için yerel destek sunmaz.
  • Topluluk ve Destek: Değerli bir açık kaynak katkısı olmasına rağmen, Ultralytics YOLO serisiyle aynı düzeyde aktif topluluk desteğine veya sık güncellemelere sahip değildir.

Ultralytics YOLOv8: Çok Yönlülük ve Performans

Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/

Mimari ve Temel Özellikler

Ultralytics YOLOv8, önceki YOLO sürümlerinin başarısı üzerine inşa edilmiş son teknoloji bir modeldir. Hızlı, doğru ve inanılmaz derecede kullanımı kolay olacak şekilde tasarlanırken, aynı zamanda çeşitli bilgisayarlı görü görevleri için birleşik bir çerçeve sağlar.

  • Gelişmiş CSPDarknet Backbone: YOLOv8, daha iyi performans için özellik çıkarımı sürecini optimize eden gelişmiş bir CSPDarknet backbone kullanır.
  • C2f Neck: Boynunda, YOLOv5'teki C3 modülünün yerini alan ve daha verimli özellik kaynaştırmayı sağlayan C2f modülünü içerir.
  • Anchor'sız Ayrıştırılmış Başlık: DAMO-YOLO gibi, YOLOv8 de anchor'sızdır, bu da eğitim sırasında eşleştirme sürecini basitleştirir. Ayrıştırılmış başlığı, sınıflandırma ve regresyon görevlerini ayırarak genel model doğruluğunu artırır.

YOLOv8 hakkında daha fazla bilgi edinin

Güçlü Yönler

  • Kullanım Kolaylığı: YOLOv8, kullanıcı dostu tasarımıyla ünlüdür. Kolaylaştırılmış bir Python API'si ve CLI'ı ile geliştiriciler, yalnızca birkaç satır kodla modelleri eğitebilir, doğrulayabilir ve dağıtabilir.
  • İyi Yönetilen Ekosistem: Kapsamlı belgelendirme, aktif geliştirme, güçlü topluluk desteği ve kodsuz eğitim ve MLOps için Ultralytics HUB gibi araçlarla sorunsuz entegrasyon içeren kapsamlı Ultralytics ekosistemi tarafından desteklenmektedir.
  • Performans Dengesi: YOLOv8, uç cihazlardan güçlü bulut GPU'larına kadar çeşitli donanımlarda hız ve doğruluk arasında olağanüstü bir denge sunar.
  • Çok Yönlülük: YOLOv8'in temel avantajlarından biri, birden çok göreve yerel desteğidir: nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş nesne algılama (OBB). Bu, onu karmaşık görüntü işleme projeleri için tek durak çözümü haline getirir.
  • Eğitim ve Bellek Verimliliği: YOLOv8 modelleri verimli eğitim için tasarlanmıştır ve genellikle alternatiflere göre daha az CUDA belleği gerektirir. COCO gibi veri kümelerinde önceden eğitilmiş ağırlıkların bulunması, özel model geliştirmeyi hızlandırır.

Zayıflıklar

  • Büyük Modeller İçin Kaynak Gereksinimleri: En büyük model olan YOLOv8x, en yüksek doğruluğu sağlar ancak önemli miktarda hesaplama kaynağı gerektirir; bu, en iyi performans gösteren modeller için yaygın bir ödünleşimdir.

Performans Analizi: Hız ve Doğruluk

COCO veri kümesi üzerinde yapılan doğrudan bir karşılaştırma, DAMO-YOLO ve YOLOv8 arasındaki rekabet ortamını ortaya koymaktadır. Aşağıdaki tablo, performans metriklerini özetlemektedir.

Model boyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Tablodan şu sonuçları çıkarabiliriz:

  • Doğruluk: YOLOv8x, tüm DAMO-YOLO varyantlarından daha iyi performans göstererek %53.9'luk en yüksek mAP'ye ulaşır. Orta boyutlarda, YOLOv8m (50.2 mAP), DAMO-YOLOm'den (49.2 mAP) daha doğrudur. Ancak, DAMO-YOLOs (46.0 mAP), YOLOv8s'yi (44.9 mAP) az farkla geçmektedir.
  • GPU Hızı: Her iki model ailesi de GPU'da son derece hızlıdır. YOLOv8n 1.47 ms ile genel olarak en hızlı olanıdır. DAMO-YOLOt, YOLOv8s'den daha hızlı olan 2.32 ms'de etkileyici bir hız gösterir.
  • CPU Hızı: YOLOv8, birçok uç yapay zeka uygulaması için kritik bir faktör olan CPU çıkarımı için net kıyaslamalar sağlar. DAMO-YOLO için resmi CPU kıyaslamalarının olmaması, CPU ile sınırlı dağıtımlar için değerlendirmeyi zorlaştırır; oysa YOLOv8 bu senaryolarda kendini kanıtlamış bir performans sergiler.
  • Verimlilik: YOLOv8 modelleri genellikle parametreler açısından daha verimlidir. Örneğin, YOLOv8s, karşılaştırılabilir doğruluk sunarken DAMO-YOLOs'den daha az parametreye (11,2M'ye karşı 16,3M) ve FLOP'a (28,6B'ye karşı 37,8B) sahiptir.

Eğitim Metodolojileri ve Kullanılabilirlik

DAMO-YOLO'nun eğitim süreci, yüksek performans elde edebilen ancak yapılandırmak ve ayarlamak için daha derin bir uzmanlık gerektirebilen AlignedOTA ve bilgi damıtma gibi gelişmiş tekniklerden yararlanır.

Aksine, Ultralytics çerçevesi sorunsuz bir kullanıcı deneyimine öncelik verir. YOLOv8 modelini eğitmek, CLI veya python SDK'sı kullanılarak basit bir işlemdir. Çerçeve, karmaşıklığın çoğunu soyutlayarak kullanıcıların verilerine ve uygulama hedeflerine odaklanmasını sağlar. Verimli eğitim süreci, kolayca erişilebilen önceden eğitilmiş ağırlıklar ve hiperparametre ayarlama gibi konularla ilgili kapsamlı kılavuzlarla birleştiğinde, YOLOv8'i hem yeni başlayanlar hem de uzmanlar için erişilebilir hale getirir.

Sonuç: Hangi Modeli Seçmelisiniz?

Hem DAMO-YOLO hem de YOLOv8, son teknolojiyi zorlayan olağanüstü nesne algılama modelleridir.

DAMO-YOLO, ham GPU performansına öncelik veren ve daha çok araştırma odaklı bir çerçevede çalışmaktan rahat olan araştırmacılar ve geliştiriciler için mükemmel bir seçimdir. Yenilikçi mimarisi, özellikle GPU kaynaklarının bol olduğu senaryolarda etkileyici sonuçlar sunar.

Ancak, geliştiricilerin ve uygulamaların büyük çoğunluğu için Ultralytics YOLOv8, üstün bir seçenek olarak öne çıkıyor. Temel avantajları, onu gerçek dünya bilgisayarlı görü çözümleri oluşturmak için daha pratik ve güçlü bir araç haline getiriyor:

  • Rakipsiz Çok Yönlülük: Tek bir çerçevede algılama, segmentasyon, poz, sınıflandırma ve izleme desteği, önemli ölçüde geliştirme süresinden tasarruf sağlar.
  • Üstün Kullanım Kolaylığı: Basit, sezgisel bir API ve kapsamlı belgeler, giriş engelini düşürür ve proje zaman çizelgelerini hızlandırır.
  • Sağlam Ekosistem: Sürekli güncellemeler, güçlü topluluk desteği ve Ultralytics HUB gibi araçlar, tüm yapay zeka yaşam döngüsü için kapsamlı bir ortam sağlar.
  • Dengeli Performans: YOLOv8, hem CPU hem de GPU'da hız ve doğruluğun olağanüstü bir karışımını sunarak çeşitli dağıtım hedefleri için esneklik sağlar.

Sonuç olarak, DAMO-YOLO son teknoloji araştırmaların bir kanıtı olsa da, YOLOv8 daha eksiksiz, kullanıcı dostu ve çok yönlü bir paket sunarak sağlam ve ölçeklenebilir AI çözümleri oluşturmak için önerilen seçimdir.

Diğer Model Karşılaştırmalarını İnceleyin

Bu modellerin diğer önde gelen mimarilere karşı nasıl performans gösterdiğini merak ediyorsanız, bu ek karşılaştırmalara göz atın:



📅 1 yıl önce oluşturuldu ✏️ 1 ay önce güncellendi

Yorumlar