YOLOv8 ve DAMO-YOLO: Nesne Algılama Modellerinin Kapsamlı Teknik Karşılaştırması
Bilgisayarlı görü dünyası sürekli gelişiyor ve yeni mimariler, uç cihazlarda ve büyük bulut kümelerinde nelerin mümkün olduğunun sınırlarını zorluyor. Bu teknik incelemede, öne çıkan iki gerçek zamanlı nesne algılama modelini karşılaştırıyoruz: YOLOv8 ve DAMO-YOLO. ML mühendisleri, mimarilerini, performans metriklerini ve eğitim metodolojilerini inceleyerek dağıtım hatları için bilinçli kararlar verebilirler.
Model Geçmişleri ve Kökenleri
Her iki model de aşağı yukarı aynı zamanda tanıtıldı, ancak farklı tasarım felsefelerinden ve araştırma hedeflerinden kaynaklanıyorlar.
YOLOv8 Detayları
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2023-01-10
- GitHub: Ultralytics GitHub Deposu
- Dokümanlar: YOLOv8 Resmi Dokümantasyonu
YOLOv8 hakkında daha fazla bilgi edin
DAMO-YOLO Detayları
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: DAMO-YOLO Araştırma Makalesi
- GitHub: DAMO-YOLO GitHub Deposu
DAMO-YOLO hakkında daha fazla bilgi edin
Mimari Yenilikler
YOLOv8: Çok Yönlü Çapasız Tasarım
Ultralytics YOLOv8, öncekilere göre önemli iyileştirmeler getirerek son derece güvenilir ve sektör lideri bir model statüsünü sağlamlaştırdı. Kutu tahminlerinin sayısını azaltan ve çıkarımı hızlandıran çapasız bir algılama kafasına sahiptir. Mimari, nesnellik, sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir kafa kullanarak daha doğru sınırlayıcı kutu tahminleri sağlar.
Ayrıca YOLOv8, CIoU kaybıyla birlikte Distribution Focal Loss (DFL) uygulayarak, özellikle daha küçük veya gizlenmiş hedefler için nesne sınırlarını hassas bir şekilde lokalize etme yeteneğini artırır. Sadeleştirilmiş omurgası, hem GPU hem de CPU üzerinde çalıştırılmak üzere yüksek oranda optimize edilmiştir.
DAMO-YOLO: Mimari Arayışıyla Şekillenen Tasarım
DAMO-YOLO farklı bir yaklaşım benimseyerek, omurgasını otomatik olarak tasarlamak için büyük ölçüde Sinirsel Mimari Arayışına (NAS) güvenir. Alibaba ekibi, özellikle TensorRT hızlandırması altında optimum gecikme-doğruluk dengesi sunan yapıları bulmak için "MAE-NAS"ı tanıttı.
Model, verimli özellik füzyonu için bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) ve algılama kafasının hesaplama yükünü en aza indirmek için bir "ZeroHead" tasarımı içerir. Eğitim sırasında, etiket ataması için AlignedOTA'dan yararlanır ve hedef öğrenci modelini denetlemek için daha büyük bir öğretmen modeline ihtiyaç duyan karmaşık bir bilgi damıtma sürecine büyük ölçüde güvenir.
DAMO-YOLO, NAS ve damıtma yoluyla etkileyici gecikme metriklerine ulaşsa da, bu durum YOLOv8'in son derece optimize edilmiş tek aşamalı eğitim hattına kıyasla eğitim sırasında önemli ölçüde daha fazla CUDA belleği ve hesaplama süresi gerektirir.
Performans ve Metrikler
Bilgisayarlı görü modellerini üretime alırken, doğruluk (mAP) ile çıkarım hızını dengelemek kritiktir. Aşağıdaki tablo, her iki modelin farklı boyutlardaki performansını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv8, olağanüstü bir performans dengesi sergiler. YOLOv8n (nano) modeli, DAMO-YOLOt'un 8,5 milyonuna kıyasla yalnızca 3,2 milyon parametre gerektirir, bu da onu mobil cihazlar veya katı bellek gereksinimleri olan ortamlar için çok daha üstün kılar. Ayrıca YOLOv8, bulut tabanlı iş yükleri için son derece hassas YOLOv8x modeline kadar ölçeklenen daha geniş bir boyut yelpazesi sunar.
Geliştirici Deneyimi ve Ekosistemi
Kullanım Kolaylığı ve Eğitim Verimliliği
En büyük ayırt edici faktörlerden biri kullanıcı deneyimidir. Ultralytics ekosistemi, geliştirici hızı için tasarlanmıştır. Özel bir YOLOv8 modelini eğitmek çok düşük bellek kullanımı gerektirir ve birleşik bir Python API veya komut satırı arayüzü aracılığıyla çalıştırılabilir.
Buna karşılık, DAMO-YOLO'nun damıtma ile geliştirilmiş eğitimini yeniden üretmek genellikle karmaşık yapılandırma dosyalarında gezinmeyi ve çok aşamalı öğretmen-öğrenci deney takibini yönetmeyi gerektirir.
İşte Python kullanarak YOLOv8'i eğitmenin, doğrulamanın ve dışa aktarmanın ne kadar basit olduğuna dair bir örnek:
from ultralytics import YOLO
# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")
# Export the trained model to ONNX format
path = model.export(format="onnx")Görü Görevlerinde Çok Yönlülük
DAMO-YOLO kesinlikle sınırlayıcı kutu nesne algılama için oluşturulmuştur. Buna karşılık YOLOv8 mimarisi, birden fazla görevi doğal olarak destekler. Geliştiriciler, yalnızca model ağırlıklarını değiştirerek, temel dağıtım kod tabanlarını değiştirmeden Örnek Segmentasyonu, Görüntü Sınıflandırma ve Poz Tahmini gerçekleştirebilirler. Bu çok yönlülük, Ultralytics modellerini karmaşık uygulamalar için çok daha pratik hale getirir.
Gerçek Dünya Kullanım Durumları
Ne zaman YOLOv8 kullanmalı
YOLOv8'in hız, doğruluk ve dağıtım kolaylığı kombinasyonu onu şunlar için ideal kılar:
- Akıllı Perakende Analitiği: Müşteri davranışını izlemek veya envanter kontrollerini otomatikleştirmek için nesne takibi gerçekleştirme.
- Tarımsal Robotik: Ürünleri veya zararlıları gerçek zamanlı olarak tanımlamak için çeşitli donanımlardaki güçlü performansından yararlanma.
- Sağlık Tanılaması: Tıbbi görüntülerdeki anormallikleri hızlı ve doğru bir şekilde haritalamak için örnek segmentasyonunu kullanma.
- Uç Cihaz Dağıtımları: OpenVINO ve CoreML gibi dışa aktarma formatlarıyla kesintisiz entegrasyon, YOLOv8'in kısıtlı cihazlarda öne çıkmasını sağlar.
Ne zaman DAMO-YOLO kullanmalı
DAMO-YOLO özellikle şu niş senaryolarda faydalı olabilir:
- Akademik NAS Araştırması: Yeniden parametrelendirme veya otomatik mimari tasarım metodolojilerini inceleyen ekipler için.
- Kesinlikle GPU'ya Bağlı Hatlar: NAS yapılarının TensorRT yürütme sınırları için yoğun bir şekilde optimize edildiği, yalnızca belirli NVIDIA donanımlarında çalışan uygulamalar.
Kullanım Durumları ve Öneriler
YOLOv8 ve DAMO-YOLO arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
YOLOv8 Ne Zaman Seçilmeli
YOLOv8 şunlar için güçlü bir seçenektir:
- Çok Yönlü Çoklu Görev Dağıtımı: Ultralytics ekosistemi içinde tespit, segmentasyon, sınıflandırma ve poz tahmini için kanıtlanmış bir model gerektiren projeler.
- Kurulmuş Üretim Sistemleri: Halihazırda YOLOv8 mimarisi üzerine kurulu, kararlı ve iyi test edilmiş dağıtım süreçlerine sahip mevcut üretim ortamları.
- Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından yararlanan uygulamalar.
Ne Zaman DAMO-YOLO Seçilmeli
DAMO-YOLO şunlar için önerilir:
- Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Geleceğe Bakış: Yeni Ultralytics Modelleri
YOLOv8 son derece güvenilir bir iş gücü olmaya devam etse de, bilgisayarlı görü alanı hızla ilerliyor. Kullanıcılar ayrıca daha yeni nesilleri keşfetmeyi düşünmelidir:
YOLO26: En son nesil olan Ultralytics YOLO26, bir paradigma değişimi temsil eder. Non-Maximum Suppression (NMS) sonrası işlemeyle ilişkili gecikme darboğazlarını tamamen ortadan kaldıran, doğal olarak Uçtan Uca NMS-Free Tasarım özelliğini sunar. Yeni MuSGD Optimizer (SGD ve Muon'un bir hibriti) ve özel ProgLoss + STAL kayıp fonksiyonlarıyla desteklenen YOLO26, son derece istikrarlı bir eğitim ve büyük ölçüde iyileştirilmiş küçük nesne tanıma performansı elde eder. DFL Removal (basitleştirilmiş dışa aktarma ve daha iyi uç/düşük güç cihaz uyumluluğu için Distribution Focal Loss kaldırıldı) ile mimari ince ayarlar, önceki nesillere göre %43'e kadar Daha Hızlı CPU Çıkarımı sağlayarak modern uç bilişim için kesin seçim olmasını sağlar.
YOLO11: Bir diğer mükemmel alternatif olan Ultralytics YOLO11, YOLOv8'e göre artımlı mimari iyileştirmeler sunar ve toplulukta güçlü, yoğun bir şekilde benimsenen bir model olmaya devam eder.
Modellerini prototipten üretime taşımaya hazır mısın? Veri kümelerini otomatik olarak etiketlemek, deneyleri takip etmek ve modelleri buluta veya uç cihazlara sorunsuz bir şekilde dağıtmak için Ultralytics Platform kullan.
Sonuç olarak, DAMO-YOLO mimari arayışı konusunda ilginç akademik içgörüler sunarken, Ultralytics modelleri çok daha olgun, çok yönlü ve geliştirici dostu bir ekosistem sağlar. İster YOLOv8'in kanıtlanmış istikrarına bağlı kal, ister YOLO26'nın ışık hızındaki, NMS-free mimarisine yükselt, Ultralytics paketi gerçek zamanlı görü yapay zekası için bir numaralı tercih olmaya devam ediyor.