DAMO-YOLO ile YOLO11: Kapsamlı Bir Teknik Karşılaştırma
Bir sonraki bilgisayarlı görü projen için gerçek zamanlı bir nesne algılama mimarisi seçerken, önde gelen modeller arasındaki nüansları anlamak kritiktir. Bu kapsamlı rehber, DAMO-YOLO ve Ultralytics YOLO11'i karşılaştıran derinlemesine bir teknik analiz sunmakta; mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal gerçek dünya dağıtım senaryolarını incelemektedir.
DAMO-YOLO Detayları:
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO
Dokümantasyon: DAMO-YOLO Dokümantasyonu
YOLO11 Detayları:
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: ultralytics/ultralytics
Dokümantasyon: YOLO11 Dokümantasyonu
Mimari Tasarım Felsefesi
Bir nesne algılama modelinin temel mimarisi, çıkarım hızını, doğruluğunu ve çeşitli donanım ortamlarındaki uyarlanabilirliğini belirler.
DAMO-YOLO, omurgasını otomatik olarak tasarlamak için büyük ölçüde Neural Architecture Search (NAS) yöntemine dayanan çeşitli akademik yenilikler getirir. Özellik füzyonunu geliştirmek için verimli bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) ve önceki mimarilerde sıkça görülen ağır tahmin başlığını önemli ölçüde küçülten bir ZeroHead tasarımı kullanır. NAS odaklı bu yaklaşım, DAMO-YOLO'nun seçili GPU'larda belirli verimlilikler elde etmesini sağlasa da, ortaya çıkan mimariler bazen farklı uç cihazlarda sorunsuz bir şekilde genelleştirilebilmek için gereken esneklikten yoksun olabilir.
Buna karşılık YOLO11, son derece optimize edilmiş, el işçiliği bir mimari sunmak için yılların temel araştırmaları üzerine inşa edilmiştir. Gereksiz hesaplamaları azaltan aerodinamik bir omurgaya ve oldukça verimli bir boyun yapısına odaklanır. YOLO11'in birincil avantajlarından biri, rafine edilmiş parametre verimliliğidir; RT-DETR gibi transformer tabanlı modellerin tipik ağır VRAM gereksinimleri olmadan yüksek özellik temsili elde eder. Bu, YOLO11'i tüketici sınıfı GPU'larda, mobil cihazlarda ve özel uç hızlandırıcılarda sorunsuz bir şekilde çalışabilecek kadar olağanüstü çok yönlü kılar.
Performans ve Metrikler
Performans değerlendirmesi, hız, model boyutu ve hesaplama yükü (FLOPs) arasındaki dengeyi dikkate almak için en üst düzey doğruluğun ötesine bakmayı gerektirir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Tabloda gösterildiği gibi, YOLO11 son derece elverişli bir performans dengesi sağlar. Örneğin YOLO11s varyantı, çok daha küçük bir parametre ayak izini korurken doğruluk açısından DAMO-YOLOs modelini geride bırakır. Bellek gereksinimlerindeki bu azalma, doğrudan daha düşük dağıtım maliyetlerine ve uç cihazlarda daha çevik bir performansa dönüşür.
YOLO11 hakkında daha fazla bilgi edin
Eğitim Metodolojileri ve Kullanılabilirlik
Eğitim hattı, geliştiricilerin zamanlarının çoğunu harcadıkları yerdir, bu da eğitim verimliliğini en önemli konu haline getirir.
DAMO-YOLO, bilgi damıtma (knowledge distillation) sürecine büyük ölçüde bağımlı, çok aşamalı bir eğitim süreci kullanır. Etiket ataması için AlignedOTA (Optimal Transport Assignment) yönteminden yararlanır ve bilgiyi daha küçük "öğrenci" modellere damıtmak için genellikle daha büyük bir "öğretmen" modelin eğitilmesini gerektirir. Bu metodoloji, CUDA belleği ayak izini ve optimal yakınsamaya ulaşmak için gereken toplam hesaplama süresini önemli ölçüde artırır.
Bunun aksine, Ultralytics ekosistemi model eğitiminin karmaşıklığını soyutlar. YOLO11, aerodinamik bir Python API'si ve mühendislerin özel veri setlerinde tek bir komutla eğitimi başlatmalarını sağlayan kapsamlı CLI arayüzleri ile olağanüstü bir kullanım kolaylığı için tasarlanmıştır. Eğitim hattı doğası gereği kaynak dostudur ve bellek sıçramalarını en aza indirerek daha büyük modellerin bile standart donanımlarda eğitilebilmesini sağlar.
Bir Ultralytics modelini eğitmek sıfır boilerplate kodu gerektirir. Yerleşik veri yükleme, artırma (augmentation) ve kayıp hesaplama hatları, kutudan çıktığı haliyle tamamen optimize edilmiştir.
İşte bir Ultralytics modelini eğitmenin ve dağıtmanın ne kadar basit olduğuna dair hızlı bir örnek:
from ultralytics import YOLO
# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the trained model to ONNX for seamless deployment
model.export(format="onnx")YOLO11 hakkında daha fazla bilgi edin
Gerçek Dünya Uygulamaları ve Çok Yönlülük
Bu mimariler arasındaki seçim, genellikle dağıtım ortamının gerektirdiği görevlerin kapsamına bağlıdır.
DAMO-YOLO'nun Uygun Olduğu Yerler
DAMO-YOLO kesinlikle bir nesne algılama çerçevesidir. Ekiplerin yeniden parametrelendirme (rep-parameterization) keşfettiği veya belirli Neural Architecture Search deneylerini yeniden ürettiği akademik araştırma ortamlarında mükemmeldir. Ayrıca, NAS tarafından oluşturulan omurganın bir GPU hızlandırıcıyla mükemmel bir şekilde eşleştiği, sıkı kısıtlamalara sahip endüstriyel ortamlarda da dağıtılabilir.
Ultralytics Avantajı
YOLO11 dahil olmak üzere Ultralytics modelleri, benzersiz çok yönlülükleri ve iyi korunmuş ekosistemleri sayesinde gerçek dünyadaki ticari uygulamalarda parlar. DAMO-YOLO'nun aksine, Ultralytics çerçevesi çok modlu görevleri yerel olarak destekler. Tıbbi görüntülemede Örnek Bölütleme işleminden sporda biyomekanik analiz için Poz Tahminine kadar, tek bir birleşik kod tabanı her şeyi yönetir.
YOLO11'den yararlanan endüstriler şunları içerir:
- Akıllı Tarım: Mahsul sağlığını izlemek ve hasat makinelerini otomatize etmek için nesne algılamadan yararlanma.
- Perakende Analitiği: Müşteri trafiğini analiz etmek ve envanter yönetimini otomatize etmek için akıllı gözetim uygulama.
- Lojistik ve Tedarik Zinciri: Hızlı hareket eden taşıma bantlarında Yönelimli Sınırlayıcı Kutular (OBB) kullanarak yüksek hızlı barkod ve paket algılama.
Kullanım Durumları ve Öneriler
DAMO-YOLO ve YOLO11 arasında seçim yapmak, özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman DAMO-YOLO Seçilmeli
DAMO-YOLO şunlar için güçlü bir tercihtir:
- Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.
Ne Zaman YOLO11 Seçilmeli
YOLO11 şunlar için önerilir:
- Üretim Uç Dağıtımı: Güvenilirlik ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
- Çok Görevli Görü Uygulamaları: Tek bir birleşik çerçeve içinde algılama, segmentasyon, poz tahmini ve OBB gerektiren projeler.
- Hızlı Prototipleme ve Dağıtım: Kolaylaştırılmış Ultralytics Python API kullanarak veri toplamadan üretime hızlı bir şekilde geçmesi gereken ekipler.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Yeni Nesil: YOLO26 ile Tanışın
YOLO11 güçlü ve güvenilir bir tercih olmaya devam ederken, bilgisayarlı görü alanı hızla ilerliyor. Yeni projeler başlatan geliştiriciler için en güncel YOLO26 modeli, yeni sanat durumu (state-of-the-art) temsil etmektedir.
Ocak 2026'da yayınlanan YOLO26, birkaç çığır açan ilerleme sunar:
- Uçtan Uca NMS-Free Tasarım: Non-Maximum Suppression son işlemeyi ortadan kaldırarak, YOLO26 daha hızlı, deterministik çıkarım süreleri sağlar ve dağıtım hatlarını önemli ölçüde basitleştirir.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırılması sayesinde model, özel GPU'lara sahip olmayan uç ve düşük güç tüketen cihazlar için son derece uygundur.
- MuSGD Optimize Edici: LLM eğitim yeniliklerini (Moonshot AI'dan esinlenerek) entegre eden bu hibrit optimize edici, eğitim sırasında kararlı ve hızlı bir yakınsama sağlar.
- Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL kullanan YOLO26, hava görüntüleri ve robotik için hayati önem taşıyan küçük nesne tanımada dikkat çekici iyileştirmeler sergiler.
YOLO26 hakkında daha fazla bilgi edin
Sonuç
Hem DAMO-YOLO hem de YOLO11, hızlı ve doğru bilgisayarlı görünün ilerlemesine önemli ölçüde katkıda bulunmuştur. DAMO-YOLO mimari arama ve damıtma konusunda ilginç akademik bilgiler sunarken, Ultralytics YOLO11 (ve çığır açan YOLO26) üstün bir geliştirici deneyimi sağlar.
Daha düşük bellek gereksinimleri, kapsamlı dokümantasyon, çok görevli yetenekler ve güçlü Ultralytics Platform ile entegrasyon sayesinde, Ultralytics modelleri sağlam ve ölçeklenebilir yapay zeka çözümleri oluşturmak isteyen araştırmacılar ve kurumsal mühendisler için en iyi öneri olmaya devam ediyor. Diğer gelişmiş mimarileri inceleyenler için, YOLO26 vs RT-DETR karşılaştırması, transformer tabanlı alternatifler hakkında ek bilgiler sunar.