İçeriğe geç

DAMO-YOLO ve YOLO11: Kapsamlı Bir Teknik Karşılaştırma

Bir sonraki bilgisayar görüşü projeniz için gerçek zamanlı bir nesne algılama mimarisi seçerken, önde gelen modeller arasındaki nüansları anlamak kritik öneme sahiptir. Bu kapsamlı kılavuz, DAMO-YOLO ve Ultralytics YOLO11'i karşılaştıran, mimarilerini, performans metriklerini, eğitim metodolojilerini ve ideal gerçek dünya dağıtım senaryolarını inceleyen derinlemesine bir teknik analiz sunmaktadır.

DAMO-YOLO Detayları:
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group Tarih: 2022-11-23
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO
Belgeler: DAMO-YOLO Dokümantasyonu

YOLO11 Detayları:
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: ultralytics/ultralytics
Belgeler: YOLO11 Dokümantasyonu

Mimari Tasarım Felsefesi

Bir nesne algılama modelinin temel mimarisi, çıkarım hızını, doğruluğunu ve çeşitli donanım ortamlarındaki uyarlanabilirliğini belirler.

DAMO-YOLO, kendi backbone'unu otomatik olarak tasarlamak için Sinirsel Mimari Arama (NAS) teknolojisine yoğun bir şekilde dayanarak birkaç akademik yenilik sunar. Özellik füzyonunu geliştirmek için verimli bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) ve önceki mimarilerde sıkça bulunan ağır tahmin başlığını önemli ölçüde küçülten bir ZeroHead tasarımı kullanır. Bu NAS odaklı yaklaşım, DAMO-YOLO'nun seçili GPU'larda belirli verimlilikler elde etmesini sağlarken, ortaya çıkan mimariler bazen çeşitli kenar cihazlarda sorunsuz bir şekilde genelleşmek için gereken esnekliğe sahip olmayabilir.

Buna karşılık, YOLO11, yüksek düzeyde optimize edilmiş, el yapımı bir mimari sunmak için yıllarca süren temel araştırmalar üzerine inşa edilmiştir. Akıcı bir backbone'a ve gereksiz hesaplamaları azaltan yüksek verimli bir boyun kısmına odaklanır. YOLO11'in başlıca avantajlarından biri, rafine edilmiş parametre verimliliğidir; transformatör tabanlı RT-DETR gibi modellerin tipik ağır VRAM gereksinimleri olmadan yüksek özellik temsili elde eder. Bu durum, YOLO11'i son derece çok yönlü kılar; tüketici sınıfı GPU'larda, mobil cihazlarda ve özel kenar hızlandırıcılarda sorunsuz bir şekilde çalışabilir.

Performans ve Metrikler

Performansı değerlendirmek, en yüksek doğruluğun ötesine bakarak hız, model boyutu ve hesaplama yükü (FLOPs) dengesini göz önünde bulundurmayı gerektirir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Tablonun gösterdiği gibi, YOLO11 oldukça uygun bir performans dengesi elde eder. Şu YOLO11s varyantı, örneğin, şunu aşıyor DAMO-YOLOs doğrulukta, önemli ölçüde daha küçük bir parametre ayak izini korurken. Bellek gereksinimlerindeki bu azalma, doğrudan daha düşük dağıtım maliyetlerine ve kenar cihazlarda daha çevik performansa dönüşür.

YOLO11 hakkında daha fazla bilgi edinin

Eğitim Metodolojileri ve Kullanılabilirlik

Eğitim hattı, geliştiricilerin zamanlarının çoğunu harcadığı yerdir ve bu da eğitim verimliliğini en önemli endişe haline getirir.

DAMO-YOLO, bilgi damıtımına yoğun bir şekilde bağımlı, çok aşamalı bir eğitim süreci kullanır. Etiket ataması için AlignedOTA (Optimal Transport Assignment) kullanır ve genellikle daha küçük "öğrenci" modellere bilgi damıtmak için daha büyük bir "öğretmen" modelin eğitilmesini gerektirir. Bu metodoloji, CUDA belleği ayak izini ve optimal yakınsamayı elde etmek için gereken toplam hesaplama süresini önemli ölçüde artırır.

Tersine, Ultralytics ekosistemi, model eğitiminin karmaşıklığını soyutlar. YOLO11, akıcı bir python API'si ve mühendislerin özel veri kümeleri üzerinde tek bir komutla eğitimi başlatmasına olanak tanıyan kapsamlı CLI arayüzleri ile olağanüstü kullanım kolaylığı için tasarlanmıştır. Eğitim hattı doğası gereği kaynak verimlidir, bellek ani yükselişlerini en aza indirir, böylece daha büyük modeller bile standart donanım üzerinde eğitilebilir.

Ultralytics ile Kolaylaştırılmış Eğitim

Bir Ultralytics modeli eğitmek sıfır boilerplate kodu gerektirir. Yerleşik veri yükleme, artırma ve kayıp hesaplama hatları kutudan çıktığı gibi tamamen optimize edilmiştir.

İşte bir Ultralytics modelini eğitmenin ve dağıtmanın ne kadar basit olduğuna dair hızlı bir örnek:

from ultralytics import YOLO

# Load a pretrained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX for seamless deployment
model.export(format="onnx")

YOLO11 hakkında daha fazla bilgi edinin

Gerçek Dünya Uygulamaları ve Çok Yönlülük

Bu mimariler arasındaki seçim genellikle dağıtım ortamınızın gerektirdiği görevlerin genişliğine bağlıdır.

DAMO-YOLO'nun Yeri

DAMO-YOLO, yalnızca bir nesne algılama çerçevesidir. Ekiplerin yeniden parametrelendirme veya belirli Sinirsel Mimari Arama deneylerini yeniden üretme üzerinde çalıştığı akademik araştırma ortamlarında üstün başarı gösterir. Ayrıca, çok özel bir GPU hızlandırıcının NAS tarafından üretilen backbone ile mükemmel şekilde eşleştiği, sıkı kısıtlamalara sahip endüstriyel ortamlarda da dağıtılabilir.

Ultralytics'in Avantajı

YOLO11 dahil Ultralytics modelleri, benzersiz çok yönlülükleri ve iyi yönetilen ekosistemleri sayesinde gerçek dünya ticari uygulamalarında öne çıkar. DAMO-YOLO'dan farklı olarak, Ultralytics çerçevesi çok modlu görevleri doğal olarak destekler. Tıbbi görüntülemede Instance Segmentation'dan spor biyomekanik analizleri için Pose Estimation'a kadar, tek ve birleşik bir kod tabanı tüm bunları yönetir.

YOLO11'den faydalanan sektörler şunlardır:

  • Akıllı Tarım: Mahsul sağlığını izlemek ve hasat makinelerini otomatikleştirmek için nesne algılamayı kullanma.
  • Perakende Analitiği: Müşteri trafiğini analiz etmek ve envanter yönetimini otomatikleştirmek için akıllı gözetim uygulama.
  • Lojistik ve Tedarik Zinciri: Hızlı hareket eden konveyör bantlarında Oriented Bounding Boxes (obb) kullanarak yüksek hızlı barkod ve paket algılama.

Kullanım Durumları ve Öneriler

DAMO-YOLO ve YOLO11 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

Ne Zaman DAMO-YOLO Seçmeli

DAMO-YOLO şunlar için güçlü bir seçimdir:

  • Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
  • Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
  • Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.

Ne Zaman YOLO11 Seçmeli

YOLO11, aşağıdaki durumlar için önerilir:

  • Üretim Uç Cihaz Dağıtımı: Güvenilirliğin ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
  • Çok Görevli Görüntü İşleme Uygulamaları: Tek bir birleşik çerçeve içinde detect, segment, poz tahmini ve obb gerektiren projeler.
  • Hızlı Prototipleme ve Dağıtım: Basitleştirilmiş Ultralytics python API'sini kullanarak veri toplama aşamasından üretime hızla geçmesi gereken ekipler.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Yeni Nesil: YOLO26 Tanıtımı

YOLO11 güçlü ve güvenilir bir seçenek olmaya devam etse de, bilgisayar görüşü alanı hızla ilerlemektedir. Yeni projeler başlatan geliştiriciler için en son YOLO26 modeli, en güncel teknolojiyi temsil etmektedir.

Ocak 2026'da piyasaya sürülen YOLO26, çığır açan birçok yenilik sunmaktadır:

  • Uçtan Uca NMS-Free Tasarım: Non-Maximum Suppression (NMS) son işlemeyi ortadan kaldırarak, YOLO26 daha hızlı, deterministik çıkarım süreleri sağlar ve dağıtım hatlarını önemli ölçüde basitleştirir.
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Distribution Focal Loss (DFL) kaldırılmasıyla, model özel GPU'ları olmayan kenar ve düşük güçlü cihazlar için olağanüstü derecede uygundur.
  • MuSGD Optimizatörü: LLM eğitim yeniliklerini (Moonshot AI'dan esinlenerek) entegre eden bu hibrit optimizatör, eğitim sırasında istikrarlı ve hızlı yakınsama sağlar.
  • Gelişmiş Kayıp Fonksiyonları: ProgLoss + STAL kullanarak, YOLO26 küçük nesne tanımada dikkat çekici iyileşmeler sergiler; bu da hava görüntüleme ve robotik için kritik öneme sahiptir.

YOLO26 hakkında daha fazla bilgi edinin

Sonuç

Hem DAMO-YOLO hem de YOLO11, hızlı ve doğru bilgisayar görüşünün ilerlemesine önemli katkılarda bulunmuştur. DAMO-YOLO mimari arama ve damıtma konusunda ilgi çekici akademik içgörüler sunarken, Ultralytics YOLO11 (ve çığır açan YOLO26) üstün bir geliştirici deneyimi sağlar.

Daha düşük bellek gereksinimleri, kapsamlı dokümantasyon, çok görevli yetenekler ve güçlü Ultralytics Platformu ile entegrasyon sayesinde, Ultralytics modelleri sağlam, ölçeklenebilir yapay zeka çözümleri oluşturmak isteyen araştırmacılar ve kurumsal mühendisler için en iyi tavsiye olmaya devam etmektedir. Diğer gelişmiş mimarileri keşfedenler için, YOLO26 vs RT-DETR karşılaştırması, transformatör tabanlı alternatifler hakkında ek bilgiler sunar.


Yorumlar