İçeriğe geç

YOLO11 - DAMO-YOLO Karşılaştırması: Teknik Bir İnceleme

Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama modelini seçmek proje başarısı için kritik öneme sahiptir. Bu sayfa, hız ve doğruluk için tasarlanmış iki yüksek performanslı mimari olan Ultralytics YOLO11 ve DAMO-YOLO arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. DAMO-YOLO akademik araştırmalardan yenilikçi teknikler sunarken, YOLO11 sağlam bir ekosistem tarafından desteklenen çok yönlü, üretime hazır bir çözüm olarak öne çıkmaktadır.

Yönetici Özeti

Ultralytics YOLO11, YOLO serisindeki en son evrimi temsil eder ve uç cihazlardan bulut sunucularına kadar çeşitli donanımlarda gerçek zamanlı çıkarımı optimize eder. Yerel olarak birden çok görevi (algılama, segmentasyon ve poz tahmini dahil) destekleyerek karmaşık AI işlem hatları için birleşik bir çözüm sunar.

Alibaba Group tarafından geliştirilen DAMO-YOLO, Neural Architecture Search (NAS) ve yeni özellik birleştirme tekniklerini kullanarak algılama hızı ve doğruluğunu dengelemeye odaklanır. Öncelikle GPU verimi için optimize edilmiş araştırma odaklı bir dedektördür.

Ultralytics YOLO11

Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolo11/

YOLO11, yüksek verimliliği korurken özellik çıkarımını artıran mimari iyileştirmeler getirerek son teknoloji düzeyini iyileştirir. Önceki nesillere kıyasla daha az parametreyle üstün doğruluk sağlamak için değiştirilmiş bir CSPNet backbone ve gelişmiş bir anchor-free başlık kullanır.

Temel Özellikler ve Güçlü Yönler

  • Çok Yönlülük: Birçok özel modelin aksine, YOLO11 çoklu görevli bir çerçevedir. Nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler.
  • Gelişmiş Mimari: Küçük nesneler ve zorlu arka planlar üzerindeki performansı artırarak karmaşık desenleri etkili bir şekilde yakalamak için C3k2 bloklarını ve C2PSA (Uzamsal Dikkatli Çapraz Aşamalı Kısmi) modüllerini içerir.
  • Geniş Donanım Desteği: CPU ve GPU çıkarımı için optimize edilmiştir ve Raspberry Pi'den NVIDIA A100 kümelerine kadar değişen kısıtlamalara uyması için çeşitli model ölçekleri (Nano'dan X-Large'a) sunar.
  • Kullanım Kolaylığı: Ultralytics Python API ve CLI, geliştiricilerin minimum kodla modelleri eğitmesini, doğrulamasını ve dağıtmasını sağlar.

Üretime Hazır Ekosistem

YOLO11, veri yönetimi, Ultralytics HUB aracılığıyla model eğitimi ve ONNX, TensorRT ve CoreML gibi formatlara tek tıklamayla dışa aktarma araçları dahil olmak üzere Ultralytics ekosistemi ile sorunsuz bir şekilde entegre olur.

YOLO11 hakkında daha fazla bilgi edinin

DAMO-YOLO

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO

DAMO-YOLO, endüstriyel uygulamalar için düşük gecikme süresine ve yüksek verime odaklanılarak tasarlanmıştır. Hız-doğruluk dengesinin sınırlarını zorlamak için YOLO ailesine çeşitli "yeni teknoloji" bileşenleri sunar.

Mimari Yenilikler

  • MAE-NAS Backbone: Verimli bir ağ topolojisini otomatik olarak keşfetmek için Ortalama Mutlak Hata (MAE) tarafından yönlendirilen Sinirsel Mimari Arama (NAS) kullanır.
  • Verimli RepGFPN: Yeniden parametrelendirme kullanan Genelleştirilmiş bir Özellik Piramidi Ağı (GFPN), eğitim sırasında karmaşık özellik birleştirmesine izin verirken çıkarım sırasında daha hızlı, daha basit bir yapıya çöker.
  • ZeroHead: Sınıflandırma ve regresyon görevlerini birbirinden ayıran ve son çıktı katmanlarının hesaplama yükünü önemli ölçüde azaltan hafif bir detect başlığı.
  • AlignedOTA: Eğitim sırasında sınıflandırma güvenilirliği ve regresyon doğruluğu arasındaki uyumsuzluğu çözen gelişmiş bir etiket atama stratejisidir.

DAMO-YOLO belirli metriklerde başarılı olsa da, öncelikle bir araştırma deposudur. Ultralytics ekosisteminde bulunan kapsamlı belgelendirme, sürekli güncellemeler ve geniş topluluk desteğinden yoksundur.

DAMO-YOLO hakkında daha fazla bilgi edinin

Performans Metrikleri: Bire Bir Karşılaştırma

Aşağıdaki tablo, YOLO11 ve DAMO-YOLO'nun COCO val2017 veri kümesi üzerindeki performansını karşılaştırmaktadır. Temel metrikler arasında Ortalama Hassasiyet (mAP) ve CPU ve GPU donanımındaki çıkarım hızı yer almaktadır.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Sonuçların Analizi

  1. Verimlilik Üstünlüğü: YOLO11, üstün parametre verimliliği gösterir. Örneğin, YOLO11m modeli yalnızca 20.1 milyon parametre ile 51.5 mAP elde ederken, karşılaştırılabilir DAMO-YOLOm, 28.2 milyon parametrelik daha büyük bir ayak iziyle 49.2 mAP'de geride kalmaktadır.
  2. Üstün Doğruluk: En büyük varyant olan YOLO11x, listelenen en büyük DAMO-YOLO modelini aşarak dikkate değer bir 54.7 mAP'ye ulaşır. Bu, YOLO11'i tıbbi görüntüleme veya kusur tespiti gibi yüksek hassasiyetli görevler için tercih edilen bir seçim haline getirir.
  3. Uç Nokta Dağıtımı: YOLO11n (Nano) modeli, olağanüstü derecede hafiftir (2,6M parametre) ve hızlıdır (T4 üzerinde 1,5 ms), bu da onu belleğin kıt olduğu gömülü sistemler için mükemmel kılar. Buna karşılık, en küçük DAMO-YOLO modeli önemli ölçüde daha ağırdır (8,5M parametre).
  4. CPU Performansı: Ultralytics, özel hızlandırıcılar olmadan dağıtımlar için YOLO11'in uygulanabilirliğini vurgulayan şeffaf CPU kıyaslamaları sağlar. DAMO-YOLO, düşük güçlü IoT uygulamaları için değerlendirmesini sınırlayan CPU hızlarını resmi olarak rapor etmez.

Teknik Derinlemesine İnceleme

Eğitim ve Mimari

DAMO-YOLO, backbone'unu tanımlamak için büyük ölçüde Neural Architecture Search (NAS)'e güvenir. Bu, teorik olarak optimum yapılar sağlayabilse de, genellikle tüm cihazlarda donanım dostu olmayabilecek düzensiz bloklarla sonuçlanır. Buna karşılık, YOLO11, standart GPU ve CPU hızlandırma kitaplıkları için sezgisel olarak tasarlanmış, el yapımı, rafine bloklar (C3k2, C2PSA) kullanır.

YOLO11 ayrıca eğitim verimliliğini de vurgular. Optimize edilmiş hiperparametreler ve veri artırma stratejileri sayesinde hızla yakınsar. Eğitim sırasındaki bellek gereksinimleri, karmaşık transformatör tabanlı veya NAS tabanlı mimarilerden genellikle daha düşüktür ve araştırmacıların tüketici sınıfı donanımlarda etkili modeller eğitmesine olanak tanır.

Ekosistem ve Kullanılabilirlik

En önemli ayırt edici özelliklerden biri ekosistemdir. DAMO-YOLO öncelikle araştırma makalesi sonuçlarını yeniden üretmek için bir kod deposudur.

Ancak Ultralytics YOLO11, tam hizmet veren bir platformdur:

  • Dokümantasyon: İşlem hattının her yönüyle ilgili kapsamlı kılavuzlar.
  • Entegrasyonlar: Deney takibi için MLFlow, TensorBoard ve Weights & Biases için yerel destek.
  • Topluluk: Hataların hızla düzeltilmesini ve soruların yanıtlanmasını sağlayan GitHub ve Discord'da büyük, aktif bir topluluk.
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

Kullanım Durumu Önerileri

Ultralytics YOLO11 Ne Zaman Seçilir

  • Gerçek Dünya Dağıtımı: Çeşitli donanımlara (iOS, Android, Edge TPU, Jetson) dağıtım yapmanız gerekiyorsa, YOLO11'in dışa aktarma yetenekleri benzersizdir.
  • Karmaşık Görüntü İşleme Hatları: Projeniz yalnızca sınırlayıcı kutulardan daha fazlasını gerektirdiğinde (örneğin, nesneleri track etmek veya vücut pozunu tahmin etmek), YOLO11 bunları yerel olarak ele alır.
  • Hızlı Prototipleme: Kullanım kolaylığı, geliştiricilerin dakikalar içinde veriden çalışan bir demoya geçmesini sağlar.
  • Kaynak Kısıtlamaları: Nano ve Small modelleri, pille çalışan cihazlar için en iyi doğruluk-boyut oranını sunar.

DAMO-YOLO'yu Ne Zaman Düşünmeli

  • Akademik Araştırma: Nesne algılamada NAS'ın veya yeniden parametrelendirme tekniklerinin etkinliğini inceleyen araştırmacılar, DAMO-YOLO'yu değerli bir temel olarak bulabilirler.
  • Belirli GPU Kurulumları: DAMO-YOLO'nun belirli mimari bloklarının hedef hızlandırıcının önbellek hiyerarşisiyle mükemmel şekilde uyumlu olduğu senaryolarda, rekabetçi bir verim sunabilir.

Sonuç

DAMO-YOLO, MAE-NAS ve RepGFPN gibi etkileyici akademik kavramlar sunsa da, Ultralytics YOLO11, geliştiricilerin ve işletmelerin büyük çoğunluğu için üstün bir seçim olmaya devam ediyor. Son teknoloji ürünü doğruluk, hafif mimari ve gelişen bir ekosistemin birleşimi, projelerin yalnızca performanslı olmasını değil, aynı zamanda sürdürülebilir ve ölçeklenebilir olmasını da sağlar.

Güvenilir, çok yönlü ve yüksek performanslı bir bilgisayarlı görü çözümü arayan geliştiriciler için YOLO11, 2025 ve sonrasında başarılı olmak için gerekli araçları ve metrikleri sunar.

Diğer Model Karşılaştırmalarını İnceleyin

Nesne algılama modellerinin genel yapısını daha iyi anlamak için, bu ilgili karşılaştırmaları inceleyin:


Yorumlar