DAMO-YOLO ve Ultralytics YOLOv8: Kapsamlı Bir Teknik Karşılaştırma

Gerçek zamanlı bilgisayarlı görü alanı, araştırmacılar ve mühendisler hız ve doğruluk sınırlarını zorladıkça sürekli değişiyor. Bu yolculuktaki iki önemli dönüm noktası DAMO-YOLO ve Ultralytics YOLOv8 modelleridir. Her iki model de gecikme süresi ile ortalama Hassasiyet (mAP) arasındaki dengeyi optimize etmeyi amaçlasa da, nesne algılama zorluklarını çözmek için temelden farklı mimari ve felsefi yaklaşımlar benimserler.

Bu kapsamlı teknik analiz, bir sonraki yapay zeka projeniz için doğru aracı seçmenize yardımcı olmak amacıyla temel mimarilerini, eğitim metodolojilerini ve pratik uygulamalarını karşılaştıracaktır.

Model Soy ağacı ve Teknik Özellikler

Bu derin öğrenme modellerinin kökenlerini anlamak, tasarım hedefleri ve dağıtım ekosistemleri hakkında değerli bir bağlam sağlar.

DAMO-YOLO Detayları

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş: Alibaba Group
Tarih: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: tinyvision/DAMO-YOLO

DAMO-YOLO hakkında daha fazla bilgi edin

Ultralytics YOLOv8 Detayları

Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: ultralytics/ultralytics
Dokümanlar: YOLOv8 Documentation

YOLOv8 hakkında daha fazla bilgi edin

Mimari Yenilikler

Her iki mimarinin performans özellikleri, benzersiz yapısal kararlarından kaynaklanır.

DAMO-YOLO: Mimari Arayışıyla Şekillenen Tasarım

DAMO-YOLO, optimal ağ yapılarını otomatik olarak keşfetmek için büyük ölçüde Neural Architecture Search (NAS) yöntemine güvenir. Düşük gecikme süresi ile yüksek performans sunan backbone'ları arayan MAE-NAS adlı bir konsept sunar. Ayrıca, farklı uzamsal ölçeklerde özellik birleştirmeyi geliştirmek için verimli bir RepGFPN (Reparameterized Generalized Feature Pyramid Network) kullanır.

Eğitimi iyileştirmek için Alibaba ekibi bir ZeroHead tasarımı ve AlignedOTA etiket ataması ekledi. Ayrıca, ağır bir öğretmen modelinin hafif bir öğrenci modeline rehberlik ettiği ve akademik kıyaslamalarda daha yüksek doğruluk metrikleri elde ettiği karmaşık bir bilgi damıtma sürecine büyük ölçüde ağırlık verirler.

YOLOv8: Sadeleştirilmiş ve Çok Yönlü

Ultralytics, YOLOv8 ile geliştirici odaklı bir yaklaşım benimsedi. YOLOv5 modelinin çapa tabanlı tasarımından çapa içermeyen (anchor-free) bir mimariye geçerek, sınırlayıcı kutu tahminlerinin sayısını önemli ölçüde azalttı ve çıkarımı hızlandırdı. C2f (2 evrişimli Cross-Stage Partial Bottleneck) modülünün tanıtılması, aşırı hesaplama yükü eklemeden gradyan akışını ve özellik temsilini iyileştirdi.

Sadece sınırlayıcı kutuları hedefleyen modellerin aksine, YOLOv8 en baştan çok modlu olacak şekilde tasarlandı. Birleşik bir PyTorch kod tabanı; örnek segmentasyonu, poz tahmini ve görüntü sınıflandırmayı yerel olarak destekleyerek mühendisleri birbirinden kopuk depoları birleştirmekten kurtarır.

Verimli Eğitim

Ultralytics modelleri, Transformer tabanlı ağır mimarilere kıyasla eğitim sırasında doğal olarak daha az bellek gerektirir ve standart tüketici GPU'larında en son teknoloji sonuçlar elde edilmesine olanak tanır.

Performans Karşılaştırması

Ham metrikleri karşılaştırırken, teorik yeteneklerin donanım performansına nasıl yansıdığını analiz etmek hayati önem taşır. Aşağıdaki tablo, model boyutları arasındaki dengeleri göstermektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametre
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

DAMO-YOLO, damıtma teknikleri sayesinde güçlü bir parametre-doğruluk oranı sergilese de, YOLOv8 daha geniş bir model boyutu yelpazesi (Nano'dan Extra-large'a) sunar. YOLOv8 Nano modeli, daha az kaynak tüketirken oldukça kullanışlı bir hassasiyet sunarak uç optimizasyonda bir ustalık sınıfını temsil eder.

Ekosistem ve Geliştirici Deneyimi

Akademik makaleler ile üretime hazır sistemler arasındaki gerçek fark ekosistemdir.

DAMO-YOLO'nun kapsamlı bilgi damıtma boru hatlarına olan bağımlılığı, özel eğitimi hantal hale getirebilir. Bir öğretmen modeli oluşturmak, bilgi aktarmak ve NAS tabanlı backbone'ları ayarlamak yüksek CUDA belleği ve gelişmiş yapılandırma gerektirir, bu da genellikle çevik mühendislik ekiplerini yavaşlatır.

Buna karşılık, Ultralytics ekosistemi kullanım kolaylığını ön planda tutar. Ultralytics Platform aracılığıyla geliştiriciler, basit API'lere, kapsamlı dokümantasyona ve sağlam deney takibi entegrasyonlarına erişebilirler. Birleşik Python çerçevesi, karmaşık boru hatları oluşturmayı kolaylaştırır.

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Bu optimize edilmiş iş akışı, OpenVINO ve TensorRT ile sorunsuz dışa aktarma seçenekleriyle birleşerek, yerel prototiplemeden bulut veya uç dağıtımlara kadar pürüzsüz bir yol sağlar.

Gerçek Dünya Uygulamaları ve İdeal Kullanım Durumları

Bu mimariler arasında seçim yapmak genellikle ortamının operasyonel kısıtlamalarına bağlıdır.

DAMO-YOLO'nun Uygun Olduğu Yerler

DAMO-YOLO, Neural Architecture Search üzerine çalışan akademik ortamlar veya karmaşık yeniden parametreleştirme stratejilerini kopyalamaya çalışan araştırmacılar için mükemmel bir seçimdir. Ekibin çok aşamalı eğitimini yönetecek hesaplama kaynaklarına sahip olması koşuluyla, üretim hatlarında yüksek hızlı kusur tespiti gibi yüksek derecede kontrollü endüstriyel uygulamalarda da başarılı olabilir.

Neden Ultralytics Üretimde Öncü?

Ticari projelerin büyük çoğunluğu için Ultralytics modelleri üstün performans dengesi sağlar.

  • Akıllı Perakende: Envanter için sınırlayıcı kutu algılama ve müşteri davranışını analiz etmek için poz tahmini işlemlerinin her ikisini de gerçekleştirmek için YOLOv8'in çoklu görev yeteneklerinden yararlanılması.
  • Tarım: Traktör yayınlarında bitki sınırlarını ve yabani otları gerçek zamanlı olarak tespit etmek için örnek segmentasyonu kullanılması.
  • Hava Görüntüleme: Dronlardan veya uydulardan döndürülmüş araçları ve gemileri doğru bir şekilde takip etmek için Yönlendirilmiş Sınırlayıcı Kutulardan (OBB) faydalanılması.
Diğer Önemli Modeller

Daha geniş bir alanı keşfediyorsan, çapa içermeyen algılamaya daha fazla yenilik getiren YOLOv10 veya YOLO11 modellerini karşılaştırmak isteyebilirsin.

Geleceğe Hazırlık: YOLO26 ile Tanış

YOLOv8 temel bir model olarak kalmaya devam etse de, alan ilerlemeye devam etti. Tüm yeni geliştirmeler için önerilen standart YOLO26 modelidir. Ocak 2026'da piyasaya sürülen bu model, Ultralytics serisinde anıtsal bir sıçramayı temsil eder.

YOLO26, geleneksel Non-Maximum Suppression darboğazını tamamen ortadan kaldıran yerel bir uçtan uca NMS içermeyen tasarımın öncüsüdür. Bu yapısal atılım, %43'e kadar daha hızlı CPU çıkarımı sağlayarak uç bilişim ve IoT donanımları için mutlak bir güç merkezi oluşturur.

Ayrıca YOLO26, daha hızlı yakınsama ve son derece kararlı eğitim döngüleri garanti eden, Büyük Dil Modeli (LLM) eğitim tekniklerinden esinlenmiş bir hibrit olan MuSGD Optimizer'ı tanıtır. Yeni ProgLoss + STAL algoritmalarıyla birleşen YOLO26, küçük nesne tanımada dramatik iyileştirmeler sergileyerek dağıtımlarının sadece hızlı değil, aynı zamanda tavizsiz bir şekilde doğru olmasını sağlar.

YOLO26 hakkında daha fazla bilgi edin

Yorumlar