Link to this sectionYOLOv8 ve DAMO-YOLO Karşılaştırması#
Bilgisayarlı görü alanı sürekli gelişiyor ve yeni mimariler, uç cihazlarda ve devasa bulut kümelerinde nelerin mümkün olduğunun sınırlarını zorluyor. Bu teknik derinlemesine incelemede, iki önemli gerçek zamanlı nesne algılama modelini karşılaştırıyoruz: YOLOv8 ve DAMO-YOLO. Mimarilerini, performans metriklerini ve eğitim metodolojilerini inceleyerek, ML mühendisleri dağıtım hatları için bilinçli kararlar verebilirler.
Link to this sectionModel Geçmişleri ve Kökenleri#
Her iki model de yaklaşık aynı zamanlarda tanıtıldı ancak farklı tasarım felsefelerinden ve araştırma hedeflerinden kaynaklanıyorlar.
Link to this sectionYOLOv8 Detayları#
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2023-01-10
- GitHub: Ultralytics GitHub Deposu
- Dokümanlar: YOLOv8 Resmi Dokümantasyonu
YOLOv8 hakkında daha fazla bilgi edinin
Link to this sectionDAMO-YOLO Detayları#
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Organizasyon: Alibaba Group
- Tarih: 23-11-2022
- Arxiv: DAMO-YOLO Araştırma Makalesi
- GitHub: DAMO-YOLO GitHub Deposu
DAMO-YOLO hakkında daha fazla bilgi edinin
Link to this sectionMimari Yenilikler#
Link to this sectionYOLOv8: Çok Yönlü Çapasız (Anchor-Free) Tasarım#
Ultralytics YOLOv8, öncüllerine göre önemli iyileştirmeler getirerek oldukça güvenilir, son teknoloji bir model olma statüsünü pekiştirdi. Kutu tahminlerinin sayısını azaltan ve çıkarımı hızlandıran çapasız (anchor-free) bir algılama başlığına sahiptir. Mimari, nesnellik, sınıflandırma ve regresyon görevlerini ayıran ve daha doğru BBox tahminlerine yol açan ayrıştırılmış bir başlık (decoupled head) kullanır.
Ayrıca YOLOv8, Distribution Focal Loss (DFL) ile birlikte CIoU kaybını uygulayarak, modelin özellikle daha küçük veya kısmen gizlenmiş hedefler için nesne sınırlarını hassas bir şekilde yerelleştirme yeteneğini geliştirir. Sadeleştirilmiş omurgası (backbone), hem GPU hem de CPU yürütme için yüksek oranda optimize edilmiştir.
Link to this sectionDAMO-YOLO: Mimari Arama (NAS) Odaklı#
DAMO-YOLO farklı bir yaklaşım izleyerek, omurgasını otomatik olarak tasarlamak için büyük ölçüde Neural Architecture Search (NAS) yöntemine güvenir. Alibaba ekibi, özellikle TensorRT hızlandırması altında optimal gecikme-doğruluk ödünleşimleri sunan yapıları bulmak için "MAE-NAS"ı tanıttı.
Model, verimli özellik birleştirme için bir RepGFPN (Yeniden Parametrelendirilmiş Genelleştirilmiş Özellik Piramidi Ağı) ve algılama başlığının hesaplama yükünü en aza indirmek için bir "ZeroHead" tasarımı içerir. Eğitim sırasında, etiket ataması için AlignedOTA'dan yararlanır ve hedef öğrenci modelini denetlemek için daha büyük bir öğretmen modeli gerektiren karmaşık bir bilgi damıtma sürecine büyük ölçüde güvenir.
DAMO-YOLO, NAS ve damıtma yoluyla etkileyici gecikme metriklerine ulaşsa da, bu durum YOLOv8'in yüksek oranda optimize edilmiş tek aşamalı eğitim hattına kıyasla eğitim sırasında önemli ölçüde daha fazla CUDA belleği ve işlem süresi gerektirir.
Link to this sectionPerformans ve Metrikler#
Bilgisayarlı görü modellerini üretime alırken, doğruluğu (mAP) çıkarım hızıyla dengelemek kritiktir. Aşağıdaki tablo, her iki modelin çeşitli boyutlardaki performansını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv8 olağanüstü bir performans dengesi sergiler. YOLOv8n (nano) modeli, DAMO-YOLOt'nin 8.5 milyon parametresine kıyasla sadece 3.2 milyon parametre gerektirir, bu da onu mobil cihazlar veya katı bellek gereksinimleri olan ortamlar için çok daha üstün kılar. Ayrıca YOLOv8, bulut tabanlı iş yükleri için yüksek doğruluklu YOLOv8x modeline kadar ölçeklenebilen daha geniş bir boyut yelpazesi sunar.
Link to this sectionGeliştirici Deneyimi ve Ekosistem#
Link to this sectionKullanım Kolaylığı ve Eğitim Verimliliği#
En büyük ayırt edici faktörlerden biri kullanıcı deneyimidir. Ultralytics ekosistemi, geliştirici hızı için tasarlanmıştır. Özel bir YOLOv8 modeli eğitmek çok düşük bellek kullanımı gerektirir ve birleşik bir Python API veya komut satırı arayüzü aracılığıyla yürütülebilir.
Buna karşılık, DAMO-YOLO'nun damıtma ile geliştirilmiş eğitimini yeniden üretmek genellikle karmaşık yapılandırma dosyalarında gezinmeyi ve çok aşamalı öğretmen-öğrenci deney takibini yönetmeyi gerektirir.
İşte Python kullanarak YOLOv8'i eğitmenin, doğrulamanın ve dışa aktarmanın ne kadar kolay olduğuna dair bir örnek:
from ultralytics import YOLO
# Load a pre-trained YOLOv8 nano model
model = YOLO("yolov8n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="cpu")
# Export the trained model to ONNX format
path = model.export(format="onnx")Link to this sectionGörü Görevlerinde Çok Yönlülük#
DAMO-YOLO tamamen BBox nesne algılama için oluşturulmuştur. Buna karşılık, YOLOv8 mimarisi yerel olarak birden fazla görevi destekler. Geliştiriciler, yalnızca model ağırlıklarını değiştirerek, temel dağıtım kod tabanlarını değiştirmeden Örnek Segmentasyonu, Görüntü Sınıflandırma ve Poz Tahmini gerçekleştirebilirler. Bu çok yönlülük, Ultralytics modellerini karmaşık uygulamalar için çok daha pratik hale getirir.
Link to this sectionGerçek Dünya Kullanım Durumları#
Link to this sectionNe zaman YOLOv8 kullanılır#
YOLOv8'in hız, doğruluk ve dağıtım kolaylığı kombinasyonu onu şunlar için ideal kılar:
- Akıllı Perakende Analitiği: Müşteri davranışını izlemek veya envanter kontrollerini otomatikleştirmek için nesne takibi gerçekleştirme.
- Tarımsal Robotik: Ekinleri veya zararlıları gerçek zamanlı olarak tanımlamak için farklı donanımlardaki güçlü performansından yararlanma.
- Sağlık Tanılama: Tıbbi görüntülerdeki anomalileri hızlı ve doğru bir şekilde haritalamak için örnek segmentasyonunu kullanma.
- Uç Cihaz Dağıtımları: OpenVINO ve CoreML gibi dışa aktarma formatlarıyla sorunsuz entegrasyon, YOLOv8'in kısıtlı cihazlarda parlamasını sağlar.
Link to this sectionNe zaman DAMO-YOLO kullanmalı#
DAMO-YOLO özellikle şu niş senaryolarda faydalı olabilir:
- Akademik NAS Araştırması: Yeniden parametrelendirme veya otomatik mimari tasarım metodolojileri üzerinde çalışan ekipler için.
- Sadece GPU Destekli Hatlar: NAS yapılarının TensorRT yürütme sınırları için yoğun bir şekilde optimize edildiği belirli NVIDIA donanımlarında özel olarak çalışan uygulamalar.
Link to this sectionKullanım Durumları ve Öneriler#
YOLOv8 ve DAMO-YOLO arasında seçim yapmak; özel proje gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Link to this sectionYOLOv8 Ne Zaman Seçilmeli#
YOLOv8 şunlar için güçlü bir tercihtir:
- Çok Yönlü Çoklu Görev Dağıtımı: Ultralytics ekosistemi içinde algılama, segmentasyon, sınıflandırma ve poz tahmini için kanıtlanmış bir modele ihtiyaç duyan projeler.
- Yerleşik Üretim Sistemleri: Halihazırda YOLOv8 mimarisi üzerine kurulu, istikrarlı ve iyi test edilmiş dağıtım hatlarına sahip mevcut üretim ortamları.
- Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından yararlanan uygulamalar.
Link to this sectionNe Zaman DAMO-YOLO Seçilmeli#
DAMO-YOLO şunlar için önerilir:
- Yüksek Verimli Video Analitiği: Toplu-1 (batch-1) veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite kontrol gibi, özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Neural Architecture Search Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametreleştirilmiş omurgaların algılama performansı üzerindeki etkilerini inceleme.
Link to this sectionUltralytics (YOLO26) Ne Zaman Seçilmeli#
Çoğu yeni proje için, Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı, özel GPU hızlandırması olmayan cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Link to this sectionGeleceğe Bakış: Daha Yeni Ultralytics Modelleri#
YOLOv8 oldukça güvenilir bir iş gücü olmaya devam etse de, bilgisayarlı görü alanı hızla ilerlemektedir. Kullanıcılar daha yeni nesilleri keşfetmeyi de düşünmelidir:
YOLO26: En son nesil olan Ultralytics YOLO26, bir paradigma değişimini temsil eder. Yerel olarak Uçtan Uca NMS'siz Tasarım sunarak, Non-Maximum Suppression (NMS) sonrası işleme ile ilişkili gecikme darboğazlarını tamamen ortadan kaldırır. Yeni MuSGD Optimize Edici (SGD ve Muon'un bir hibriti) ve özel ProgLoss + STAL kayıp fonksiyonlarıyla desteklenen YOLO26, son derece kararlı bir eğitim ve çok daha gelişmiş küçük nesne tanıma sağlar. DFL Kaldırma (basitleştirilmiş dışa aktarma ve daha iyi uç cihaz/düşük güç uyumluluğu için Distribution Focal Loss kaldırıldı) ile mimari iyileştirmeler, önceki nesillere kıyasla %43'e varan Daha Hızlı CPU Çıkarımı sağlayarak onu modern uç bilişim için kesin seçim haline getirir.
YOLO11: Bir başka mükemmel alternatif olan Ultralytics YOLO11, YOLOv8'e kıyasla artımlı mimari iyileştirmeler sunar ve toplulukta oldukça benimsenmiş, sağlam bir model olmaya devam eder.
Modellerini prototipten üretime geçirmeye hazır mısın? Veri kümelerini otomatik olarak etiketlemek, deneyleri takip etmek ve modelleri buluta veya uç cihazlara sorunsuz bir şekilde dağıtmak için Ultralytics Platformunu kullan.
Sonuç olarak, DAMO-YOLO mimari arama konusunda ilginç akademik içgörüler sunsa da, Ultralytics modelleri önemli ölçüde daha olgun, çok yönlü ve geliştirici dostu bir ekosistem sağlar. İster YOLOv8'in kanıtlanmış kararlılığıyla devam et, ister YOLO26'nın ışık hızındaki, NMS'siz mimarisine yükselt; Ultralytics paketi gerçek zamanlı görü yapay zekası için bir numaralı tercih olmaya devam ediyor.