YOLOv5 ile DAMO-YOLO Karşılaştırması: Kapsamlı Bir Teknik Karşılaştırma
Gerçek zamanlı bilgisayar görüşü alanı sürekli gelişmekte olup, araştırmacılar ve mühendisler doğruluk, hız ve kullanılabilirliğin mükemmel dengesini yakalamak için çaba göstermektedir. Bu yolculuğu şekillendiren iki önde gelen model Ultralytics YOLOv5 ve Alibaba'nın DAMO-YOLO'sudur.
Bu kılavuz, bir sonraki dağıtımınız için doğru modeli seçmenize yardımcı olmak amacıyla mimari yapıları, performans metrikleri ve eğitim metodolojileri hakkında derinlemesine teknik bir analiz sunmaktadır.
Model Arka Planları
Teknik ayrıntılara dalmadan önce, bu etkili görüş modellerinin her birinin arkasındaki kökenleri ve temel tasarım felsefelerini anlamak önemlidir.
Ultralytics YOLOv5
Glenn Jocher ve Ultralytics ekibi tarafından geliştirilen YOLOv5, piyasaya sürülmesinden bu yana bir endüstri standardı haline gelmiştir. PyTorch çatısı üzerine yerel olarak inşa edilen bu model, kutudan çıktığı gibi sorunsuz bir geliştirici deneyimi ve sağlam dağıtım yeteneklerine öncelik vermiştir.
- Yazar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Belgeler:Ultralytics YOLOv5 Belgeleri
YOLOv5 hakkında daha fazla bilgi edinin.
DAMO-YOLO
Alibaba Grubu'ndaki araştırmacılar tarafından geliştirilen DAMO-YOLO, büyük ölçüde Sinirsel Mimari Arama (NAS) ve gelişmiş damıtma tekniklerine odaklanmaktadır. Donanıma özgü performansın teorik sınırlarını zorlamakta ve aşırı ayarlama gerektiren araştırma ve uç ortamlar için güçlü bir şekilde tasarlanmıştır.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş:Alibaba Group
- Tarih: 2022-11-23
- Arxiv:https://arxiv.org/abs/2211.15444v2
- GitHub:https://github.com/tinyvision/DAMO-YOLO
DAMO-YOLO hakkında daha fazla bilgi edinin
Mimari Yenilikler
Her iki model de gerçek zamanlı performanslarını elde etmek için benzersiz yapısal konseptlerden yararlanır, ancak yaklaşımları önemli ölçüde farklılık gösterir.
YOLOv5: Kararlılık ve Çok Yönlülük
YOLOv5, Modifiye Edilmiş CSP (Cross Stage Partial) backbone'unu bir PANet (Path Aggregation Network) boynu ile birlikte kullanır. Bu yapı oldukça verimlidir ve hem eğitim hem de çıkarım sırasında CUDA bellek kullanımını minimize eder.
YOLOv5'in en büyük güçlerinden biri, görevler arası çok yönlülüğüdür. Sınır kutusu tahminlerinin ötesinde, görüntü segmentasyonu ve görüntü sınıflandırması için özel mimariler sunarak geliştiricilerin görüş işlem hatlarını tek, tutarlı bir çerçeve etrafında standartlaştırmasına olanak tanır.
DAMO-YOLO: Otomatik Mimari Arama
DAMO-YOLO'nun temel yeniliği, MAE-NAS Backbone'udur. Çok Amaçlı Evrimsel arama kullanarak, Alibaba ekibi algılama doğruluğu ve çıkarım hızını dinamik olarak dengeleyen backbonelar keşfetti.
Ek olarak, geliştirilmiş özellik füzyonu için Efficient RepGFPN boynuna sahiptir; bu, uydu görüntüsü analizinde sıkça görülen karmaşık ölçek varyasyonları için oldukça faydalıdır. ZeroHead tasarımı, gecikmeyi azaltmak için son tahmin katmanlarını basitleştirir, ancak bu karmaşık yapısal üretim, mimariyi özel uygulamalar için daha katı ve değiştirmesi zor hale getirebilir.
Bellek Gereksinimleri
Transformer tabanlı mimariler genellikle yüksek VRAM tüketimiyle mücadele eder. Hem YOLOv5 hem de DAMO-YOLO, bellek ayak izlerini düşük tutmak için verimli evrişimsel tasarımlar kullanır, ancak Ultralytics modelleri, tüketici sınıfı GPU'lar için özellikle optimize edilmiştir, bu da onları bağımsız araştırmacılar ve startup'lar için çok daha erişilebilir kılar.
Performans ve Metrikler
Gerçek zamanlı nesne dedektörlerini değerlendirmek, mAP (ortalama Ortalama Hassasiyet), çıkarım hızı ve model boyutu parametrelerinden oluşan bir matrise bakmayı gerektirir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
DAMO-YOLO belirli parametre sayılarında oldukça rekabetçi mAP skorları elde etse de, YOLOv5, nano ve küçük konfigürasyonları için sürekli olarak olağanüstü TensorRT hızları ve inanılmaz derecede düşük parametre sayıları sergilemektedir. Bu performans dengesi, YOLOv5'in çeşitli uç dağıtım senaryolarında verimli bir şekilde çalışmasını sağlar.
Eğitim Verimliliği ve Ekosistem
Bir modelin teorik doğruluğu, yalnızca pratik uygulanabilirliği kadar iyidir. Modellerin önemli ölçüde ayrıştığı nokta burasıdır.
Damıtmanın Karmaşıklığı
DAMO-YOLO, çok aşamalı bir eğitim metodolojisine büyük ölçüde dayanır. AlignedOTA olarak bilinen bir öğretmen-öğrenci bilgi damıtma tekniğini uygular. Bu, öğrenci modelinden maksimum performansı çıkarırken, başlangıçta büyük bir öğretmen modeli eğitilmesini gerektirir. Bu durum, hesaplama süresini, enerji maliyetlerini ve gereken donanımı önemli ölçüde artırarak çevik ML ekipleri için bir darboğaz oluşturur.
Ultralytics Avantajı: Kullanım Kolaylığı
Tersine, Ultralytics ekosistemi, sezgisel API'leri ve eğitim verimliliği ile dünya çapında tanınmaktadır. Aktif geliştirme ve devasa bir açık kaynak topluluğu tarafından desteklenen geliştiriciler, modelleri sorunsuz bir şekilde eğitebilir, doğrulayabilir ve dağıtabilir.
from ultralytics import YOLO
# Load a pretrained YOLOv5 model
model = YOLO("yolov5s.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")
Ultralytics, Weights & Biases ve Comet ML gibi araçlar aracılığıyla deney takibi için yerleşik destek sağlayarak sürtünmesiz bir iş akışı oluşturur.
Gerçek Dünya Kullanım Durumları
- YOLOv5, hızlı tempolu üretim ortamlarında üstün performans gösterir. Kolay dışa aktarılabilirliği, onu akıllı perakende analizi, yüksek hızlı üretim hatası tespiti ve CoreML aracılığıyla mobil uygulamalara entegrasyon için başlıca tercih haline getirir.
- DAMO-YOLO, katı akademik kıyaslamalar ve belirli, sabit donanım hedefleri için küçük mAP iyileştirmeleri elde etmeyi amaçlayan uzun, damıtılmış eğitim süreçlerini yürütmek için geniş hesaplama kaynaklarının mevcut olduğu senaryolar için son derece uygundur.
Kullanım Durumları ve Öneriler
YOLOv5 ve DAMO-YOLO arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
YOLOv5 Ne Zaman Tercih Edilmeli?
YOLOv5, aşağıdaki durumlar için güçlü bir seçenektir:
- Kanıtlanmış Üretim Sistemleri: YOLOv5'in uzun süreli istikrar geçmişinin, kapsamlı dokümantasyonunun ve büyük topluluk desteğinin değerli olduğu mevcut dağıtımlar.
- Kaynak Kısıtlı Eğitim: Sınırlı GPU kaynaklarına sahip ortamlarda, YOLOv5'in verimli eğitim hattının ve daha düşük bellek gereksinimlerinin avantaj sağladığı durumlar.
- Kapsamlı Dışa Aktarma Formatı Desteği: ONNX, TensorRT, CoreML ve TFLite dahil olmak üzere birçok formatta dağıtım gerektiren projeler.
Ne Zaman DAMO-YOLO Seçmeli
DAMO-YOLO, aşağıdaki durumlar için önerilir:
- Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.
Ultralytics (YOLO26) Ne Zaman Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Bir Sonraki Evrim: YOLO26
Yeni bir projeye başlıyorsanız, geleceğe yönelmeniz şiddetle tavsiye edilir. Ultralytics YOLO26, YOLOv5'in inanılmaz temeli üzerine inşa edilmiştir ve son teknoloji yapay görme yapay zekasını yeniden tanımlayan devrim niteliğindeki gelişmeleri birleştirir.
Neden YOLO26'ya Yükseltmeli?
Evrensel beğeniyle piyasaya sürülen YOLO26, doğal olarak uçtan ucadır. Önemli ölçüde daha hızlı, daha basit dağıtım için Non-Maximum Suppression (NMS) son işlemeyi tamamen ortadan kaldıran Uçtan Uca NMS'siz Tasarım özelliğine sahiptir.
YOLO26'daki temel yenilikler şunları içerir:
- MuSGD Optimizasyonu: LLM eğitim yeniliklerinden ilham alan bu SGD ve Muon hibriti, son derece kararlı eğitim ve hızlı yakınsama sağlar.
- Yüzde 43'e Kadar Daha Hızlı CPU Çıkarımı: Uç bilişim için yoğun şekilde optimize edilmiştir, bu da onu özel GPU'lar olmadan çalışan IoT cihazları için mükemmel hale getirir.
- ProgLoss + STAL: Hava drone görüntüleri ve robotik için kritik öneme sahip küçük nesnelerin tanınmasını önemli ölçüde iyileştiren gelişmiş kayıp fonksiyonları.
- Göreve Özel İyileştirmeler: Yönlendirilmiş Sınırlayıcı Kutular (OBB) için özel açı kaybından, doğru Poz tahmini için Artık Log-Olasılık Tahmini (RLE) yöntemine kadar, YOLO26 karmaşık alanları kolaylıkla ele alır.
Sonuç
Hem YOLOv5 hem de DAMO-YOLO, nesne algılama tarihinde yerlerini sağlamlaştırmışlardır. DAMO-YOLO, Sinirsel Mimari Arama ve damıtma konusunda büyüleyici bir çalışma olmaya devam etmektedir. Ancak, iyi yönetilen bir ekosisteme, kullanım kolaylığına ve üretime hızlı bir yola öncelik veren kuruluşlar için Ultralytics modelleri eşsiz kalmaktadır.
Bilgisayar görüşü hattınızın geleceğe hazır, hızlı ve olağanüstü doğru olmasını sağlayarak, YOLO26 gibi yeni nesil modelleri etiketlemek, eğitmek ve dağıtmak için Ultralytics Platformu'nu kullanmanızı şiddetle tavsiye ederiz.
Daha Fazla Okuma
- Yüksek doğruluklu uygulamalar için transformer tabanlı RT-DETR'ı keşfedin.
- Önceki nesil YOLO11 modeli hakkında bilgi edinin.
- OpenVINO ile dağıtımları nasıl optimize edeceğinizi keşfedin.