YOLO11 ile DAMO-YOLO Karşılaştırması: Yeni Nesil Nesne Dedektörlerini Karşılaştırma
En uygun mimariyi seçmek, herhangi bir bilgisayarlı görü projesinde kritik bir adımdır. Bu teknik kılavuz, iki güçlü nesne algılama modeli olan Ultralytics YOLO11 ve DAMO-YOLO arasında kapsamlı bir karşılaştırma sunar. Dağıtım ihtiyaçlarınız için en iyi aracı seçmenize yardımcı olmak amacıyla mimari yeniliklerine, eğitim paradigmalarına ve gerçek dünya uygulanabilirliklerine derinlemesine bakacağız.
Model Genel Bakışları
Ultralytics YOLO11
Ultralytics ekibi tarafından geliştirilen YOLO11, hem doğruluk hem de verimlilik açısından yoğun şekilde optimize edilmiş, YOLO ailesindeki oldukça rafine bir yinelemeyi temsil eder. Veri kümesi yönetiminden uç birim dağıtımına kadar uzanan birleşik, üretime hazır bir ekosistem arayan araştırmacılar ve mühendisler için tasarlanmıştır.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Organizasyon: Ultralytics
- Tarih: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Dokümanlar: https://docs.ultralytics.com/models/yolo11/
YOLO11 hakkında daha fazla bilgi edin
YOLO11 çok yönlülüğüyle öne çıkar. Birçok geleneksel model yalnızca sınırlayıcı kutulara (bounding box) odaklanırken, YOLO11 nesne algılama, örnek bölümleme, görüntü sınıflandırma ve poz kestirimi işlemlerini yerel olarak destekler. Bu çok modlu yetenek, geliştiricilerin görü işlemleri AI süreçlerini tek, iyi bakılan bir çerçeve altında birleştirmelerine olanak tanır.
DAMO-YOLO
DAMO-YOLO, Alibaba Group'taki araştırmacılar tarafından geliştirilmiştir. GPU'lar ve diğer hızlandırıcılar üzerinde gerçek zamanlı çıkarım için özel olarak tasarlanmış, yüksek verimli omurgaları keşfetmek amacıyla Neural Architecture Search (NAS) yönteminden yararlanır.
- Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
- Kuruluş: Alibaba Group
- Tarih: 2022-11-23
- Arxiv: https://arxiv.org/abs/2211.15444v2
- GitHub: https://github.com/tinyvision/DAMO-YOLO
- Dokümantasyon: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO hakkında daha fazla bilgi edinin
DAMO-YOLO'nun temel felsefesi, temsil parametreleştirme (rep-parameterization) ve otomatik arama etrafında şekillenir. Yazarlar, MAE-NAS (Çok Amaçlı Evrimsel Sinir Mimarisi Arama) kullanarak, özel donanım üzerinde çıkarım hızlarını önemli ölçüde artıran özel bir omurga tasarladılar. Ayrıca, gecikmeyi en aza indirmek için Efficient RepGFPN adlı yoğun şekilde optimize edilmiş bir boyun yapısını ve basitleştirilmiş bir ZeroHead yapısını içerir.
YOLO11 ve DAMO-YOLO'yu karşılaştırırken, daha yeni olan Ultralytics YOLO26 modeline göz atmayı düşünebilirsin. Bu model, yerel olarak uçtan uca NMS'siz çıkarım sunar ve CPU hızlarında %43'e varan bir artış sağlar. Ayrıca YOLOX veya YOLOv8 içeren karşılaştırmaları da inceleyebilirsin.
Performans ve Mimari Karşılaştırması
Uç birim AI uygulamalarını dağıtırken performans ödünleşimlerini anlamak hayati önem taşır. Aşağıdaki tablo; ortalama Hassasiyet (mAP), gecikme ve hesaplama boyutu gibi temel metrikleri ana hatlarıyla belirtir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Mimari Derinlemesine İnceleme
YOLO11, parametre sayısı ile temsil kapasitesini mükemmel bir şekilde dengeleyen, yüksek verimli ve özel olarak tasarlanmış bir omurgaya dayanır. Çeşitli donanımlarda harika çalışacak şekilde optimize edilmiştir ve hem eğitim hem de çıkarım sırasında minimum CUDA belleği kullanımıyla doğal olarak öne çıkar. Bu, onu standart tüketici donanımı veya kaynak kısıtlı IoT cihazları için mükemmel bir seçenek haline getirir.
Buna karşılık, DAMO-YOLO'nun MAE-NAS tarafından oluşturulan omurgaları, yüksek verimli GPU ortamları için ince ayarlanmıştır. Efficient RepGFPN (Genelleştirilmiş Özellik Piramit Ağı), çoklu ölçekleri agresif bir şekilde entegre eder. Bununla birlikte, rep-parameterization çıkarımı hızlandırsa da, donanım yığınının bu işlemleri iyi desteklememesi durumunda dağıtım sürecini karmaşıklaştırabilir.
Kullanılabilirlik ve Eğitim Verimliliği
Geliştirme süresi hesaba katıldığında, bir modelin Kullanım Kolaylığı, ham kıyaslama değerleri kadar önemli hale gelir.
YOLO11, yoğun bir şekilde geliştirici erişilebilirliği ilkesi üzerine inşa edilmiştir. Kapsamlı ultralytics paketi; veri kümesi ayrıştırma, artırma ve hiperparametre ayarlama gibi ağır işleri soyutlar. Modelleri ONNX, TensorRT ve OpenVINO gibi üretim formatlarına aktarmak yalnızca tek bir komut gerektirir.
from ultralytics import YOLO
# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")
# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)Akademik ve araştırma ağırlıklı bir geçmişten gelen DAMO-YOLO, daha dik bir öğrenme eğrisi sunar. En yüksek doğruluğuna ulaşmak genellikle karmaşık bilgi damıtma süreçlerini içerir; bu da daha küçük bir "öğrenci" ağına aktarmadan önce devasa bir "öğretmen" ağını eğitmen gerektiği anlamına gelir. Bu durum, Ultralytics modellerinin yalın eğitim döngülerine kıyasla gereken GPU hesaplama yükünü ve genel eğitim süresini büyük ölçüde artırır.
Kullanım Durumları ve Öneriler
YOLO11 ile DAMO-YOLO arasında seçim yapmak; projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman YOLO11 Seçilmeli
YOLO11 şunlar için güçlü bir tercihtir:
- Üretim Uç Dağıtımı: Güvenilirlik ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
- Çok Görevli Görü Uygulamaları: Tek bir birleşik çerçeve içinde algılama, segmentasyon, poz tahmini ve OBB gerektiren projeler.
- Hızlı Prototipleme ve Dağıtım: Kolaylaştırılmış Ultralytics Python API kullanarak veri toplamadan üretime hızlı bir şekilde geçmesi gereken ekipler.
Ne Zaman DAMO-YOLO Seçilmeli
DAMO-YOLO şunlar için önerilir:
- Yüksek Verimli Video Analitiği: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS'li video akışlarını işleme.
- Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanım üzerinde katı GPU gecikme kısıtlamaları olan senaryolar.
- Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş ana gövdelerin tespit performansı üzerindeki etkilerini inceleme.
Ne Zaman Ultralytics (YOLO26) Seçilmeli
Çoğu yeni proje için Ultralytics YOLO26 performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Gerçek Dünya Uygulamaları ve Kullanım Durumları
Otonom Sistemler ve İHA'lar
Hava görüntüleri ve İHA dağıtımları için YOLO11, inanılmaz derecede elverişli bir performans dengesi sağlar. Küçük nesne algılama, İHA analizlerinde büyük bir engeldir ancak YOLO11, kutudan çıktığı haliyle değişen ölçekleri doğal olarak yönetir. Ayrıca, düşük bellek gereksinimleri sayesinde YOLO11 Nano ve Small varyantları, İHA'ya takılı hafif uç birim CPU'lar veya NPU'lar üzerinde doğrudan çalışabilir.
Endüstriyel Otomasyon ve Kalite Kontrol
Akıllı fabrikalarda gecikme süresi çok önemlidir. DAMO-YOLO, RepGFPN boyun yapısı sayesinde ağır sunucu sınıfı GPU'larda sağlam çıkarım hızları sunsa da, bu katı entegrasyon gereğinden fazla olabilir. YOLO11, basit takip API'leri ve kusurların açılı sınır tanıma gerektirmesi durumunda saf algılamadan yönlendirilmiş sınırlayıcı kutu (OBB) görevlerine sorunsuz bir şekilde geçebilme yeteneği nedeniyle otomatik kalite kontrol için üstün bir alternatif olarak hizmet eder.
Akıllı Sağlık ve Tıbbi Görüntüleme
Tıbbi görüntüleme veri kümeleri genellikle nispeten küçüktür ve aşırı uyumu (overfitting) önlemek zordur. Ultralytics'in İyi Bakılan Ekosistemi tarafından sağlanan standart transfer öğrenme süreçleriyle birleştirilmiş aktif artırma teknikleri, klinisyenlerin ve geliştiricilerin doğru tümör algılama modellerini güvenilir bir şekilde dağıtmalarına yardımcı olur. Geniş topluluk desteği, sağlık hizmetleri gibi karmaşık alanlardaki sorunların hızlı bir şekilde çözülmesini sağlar.
Sıfırdan yeni bir uygulama oluşturuyorsan, YOLO26 modelini keşfetmeyi düşün. 2026'nın başlarında piyasaya sürülen bu model, MuSGD Optimizer ve ProgLoss işlevlerini kullanarak küçük nesnelerde olağanüstü doğruluk sağlar ve kutudan çıktığı haliyle uçtan uca NMS'siz bir süreç sunar!
Sonuç olarak, DAMO-YOLO Neural Architecture Search'ün güçlü bir gösterimi olmaya devam etse de, YOLO11 ve genişletilmiş Ultralytics ailesi; hızlı dağıtım, geliştirici kolaylığı ve üst düzey çok modlu performansa öncelik vererek gerçek dünya bilgisayarlı görü görevleri için kesin öneri olmaya devam etmektedir.