YOLO11 ve DAMO-YOLO: Yeni Nesil Nesne Detectörlerini Karşılaştırma

Optimal mimariyi seçmek, herhangi bir bilgisayar görüşü projesinde kritik bir adımdır. Bu teknik kılavuz, iki güçlü nesne detect modeli arasında kapsamlı bir karşılaştırma sunar: Ultralytics YOLO11 ve DAMO-YOLO. Dağıtım ihtiyaçlarınız için en iyi aracı seçmenize yardımcı olmak amacıyla mimari yeniliklerine, eğitim paradigmalarına ve gerçek dünya uygulanabilirliklerine derinlemesine ineceğiz.

Model Genel Bakışları

Ultralytics YOLO11

Ultralytics ekibi tarafından geliştirilen YOLO11, YOLO ailesinde oldukça rafine bir yinelemeyi temsil eder, hem doğruluğu hem de verimliliği büyük ölçüde optimize eder. Veri kümesi yönetiminden kenar dağıtımına kadar uzanan birleşik, üretime hazır bir ekosistem arayan araştırmacılar ve mühendisler için tasarlanmıştır.

Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/YOLO11/

YOLO11 hakkında daha fazla bilgi edinin

YOLO11, çok yönlülüğüyle öne çıkar. Birçok geleneksel model yalnızca sınırlayıcı kutulara odaklanırken, YOLO11 doğal olarak nesne detect, örnek segmentasyon, görüntü sınıflandırma ve poz tahminini destekler. Bu çok modlu yetenek, geliştiricilerin görsel yapay zeka boru hatlarını tek, iyi bakımlı bir çerçeve altında birleştirmesine olanak tanır.

DAMO-YOLO

DAMO-YOLO, Alibaba Group'taki araştırmacılar tarafından geliştirilmiştir. GPU'larda ve diğer hızlandırıcılarda gerçek zamanlı çıkarım için özel olarak tasarlanmış yüksek verimli backboneları keşfetmek için Sinirsel Mimari Arama (NAS) kullanır.

Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO
Belgeler:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO hakkında daha fazla bilgi edinin

DAMO-YOLO'nun temel felsefesi, rep-parametrizasyon ve otomatik arama etrafında döner. Yazarlar, MAE-NAS (Çok Amaçlı Evrimsel Sinir Mimarisi Araması) kullanarak, özel donanımlarda çıkarım hızlarını önemli ölçüde artıran özel bir backbone tasarladılar. Ayrıca, gecikmeyi en aza indirmek için Efficient RepGFPN adı verilen yoğun şekilde optimize edilmiş bir neck ve basitleştirilmiş bir ZeroHead yapısı içerir.

Dikkate Alınması Gereken Diğer Modeller

YOLO11 ve DAMO-YOLO'yu karşılaştırırken, daha yeni Ultralytics YOLO26'yı incelemeyi düşünebilirsiniz. Bu model, yerel olarak uçtan uca NMS-free çıkarım sunar ve %43'e kadar daha hızlı CPU hızları sağlar. Ayrıca YOLOX veya YOLOv8 içeren karşılaştırmaları da inceleyebilirsiniz.

Performans ve Mimari Karşılaştırması

Edge AI uygulamalarını dağıtırken performans ödünleşimlerini anlamak hayati önem taşır. Aşağıdaki tablo, ortalama Hassasiyet (mAP), gecikme ve hesaplama boyutu gibi temel metrikleri özetlemektedir.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

Mimari Derinlemesine İnceleme

YOLO11, parametre sayısı ile temsil kapasitesini mükemmel bir şekilde dengeleyen, yüksek verimli, özel tasarlanmış bir backbone'a dayanır. Hem eğitim hem de çıkarım sırasında minimum CUDA bellek kullanımıyla çeşitli donanımlarda sorunsuz çalışacak şekilde optimize edilmiştir. Bu da onu standart tüketici donanımları veya kaynak kısıtlı IoT cihazları için mükemmel bir seçenek haline getirir.

Tersine, DAMO-YOLO'nun MAE-NAS tarafından üretilen backbones'ları, yüksek verimli GPU ortamları için ince ayar yapılmıştır. Efficient RepGFPN (Genelleştirilmiş Özellik Piramit Ağı), birden fazla ölçeği agresif bir şekilde entegre eder. Ancak, rep-parametrizasyon çıkarımı hızlandırsa da, donanım yığınınız bu işlemleri açıkça iyi desteklemiyorsa dağıtım sürecini karmaşıklaştırabilir.

Kullanılabilirlik ve Eğitim Verimliliği

Geliştirme süresi hesaba katıldığında, bir modelin Kullanım Kolaylığı da ham performans ölçütleri kadar önemli hale gelir.

YOLO11 geliştirici erişilebilirliği ilkesi üzerine yoğun bir şekilde inşa edilmiştir. Kapsamlı ultralytics paketi, veri kümesi ayrıştırma, artırma ve hiperparametre ayarlama gibi zorlu işleri soyutlar. Modelleri üretim formatlarına aktarmak, ONNX, TensorRTve OpenVINO yalnızca tek bir komut gerektirir.

from ultralytics import YOLO

# Initialize YOLO11 object detection model
model = YOLO("yolo11s.pt")

# Train the model with mixed precision on COCO8
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for edge deployment
model.export(format="engine", device=0)

DAMO-YOLO, akademik ve araştırma ağırlıklı bir geçmişten gelmesi nedeniyle daha dik bir öğrenme eğrisi sunar. En yüksek doğruluğuna ulaşmak genellikle karmaşık bilgi damıtma işlem hatlarını içerir; bu da, bu bilgiyi daha küçük bir "öğrenci" ağına aktarmadan önce devasa bir "öğretmen" ağı eğitmeniz gerektiği anlamına gelir. Bu durum, Ultralytics modellerinin yalın eğitim döngülerine kıyasla gerekli GPU hesaplama yükünü ve genel eğitim süresini büyük ölçüde artırır.

Kullanım Durumları ve Öneriler

YOLO11 ve DAMO-YOLO arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.

Ne Zaman YOLO11 Seçmeli

YOLO11 için güçlü bir seçenektir:

Üretim Uç Cihaz Dağıtımı: Güvenilirliğin ve aktif bakımın çok önemli olduğu Raspberry Pi veya NVIDIA Jetson gibi cihazlardaki ticari uygulamalar.
Çok Görevli Görüntü İşleme Uygulamaları: Tek bir birleşik çerçeve içinde detect, segment, poz tahmini ve obb gerektiren projeler.
Hızlı Prototipleme ve Dağıtım: Basitleştirilmiş Ultralytics python API'sini kullanarak veri toplama aşamasından üretime hızla geçmesi gereken ekipler.

Ne Zaman DAMO-YOLO Seçmeli

DAMO-YOLO, aşağıdaki durumlar için önerilir:

Yüksek Verimli Video Analizi: Batch-1 veriminin birincil metrik olduğu sabit NVIDIA GPU altyapısında yüksek FPS video akışlarını işleme.
Endüstriyel Üretim Hatları: Montaj hatlarında gerçek zamanlı kalite denetimi gibi özel donanımlarda katı GPU gecikme kısıtlamaları olan senaryolar.
Sinirsel Mimari Arama Araştırması: Otomatik mimari aramanın (MAE-NAS) ve verimli yeniden parametrelendirilmiş backboneların algılama performansı üzerindeki etkilerini inceleme.

Ultralytics (YOLO26) Ne Zaman Seçilmeli

Çoğu yeni proje için Ultralytics YOLO26, performans ve geliştirici deneyiminin en iyi kombinasyonunu sunar:

NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

Gerçek Dünya Uygulamaları ve Kullanım Senaryoları

Otonom Sistemler ve Drone'lar

Hava görüntüleri ve İHA dağıtımları için YOLO11, inanılmaz derecede uygun bir performans dengesi sunar. Küçük nesne tespiti, drone analizlerinde büyük bir engeldir, ancak YOLO11 farklı ölçekleri yerel olarak kutudan çıktığı gibi ele alır. Ek olarak, düşük bellek gereksinimleri, YOLO11 Nano ve Small varyantlarının doğrudan drone'a takılı hafif edge CPU'lar veya NPU'lar üzerinde çalışmasına olanak tanır.

Endüstriyel Otomasyon ve Kalite Kontrol

Akıllı fabrikalarda gecikme süresi çok önemlidir. DAMO-YOLO, RepGFPN neck'i sayesinde ağır sunucu sınıfı GPU'larda güçlü çıkarım hızları sunsa da, katı entegrasyon aşırıya kaçabilir. YOLO11, basit tracking API'leri ve kusurların açılı sınır tanıma gerektirmesi durumunda saf detection'dan yönlendirilmiş sınırlayıcı kutu (OBB) görevlerine sorunsuz bir şekilde geçiş yapabilme yeteneği nedeniyle otomatik kalite kontrol için genellikle üstün bir alternatif olarak işlev görür.

Akıllı Sağlık ve Tıbbi Görüntüleme

Tıbbi görüntüleme veri kümeleri genellikle nispeten küçüktür ve aşırı uyumu önlemek zordur. Aktif artırma teknikleri, Ultralytics'in İyi Yönetilen Ekosistemi tarafından sağlanan standart transfer öğrenimi işlem hatlarıyla birleştiğinde, klinisyenlerin ve geliştiricilerin doğru tümör detection modellerini güvenilir bir şekilde dağıtmalarına yardımcı olur. Geniş topluluk desteği, sağlık hizmetleri gibi karmaşık alanlardaki sorunların hızla çözülmesini sağlar.

YOLO26 ile Geleceği Kucaklamak

Sıfırdan yeni bir uygulama geliştiriyorsanız, YOLO26'yı keşfetmeyi düşünebilirsiniz. 2026'nın başlarında piyasaya sürülen bu model, MuSGD Optimizer ve ProgLoss fonksiyonlarını kullanarak küçük nesnelerde olağanüstü doğruluk sunar ve kutudan çıktığı gibi uçtan uca NMS-free bir işlem hattı sağlar!

Sonuç olarak, DAMO-YOLO Sinir Mimarisi Aramasının güçlü bir gösterimi olmaya devam etse de, YOLO11 ve genişletilmiş Ultralytics ailesi, hızlı dağıtım, geliştirici kolaylığı ve üst düzey çok modlu performansı önceliklendirerek gerçek dünya bilgisayar görüşü görevleri için kesin öneri olmaya devam etmektedir.