DAMO-YOLO ve YOLO11: Teknik Bir Karşılaştırma
Bilgisayar görüşü alanındaki hızlı gelişmelerde, doğru nesne algılama modelini seçmek uygulama başarısı için kritik öneme sahiptir. Bu kapsamlı karşılaştırma, Alibaba Group tarafından geliştirilen DAMO-YOLO ve Ultralytics'in en son teknoloji modeli olan Ultralytics YOLO11 olmak üzere iki önemli mimariyi analiz etmektedir. Her iki model de hız ve doğruluk arasındaki dengeyi optimize etmeyi amaçlarken, farklı birincil amaçlara hizmet ederler ve dağıtım senaryosuna bağlı olarak farklı avantajlar sunarlar.
Bu kılavuz, geliştiricilerin ve araştırmacıların bilinçli kararlar almasına yardımcı olmak amacıyla mimarilerine, performans metriklerine ve ideal kullanım durumlarına derinlemesine bir bakış sunar.
DAMO-YOLO
Yazarlar: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Kuruluş:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHub:https://github.com/tinyvision/DAMO-YOLO
Belgeler:https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md
DAMO-YOLO, yüksek performans elde etmek için çeşitli son teknoloji teknolojileri entegre eden bir nesne algılama çerçevesidir. Alibaba'nın araştırmasıyla yönlendirilen bir dizi mimari yenilik yoluyla rekabetçi doğruluğu korurken gecikmeyi azaltmaya odaklanır.
DAMO-YOLO hakkında daha fazla bilgi edinin
Mimari ve İnovasyon
DAMO-YOLO, bir "Distill-and-Select" yaklaşımı sunar ve aşağıdaki temel bileşenleri içerir:
- MAE-NAS Backbone: Sinirsel Mimari Arama (NAS) kullanılarak, backbone verimli özellik çıkarımını sağlamak için belirli kısıtlamalar altında optimize edilmiştir.
- Verimli RepGFPN: Genelleştirilmiş bir Özellik Piramidi Ağı (GFPN), çıkarım sırasında ağır hesaplama maliyetlerine neden olmadan farklı ölçeklerde özellik birleştirmesini iyileştirmek için yeniden parametrelendirme mekanizmalarını yoğun bir şekilde kullanır.
- ZeroHead: Bu hafif detect başlığı, çıkarım hızını en üst düzeye çıkarmayı amaçlayarak sınıflandırma ve regresyon görevlerini birbirinden ayırır.
- AlignedOTA: Eğitim sırasında yakınsamayı artırarak sınıflandırma ve regresyon hedefleri arasındaki uyumsuzluğu çözen bir etiket atama stratejisidir.
DAMO-YOLO etkileyici teorik gelişmeler sunsa da, öncelikle nesne algılama'ya odaklanan araştırma odaklı bir çerçevedir. Genellikle daha kapsamlı ekosistemlerde bulunan yerel çoklu görev desteğinden yoksundur.
Ultralytics YOLO11
Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Belgeler:https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11, mimari, verimlilik ve kullanım kolaylığındaki önemli iyileştirmelerle YOLO serisinin mirasını iyileştiren, gerçek zamanlı bilgisayar görüşünün zirvesini temsil eder. Sadece bir model olarak değil, çeşitli donanım ortamlarında pratik, gerçek dünya dağıtımı için çok yönlü bir araç olarak tasarlanmıştır.
YOLO11 hakkında daha fazla bilgi edinin
Mimari ve Ekosistem
YOLO11, iyileştirilmiş anchor-free mimarisi ile önceki başarıları üzerine inşa edilmiştir. Üstün özellik çıkarımı için geliştirilmiş bir backbone ve çeşitli ölçeklerde bilgi akışını iyileştiren değiştirilmiş bir neck tasarımına sahiptir.
Ultralytics YOLO11 çerçevesinin temel avantajları şunlardır:
- Çok Yönlülük: Birçok rakibin aksine, YOLO11 yerel olarak nesne algılama, örnek segmentasyonu, poz tahmini, görüntü sınıflandırması ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere çok çeşitli görevleri destekler.
- Kullanım Kolaylığı: Model, kullanıcı dostu bir Python API ve CLI ile sarılmıştır ve hem yeni başlayanlar hem de uzmanlar için erişilebilir hale getirilmiştir.
- Eğitim Verimliliği: Daha hızlı yakınsama için optimize edilmiş YOLO11, verimli veri artırma ve kayıp fonksiyonları kullanır ve kullanıcıların COCO gibi veri kümeleri üzerinde daha düşük kaynak yüküyle özel modeller eğitmesine olanak tanır.
- İyi Yönetilen Ekosistem: Ultralytics ekibi tarafından desteklenen kullanıcılar, sık güncellemelerden, kapsamlı belgelerden ve Ultralytics HUB gibi MLOps araçlarıyla sorunsuz entegrasyondan yararlanır.
Biliyor muydunuz?
YOLO11, Edge AI cihazlarında oldukça verimli olacak şekilde tasarlanmıştır. Optimize edilmiş mimarisi, NVIDIA Jetson ve Raspberry Pi gibi donanımlarda düşük bellek kullanımı ve yüksek çıkarım hızları sağlayarak, onu daha ağır transformatör tabanlı modellere kıyasla gömülü uygulamalar için üstün bir seçim haline getirir.
Performans Karşılaştırması
Aşağıdaki grafik ve tablo, DAMO-YOLO ve YOLO11 arasındaki performans farklılıklarını göstermektedir. Ultralytics YOLO11, özellikle DAMO-YOLO'nun resmi kıyaslamalarının bulunmadığı CPU donanımında sürekli olarak üstün doğruluk (mAP) ve uygun çıkarım hızları göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Sonuçların Analizi
- Doğruluk: YOLO11, karşılaştırılabilir DAMO-YOLO modellerinden önemli ölçüde daha iyi performans gösteriyor. Örneğin, YOLO11m, daha az parametreye (20.1M'ye karşı 28.2M) sahip olmasına rağmen, 49.2 mAP olan DAMO-YOLOm'den belirgin şekilde daha yüksek olan 51.5 mAP'ye ulaşıyor.
- Çıkarım Hızı: GPU'da (T4 TensorRT) YOLO11, oldukça rekabetçi gecikme süresi sunar. YOLO11n, 1,5 ms ile inanılmaz derecede hızlıdır ve ultra düşük gecikmeli uygulamalar için uygundur.
- CPU Performansı: Ultralytics modellerinin en büyük avantajı, CPU performansı konusundaki şeffaflıklarıdır. YOLO11, ONNX ve OpenVINO aracılığıyla CPU çıkarımı için optimize edilmiştir, DAMO-YOLO ise genellikle CPU dağıtım performansını tanımsız bırakarak GPU'ya yoğun bir şekilde odaklanır.
- Model Verimliliği: YOLO11, performans için daha iyi bir parametre dengesi gösterir. Mimari verimlilik, daha küçük model dosyalarına olanak tanır; bu da daha hızlı indirmeler ve uç cihazlarda daha düşük depolama gereksinimleri anlamına gelir.
Temel Ayırt Edici Özellikler ve Kullanım Alanları
Ultralytics YOLO11'in Güçlü Yönleri
Ultralytics YOLO11'i kullanan geliştiriciler, güçlü bir üretim sınıfı ortama erişim kazanır.
- Performans Dengesi: Model mimarisi, gerçek zamanlı video analitiği için çok önemli olan çıkarım hızı ve doğruluk arasında en iyi dengeyi sunmak için titizlikle ayarlanmıştır.
- Çoklu Görev Yetenekleri: Proje kapsamınız algılamadan takibe veya segmentasyona genişlerse, YOLO11 bunu aynı kod tabanı içinde sorunsuz bir şekilde halleder.
- Kullanım Kolaylığı:
ultralyticspaketi tüm hattı basitleştirir. Bir model yüklemek, tahminler yürütmek ve CoreML, TFLite veya TensorRT gibi formatlara aktarmak yalnızca birkaç satır kodla yapılabilir. - Daha Düşük Bellek Gereksinimleri: Transformatör tabanlı dedektörlere veya optimize edilmemiş mimarilere kıyasla, YOLO11 genellikle eğitim sırasında daha az CUDA belleği gerektirir ve araştırmacıların tüketici sınıfı GPU'larda eğitim yapmasını sağlar.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
DAMO-YOLO'nun Güçlü Yönleri
DAMO-YOLO, akademik araştırma çevrelerinde güçlü bir rakiptir.
- Araştırma İnovasyonu: MAE-NAS ve ZeroHead gibi özellikler, sinir ağı mimarisi arama ve başlık ayrıştırma hakkında ilginç bilgiler sunar.
- GPU Verimi: Yalnızca desteklenen GPU'larda çalışan belirli endüstriyel uygulamalar için DAMO-YOLO yüksek verim sağlar, ancak genellikle parametre başına saf doğruluk verimliliğinde YOLO11'in gerisinde kalır.
Sonuç
DAMO-YOLO, Alibaba'nın araştırma ekibinden yeni kavramlar sunsa da, Ultralytics YOLO11, geliştiricilerin ve işletmelerin büyük çoğunluğu için üstün bir seçim olarak öne çıkıyor. Üstünlüğü sadece daha yüksek mAP puanları ve daha hızlı çıkarımla değil, onu destekleyen kapsamlı ekosistemle tanımlanır.
Kullanım kolaylığı ve çok yönlülükten, iyi yönetilen bir kod tabanına ve aktif topluluk desteğine kadar YOLO11, gelişmiş yapay zeka çözümleri oluşturmak için giriş engelini düşürür. İster bulut sunucularında ister kaynak kısıtlı uç cihazlarda dağıtım yapın, YOLO11 modern bilgisayar görüşü uygulamaları için gerekli güvenilirliği ve performansı sağlar.
Diğer Model Karşılaştırmalarını İnceleyin
Ultralytics modellerinin diğer mimarilerle nasıl karşılaştırıldığını daha iyi anlamak için ayrıntılı karşılaştırma sayfalarımızı inceleyin:
- YOLO11 - YOLOv10
- YOLO11 - RT-DETR Karşılaştırması
- DAMO-YOLO ve YOLOv8 Karşılaştırması
- DAMO-YOLO - YOLOv9 Karşılaştırması
- YOLO11 - EfficientDet Karşılaştırması