DAMO-YOLO ve YOLO11: Teknik Bir Karşılaştırma
Bilgisayarla görmenin hızla gelişen ortamında, doğru nesne algılama modelini seçmek uygulama başarısı için kritik öneme sahiptir. Bu kapsamlı karşılaştırma iki önemli mimariyi analiz etmektedir: Alibaba Group tarafından geliştirilen YOLO ve Ultralytics YOLO11Ultralytics'in en son teknoloji ürünü modeli. Her iki model de hız ve doğruluk arasındaki dengeyi optimize etmeyi amaçlarken, farklı birincil amaçlara hizmet eder ve dağıtım senaryosuna bağlı olarak farklı avantajlar sunar.
Bu kılavuz, geliştiricilerin ve araştırmacıların bilinçli kararlar vermelerine yardımcı olmak için mimarilerine, performans ölçümlerine ve ideal kullanım durumlarına derinlemesine bir bakış sunmaktadır.
DAMO-YOLO
Yazarlar Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang ve Xiuyu Sun
Organizasyon:Alibaba Group
Tarih: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO
DocsYOLOYOLO
YOLO , yüksek performans elde etmek için çeşitli en son teknolojileri entegre eden bir nesne algılama çerçevesidir. Alibaba'nın araştırmaları tarafından yönlendirilen bir dizi mimari yenilikle rekabetçi doğruluğu korurken gecikmeyi azaltmaya odaklanır.
DAMO-YOLO hakkında daha fazla bilgi edinin
Mimarlık ve İnovasyon
YOLO "Ayıkla ve Seç" yaklaşımını benimsemekte ve aşağıdaki temel bileşenleri içermektedir:
- MAE-NAS Backbone: Sinirsel Mimari Arama (NAS) kullanılarak backbone , verimli özellik çıkarımı sağlamak için belirli kısıtlamalar altında optimize edilir.
- Verimli RepGFPN: Genelleştirilmiş Özellik Piramidi Ağı (GFPN), çıkarım sırasında ağır hesaplama maliyetlerine maruz kalmadan farklı ölçeklerde özellik füzyonunu iyileştirmek için yeniden parametrelendirme mekanizmalarını yoğun bir şekilde kullanır.
- ZeroHead: Bu hafif algılama kafası, çıkarım hızını en üst düzeye çıkarmayı amaçlayarak sınıflandırma ve regresyon görevlerini birbirinden ayırır.
- AlignedOTA: Sınıflandırma ve regresyon hedefleri arasındaki yanlış hizalamayı çözen ve eğitim sırasında yakınsamayı artıran bir etiket atama stratejisi.
YOLO etkileyici teorik gelişmeler sunsa da, öncelikle nesne algılamaya odaklanan araştırma odaklı bir çerçevedir. Genellikle daha kapsamlı ekosistemlerde bulunan yerel çoklu görev desteğinden yoksundur.
Ultralytics YOLO11
Yazarlar: Glenn Jocher, Jing Qiu
Organizasyon:Ultralytics
Tarih: 2024-09-27
GitHubultralytics
Docsultralyticsyolo11
Ultralytics YOLO11 , YOLO serisinin mirasını mimari, verimlilik ve kullanım kolaylığında önemli iyileştirmelerle geliştirerek gerçek zamanlı bilgisayarla görmenin zirvesini temsil eder. Sadece bir model olarak değil, aynı zamanda çeşitli donanım ortamlarında pratik, gerçek dünya dağıtımı için çok yönlü bir araç olarak tasarlanmıştır.
YOLO11 hakkında daha fazla bilgi edinin
Mimari ve Ekosistem
YOLO11 , rafine edilmiş çapasız bir mimari ile önceki başarıların üzerine inşa edilmiştir. Üstün özellik çıkarımı için geliştirilmiş bir backbone ve çeşitli ölçeklerde bilgi akışını artıran değiştirilmiş bir boyun tasarımına sahiptir.
Ultralytics YOLO11 çerçevesinin temel avantajları şunlardır:
- Çok yönlülük: Birçok rakibinin aksine, YOLO11 nesne algılama, örnek segmentasyonu, poz tahmini, görüntü sınıflandırması ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere çok çeşitli görevleri yerel olarak destekler.
- Kullanım Kolaylığı: Model, kullanıcı dostu bir Python API 'sine sarılmıştır ve CLIBöylece hem yeni başlayanlar hem de uzmanlar için erişilebilir hale geliyor.
- Eğitim Verimliliği: Daha hızlı yakınsama için optimize edilen YOLO11 , verimli veri artırma ve kayıp fonksiyonları kullanarak kullanıcıların aşağıdaki gibi veri kümeleri üzerinde özel modeller eğitmesine olanak tanır COCO daha düşük kaynak yükü ile.
- Bakımlı Ekosistem: tarafından desteklenmektedir. Ultralytics ekibi, kullanıcılar sık güncellemelerden, kapsamlı belgelerden ve Ultralytics HUB gibi MLOps araçlarıyla sorunsuz entegrasyondan yararlanır.
Biliyor muydunuz?
YOLO11 , Edge AI cihazlarında son derece verimli olacak şekilde tasarlanmıştır. Optimize edilmiş mimarisi, NVIDIA Jetson ve Raspberry Pi gibi donanımlarda düşük bellek kullanımı ve yüksek çıkarım hızları sağlayarak daha ağır transformatör tabanlı modellere kıyasla gömülü uygulamalar için üstün bir seçimdir.
Performans Karşılaştırması
Aşağıdaki grafik ve tablo YOLO ve YOLO11 arasındaki performans farklarını göstermektedir. Ultralytics YOLO11 , özellikle YOLO 'nun resmi kıyaslamalardan yoksun olduğu CPU donanımında sürekli olarak üstün doğrulukmAP) ve uygun çıkarım hızları göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Sonuçların Analizi
- Doğruluk: YOLO11 , karşılaştırılabilir YOLO modellerinden önemli ölçüde daha iyi performans göstermektedir. Örneğin, YOLO11m, daha az parametreye sahip olmasına rağmen (20,1 milyona karşı 28,2 milyon) 49,2 milyonluk DAMO-YOLOm'dan belirgin şekilde daha yüksek olan 51,5 milyonluk bir mAP elde eder.
- Çıkarım Hızı: GPU 'da (T4 TensorRT), YOLO11 son derece rekabetçi gecikme süresi sunar. YOLO11n 1,5 ms ile inanılmaz derecede hızlıdır, bu da onu ultra düşük gecikmeli uygulamalar için uygun hale getirir.
- CPU Performansı: Ultralytics modellerinin önemli bir avantajı, CPU performansına ilişkin şeffaflıklarıdır. YOLO11 , CPU çıkarımı için şu yollarla optimize edilmiştir ONNX ve OpenVINO'ya odaklanırken, YOLO ağırlıklı olarak GPU'ya odaklanır ve genellikle CPU dağıtım performansını tanımsız bırakır.
- Model Verimliliği: YOLO11 , parametreler ile performans arasında daha iyi bir denge olduğunu göstermektedir. Mimari verimlilik daha küçük model dosyalarına izin verir, bu da uç cihazlarda daha hızlı indirme ve daha düşük depolama gereksinimleri anlamına gelir.
Temel Ayırt Edici Özellikler ve Kullanım Alanları
Ultralytics 'in Güçlü YönleriYOLO11
Geliştiriciler Ultralytics YOLO11 sağlam bir üretim sınıfı ortama erişim elde edin.
- Performans Dengesi: Model mimarisi, gerçek zamanlı video analizi için çok önemli olan çıkarım hızı ve doğruluk arasında en iyi dengeyi sunacak şekilde titizlikle ayarlanmıştır.
- Çoklu Görev Yetenekleri: Proje kapsamınız algılamadan izleme veya segmentasyona doğru genişlerse, YOLO11 bunu aynı kod tabanı içinde sorunsuz bir şekilde halleder.
- Kullanım Kolaylığı:
ultralyticspaketi tüm boru hattını basitleştirir. Bir modeli yüklemek, tahminleri çalıştırmak ve CoreML, TFLite veya TensorRT gibi formatlara aktarmak sadece birkaç satır kodla yapılabilir. - Daha Düşük Bellek Gereksinimi: Transformatör tabanlı dedektörler veya optimize edilmemiş mimarilerle karşılaştırıldığında, YOLO11 tipik olarak eğitim sırasında daha az CUDA belleği gerektirir ve araştırmacıların tüketici sınıfı GPU'larda eğitim almasını sağlar.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
YOLO'nun Güçlü Yönleri
YOLO akademik araştırma çevrelerinde güçlü bir rakiptir.
- Araştırma Yeniliği: MAE-NAS ve ZeroHead gibi özellikler, nöral mimari arama ve kafa ayrıştırma konusunda ilginç bilgiler sunuyor.
- GPU Verimi: Yalnızca desteklenen GPU'larda çalışan belirli endüstriyel uygulamalar için YOLO yüksek verim sağlar, ancak parametre başına saf doğruluk verimliliğinde genellikle YOLO11 'in gerisinde kalır.
Sonuç
YOLO ise Alibaba'nın araştırma ekibinin yeni konseptlerini tanıtıyor, Ultralytics YOLO11 geliştiricilerin ve işletmelerin büyük çoğunluğu için üstün bir seçim olarak öne çıkıyor. Hakimiyeti sadece daha yüksek mAP skorlar ve daha hızlı çıkarım, ancak onu destekleyen kapsamlı ekosistem tarafından.
Kullanım kolaylığı ve çok yönlülükten bakımlı bir kod tabanına ve aktif topluluk desteğine kadar YOLO11 , gelişmiş yapay zeka çözümleri oluşturmak için giriş engelini azaltır. İster bulut sunucularda ister kaynak kısıtlı uç cihazlarda kullanılsın, YOLO11 modern bilgisayarla görme uygulamaları için gerekli güvenilirliği ve performansı sağlar.
Diğer Model Karşılaştırmalarını İnceleyin
Ultralytics modellerinin diğer mimarilerle nasıl karşılaştırıldığını daha iyi anlamak için ayrıntılı karşılaştırma sayfalarımızı keşfedin:
- YOLO11 vs. YOLOv10
- YOLO11 - RT-DETR Karşılaştırması
- DAMO-YOLO ve YOLOv8 Karşılaştırması
- YOLOv9 vs. YOLOv9
- YOLO11 - EfficientDet Karşılaştırması