YOLO11 - YOLOv6-3.0: Detaylı Model Karşılaştırması
Doğru bilgisayarla görme modelini seçmek, nesne algılama görevlerinde optimal performansı elde etmek için çok önemlidir. Bu sayfa, Ultralytics YOLO11 ve YOLOv6-3.0 arasında, mimarilerine, performans metriklerine, eğitim metodolojilerine ve projenize en uygun olanı seçmenize yardımcı olacak ideal kullanım durumlarına odaklanan teknik bir karşılaştırma sunmaktadır. Her ikisi de güçlü dedektörler olmasına rağmen, YOLO11 kapsamlı ve aktif olarak sürdürülen bir ekosisteme entegre edilmiş daha çok yönlü, verimli ve kullanıcı dostu bir çözüm olarak öne çıkmaktadır.
Ultralytics YOLO11
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11, Ultralytics'in en son teknoloji modelidir ve YOLO serisindeki en yeni evrimi temsil eder. Eylül 2024'te piyasaya sürülen bu model, hem hızı hem de doğruluğu artırmayı amaçlayan mimari iyileştirmelerle YOLOv8 gibi önceki sürümler üzerine inşa edilmiştir. YOLO11, bilgisayar görüşü görevleri de dahil olmak üzere geniş bir yelpazede üstün performans ve verimlilik için tasarlanmıştır: nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB).
Mimari ve Temel Özellikler
YOLO11, model boyutu, çıkarım hızı ve doğruluk arasında iyileştirilmiş bir denge sağlayan optimize edilmiş bir mimariye sahiptir. Temel iyileştirmeler arasında gelişmiş özellik çıkarma katmanları ve hesaplama yükünü en aza indiren akıcı bir ağ yapısı bulunur. Bu tasarım, uç cihazlardan bulut sunucularına kadar çeşitli donanımlarda verimli performans sağlar. Bir bağlantısız (anchor-free) dedektör olarak YOLO11, algılama sürecini basitleştirir ve genellikle genellemeyi iyileştirerek onu daha modern ve etkili bir seçim haline getirir.
Güçlü Yönler
- Üstün Performans Dengesi: Aşağıdaki performans tablosunda görüldüğü gibi, birçok rakibe kıyasla daha az parametreyle daha yüksek mAP puanları elde ederek hız ve doğruluk arasında mükemmel bir denge sunar.
- Çok Yönlülük: Basit nesne algılamanın çok ötesine geçen kapsamlı bir çözüm sunarak, tek ve birleşik bir çerçeve içinde birden fazla görüntü işleme görevini destekler. Bu, YOLOv6 gibi tek görevli modellere göre önemli bir avantajdır.
- Kullanım Kolaylığı: Basit bir Python API'si, kapsamlı belgeler ve kolayca erişilebilen önceden eğitilmiş ağırlıklar içeren, kolaylaştırılmış Ultralytics ekosisteminden yararlanır.
- İyi Yönetilen Ekosistem: Ultralytics tarafından aktif olarak geliştirilir ve desteklenir, sık güncellemeler, GitHub ve Discord aracılığıyla güçlü topluluk desteği ve kodsuz eğitim ve dağıtım için Ultralytics HUB ile sorunsuz entegrasyon sunar.
- Eğitim Verimliliği: Genellikle eğitilmesi daha yavaş ve kaynak yoğun olan transformatör tabanlı modeller gibi diğer mimarilere kıyasla daha az bellek gerektiren, yüksek verimli eğitim süreçleri sunar.
Zayıflıklar
- Yeni Model: En son sürüm olduğundan, topluluk eğitimlerinin ve üçüncü taraf araçlarının hacmi, YOLOv5 gibi daha köklü modellere kıyasla hala büyüyor.
- Küçük Nesne Tespiti: Çoğu tek aşamalı dedektör gibi, çoğu senaryoda hala güçlü bir performans sergilemesine rağmen, özel iki aşamalı dedektörlere kıyasla aşırı küçük nesnelerle ilgili zorluklarla karşılaşabilir.
İdeal Kullanım Senaryoları
YOLO11'in doğruluk, hız ve çok yönlülük kombinasyonu, onu çok çeşitli modern uygulamalar için ideal kılar:
- Yüksek hassasiyet gerektiren gerçek zamanlı uygulamalar (örn. otonom sistemler, robotik).
- Gelişmiş güvenlik sistemleri gibi, eş zamanlı olarak algılama, segmentasyon ve poz tahmini gerektiren çoklu görev senaryoları.
- Kaynak kısıtlı uç cihazlardan (NVIDIA Jetson, Raspberry Pi) güçlü bulut altyapısına kadar çeşitli platformlarda dağıtım.
- Güvenlik, perakende, sağlık hizmetleri ve üretimdeki uygulamalar.
YOLO11 hakkında daha fazla bilgi edinin
YOLOv6-3.0
Yazarlar: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu ve Xiangxiang Chu
Kuruluş: Meituan
Tarih: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Belgeler: https://docs.ultralytics.com/models/yolov6/
Meituan tarafından geliştirilen YOLOv6-3.0, öncelikli olarak endüstriyel uygulamalar için tasarlanmış bir nesne algılama çerçevesidir. 2023'ün başlarında yayınlanan bu sürüm, o zamanlar gerçek dünya dağıtım senaryoları için uygun bir hız ve doğruluk dengesi sağlamayı amaçlamıştır.
Mimari ve Temel Özellikler
YOLOv6, verimli bir backbone ve neck tasarımı gibi mimari değişiklikler getirmiştir. Sürüm 3.0, bu öğeleri daha da geliştirmiş ve performansı artırmak için eğitim sırasında self-distillation gibi teknikleri dahil etmiştir. Ayrıca, donanıma özgü optimizasyonlara odaklandığını gösteren mobil dağıtım için optimize edilmiş belirli modeller (YOLOv6Lite) sunar.
Güçlü Yönler
- İyi Hız-Doğruluk Dengesi: Özellikle hızın öncelikli olduğu endüstriyel nesne algılama görevleri için rekabetçi performans sunar.
- Kuantalama Desteği: Sınırlı kaynaklara sahip donanımlarda dağıtım için faydalı olan model kuantalaması için araçlar ve eğitimler sağlar.
- Mobil Optimizasyon: Özellikle mobil veya CPU tabanlı çıkarım için tasarlanmış YOLOv6Lite varyantlarını içerir.
Zayıflıklar
- Sınırlı Görev Çok Yönlülüğü: Öncelikli olarak nesne tespitine odaklanır ve kapsamlı Ultralytics YOLO11 çerçevesinde bulunan segmentasyon, sınıflandırma veya poz tahmini için yerel destekten yoksundur. Bu, modern, çok yönlü yapay zeka projelerindeki uygulanabilirliğini sınırlar.
- Ekosistem ve Bakım: Açık kaynaklı olmasına rağmen, ekosistem Ultralytics platformu kadar kapsamlı veya aktif olarak sürdürülmemektedir. Bu, geliştiriciler için daha yavaş güncellemelere, daha az entegrasyona ve daha az topluluk desteğine yol açabilir.
- Daha Yüksek Kaynak Kullanımı: Aşağıdaki tabloda gösterildiği gibi, daha büyük YOLOv6 modelleri, benzer mAP için YOLO11 muadillerine kıyasla önemli ölçüde daha fazla parametreye ve FLOP'a sahip olabilir ve bu da potansiyel olarak eğitim ve dağıtım için daha fazla işlem kaynağı gerektirebilir.
İdeal Kullanım Senaryoları
YOLOv6-3.0 şunlar için uygundur:
- Nesne algılama hızının en kritik faktör olduğu endüstriyel uygulamalar.
- Eski sistemler için kuantizasyondan yararlanan veya mobil için optimize edilmiş modeller gerektiren dağıtım senaryoları.
- Yalnızca nesne algılamaya odaklanan ve çoklu görev yetenekleri gerektirmeyen projeler.
YOLOv6 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: YOLO11 - YOLOv6-3.0
Aşağıdaki tabloda, COCO veri kümesi üzerinde YOLO11 ve YOLOv6-3.0 modelleri arasında ayrıntılı bir performans karşılaştırması sunulmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Veriler açıkça göstermektedir ki, YOLO11 modelleri, benzer ölçeklerdeki YOLOv6-3.0 muadillerine göre sürekli olarak daha yüksek mAP puanları elde ederken, önemli ölçüde daha az parametre ve FLOP kullanmaktadır. Örneğin, YOLO11m, YOLOv6-3.0m'yi doğrulukta (51.5'e karşı 50.0 mAP) neredeyse yarı parametreyle (20.1M'ye karşı 34.9M) geçmektedir. Bu üstün verimlilik, YOLO11'i dağıtım için daha güçlü ve uygun maliyetli bir çözüm haline getirmektedir. YOLOv6-3.0n çok hızlı GPU çıkarımı gösterse de, YOLO11 doğruluk, model boyutu ve çok yönlülüğün çok daha iyi bir genel dengesini sunmaktadır.
Sonuç ve Öneri
YOLOv6-3.0 nesne tespiti alanına sağlam bir katkı sağlarken, Ultralytics YOLO11, son teknoloji, çok yönlü ve verimli bir bilgisayarla görme çözümü arayan geliştiriciler ve araştırmacılar için açık ara kazananıdır.
YOLO11, daha az hesaplama kaynağıyla daha yüksek doğruluk sağlamakla kalmaz, aynı zamanda yeteneklerini tek, kullanımı kolay bir çerçeve içinde segmentasyon, sınıflandırma ve poz tahmini dahil olmak üzere çok çeşitli görevlere genişletir. Kapsamlı belgeler, topluluk desteği ve Ultralytics HUB gibi araçlarla tamamlanan sağlam ve aktif olarak sürdürülen Ultralytics ekosistemi, sorunsuz bir geliştirme ve dağıtım deneyimi sağlar.
Herhangi bir yeni proje için YOLO11 önerilen seçimdir. Diğer modern mimarilerle ilgilenenler için, YOLOv10 veya RT-DETR gibi modellerle karşılaştırmalar yapmak da değerli bilgiler sağlayabilir.