YOLO11 ve YOLOv10: Ayrıntılı Teknik Karşılaştırma
İdeal nesne algılama modelini seçmek, doğruluk, hız ve dağıtım kısıtlamalarının taleplerini dengeleyen kritik bir karardır. Bu sayfa, bilgisayar görüşünün ön saflarında yer alan iki güçlü model olan Ultralytics YOLO11 ve YOLOv10 arasında kapsamlı bir teknik karşılaştırma sunmaktadır. YOLOv10 dikkate değer verimlilik kazanımları sunarken, Ultralytics YOLO11, YOLO mimarisinin zirvesini temsil ederek üstün performans, benzersiz çok yönlülük ve olgun, iyi yönetilen bir ekosistemin önemli avantajını sunar.
Ultralytics YOLO11: Yeni Son Teknoloji
Ultralytics YOLO11, gerçek zamanlı nesne tespiti ve ötesi için yeni bir ölçüt belirleyen, Ultralytics YOLO serisindeki en son ve en gelişmiş modeldir. Büyük başarı elde etmiş YOLOv5 ve YOLOv8 modellerinin yaratıcıları tarafından geliştirilen YOLO11, maksimum doğruluk, hız ve çok yönlülük için tasarlanmıştır.
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Belgeler: https://docs.ultralytics.com/models/yolo11/
Mimari ve Temel Özellikler
YOLO11, kanıtlanmış bir mimari temel üzerine inşa edilmiştir ve en son teknoloji doğruluğu sağlamak için geliştirilmiş özellik çıkarma ağları ve optimize edilmiş bir algılama başlığı içerir. YOLO11'in temel gücü, inanılmaz çok yönlülüğüdür. Özel modellerin aksine, çoklu görevde bir güç merkezidir ve tek, birleşik bir çerçeve içinde yerel olarak nesne algılama, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler.
Bu çok yönlülük, kullanım kolaylığına ve geliştirici verimliliğine öncelik veren sağlam Ultralytics ekosistemi tarafından desteklenmektedir. Basit bir Python API ve CLI, kapsamlı belgeler ve Ultralytics HUB gibi araçlarla sorunsuz entegrasyon sayesinde, geliştiriciler konseptten dağıtıma her zamankinden daha hızlı geçebilir. Modeller, verimli eğitim süreçlerinden, kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve Transformatörler gibi daha karmaşık mimarilere kıyasla daha düşük bellek gereksinimlerinden yararlanır.
Güçlü Yönler
- Üstün Performans Dengesi: Hız ve doğruluk arasında olağanüstü bir denge sağlayarak, çeşitli donanım platformlarında diğer modellerden daha iyi performans gösterir.
- Rakipsiz Çok Yönlülük: Tek bir model ailesi, beş temel görüntü işleme yapay zeka görevini ele alarak karmaşık uygulamalar için geliştirmeyi basitleştirir.
- İyi Yönetilen Ekosistem: Aktif geliştirme, büyük bir topluluk, sık güncellemeler ve güvenilirlik ve destek sağlayan kapsamlı kaynaklarla desteklenir.
- Kullanım Kolaylığı: Hem yeni başlayanların hem de uzmanların minimum sürtünmeyle modelleri eğitmesini ve dağıtmasını sağlayan, kolaylaştırılmış bir kullanıcı deneyimi için tasarlanmıştır.
- Eğitim ve Dağıtım Verimliliği: Daha hızlı eğitim süreleri ve daha düşük bellek kullanımı için optimize edilmiştir, bu da onu uç cihazlardan bulut sunucularına kadar çok çeşitli donanımlar için uygun hale getirir.
Zayıflıklar
- Son teknoloji bir model olarak, en büyük YOLO11 varyantları, maksimum doğruluğu elde etmek için önemli miktarda işlem kaynağı gerektirir, ancak performans sınıfları için oldukça verimlidirler.
İdeal Kullanım Senaryoları
YOLO11'in yüksek performans ve çok yönlülük kombinasyonu, onu çok çeşitli zorlu uygulamalar için ideal bir seçim haline getirir:
- Endüstriyel Otomasyon: Yüksek hassasiyetle kalite kontrolü ve konveyör bantı otomasyonuna güç verir.
- Akıllı Şehirler: Gelişmiş trafik yönetimi ve kamu güvenliği izlemesini etkinleştirme.
- Sağlık Hizmetleri: Daha hızlı teşhis için tıbbi görüntü analizine yardımcı olma.
- Perakende: Envanter yönetimini optimize etmek ve müşteri analizini geliştirmek.
YOLO11 hakkında daha fazla bilgi edinin
YOLOv10: Verimlilik Sınırlarını Zorlamak
Tsinghua Üniversitesi'nden araştırmacılar tarafından tanıtılan YOLOv10, işlem sonrası sırasında Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırarak uçtan uca gecikmeyi optimize etmeye odaklanan bir nesne algılama modelidir.
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
- Kuruluş: Tsinghua University
- Tarih: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- Belgeler: https://docs.ultralytics.com/models/yolov10/
Mimari ve Temel Özellikler
YOLOv10'un temel yeniliği, eğitim sırasında yedekli tahminleri ele almak için tutarlı çift atamalar kullanan NMS'siz eğitim stratejisidir. Bu, modelin NMS adımı olmadan dağıtılmasına olanak tanıyarak işlem sonrası yükünü azaltır ve çıkarım gecikmesini iyileştirir. Mimari ayrıca, hesaplama yükünü azaltmak için hafif bir sınıflandırma başlığı gibi optimizasyonlarla bütünsel bir verimlilik-doğruluk odaklı tasarıma sahiptir.
Güçlü Yönler
- NMS'siz Dağıtım: Temel bir son işlem darboğazını ortadan kaldırır, bu da gecikme süresinin kritik olduğu uygulamalar için faydalıdır.
- Yüksek Verimlilik: FLOP'lar ve parametre sayısı açısından mükemmel performans gösterir, bu da onu kaynak kısıtlı ortamlar için uygun hale getirir.
- Güçlü Gecikme-Doğruluk Dengesi: GPU'larda çok düşük çıkarım süreleriyle rekabetçi doğruluk sağlar.
Zayıflıklar
- Sınırlı Çok Yönlülük: YOLOv10 öncelikli olarak nesne algılama için tasarlanmıştır ve YOLO11'de standart olan segmentasyon, poz tahmini ve sınıflandırma için yerleşik çoklu görev özelliklerine sahip değildir.
- Ekosistem ve Destek: Akademik bir kurumdan araştırma odaklı bir model olduğu için, Ultralytics ekosistemi içindeki modellerle aynı düzeyde sürekli bakım, topluluk desteği veya entegre araçlara sahip değildir.
- Kullanılabilirlik: YOLOv10'u bir üretim hattına entegre etmek, Ultralytics tarafından sunulan akıcı deneyime kıyasla daha fazla manuel çaba gerektirebilir.
İdeal Kullanım Senaryoları
YOLOv10, nesne algılama için uçtan uca gecikmenin en önemli faktör olduğu özel uygulamalar için en uygunudur:
- Edge AI: Her milisaniyenin önemli olduğu, sınırlı işlem gücüne sahip cihazlara dağıtım.
- Yüksek Verimli Sistemler: Saniyede yüksek sayıda kare işlemesi gerektiren gerçek zamanlı video analizi gibi uygulamalar.
- Otonom Dronlar: Navigasyon ve engellerden kaçınma için hızlı nesne algılamayı etkinleştirme.
YOLOv10 hakkında daha fazla bilgi edinin
Performans Düellosu: YOLO11 - YOLOv10
Performansı karşılaştırırken, her iki modelin de oldukça yetenekli olduğu açıktır, ancak YOLO11 üstün bir genel denge göstermektedir. Aşağıdaki tabloda gösterildiği gibi, YOLO11 modelleri belirli bir doğruluk seviyesi için hem CPU hem de GPU'da sürekli olarak daha hızlı çıkarım hızları elde etmektedir. Örneğin, YOLO11l, bir T4 GPU'da önemli ölçüde daha hızlıyken YOLOv10l'den daha yüksek bir mAP elde etmektedir. Ayrıca, YOLO11x daha hızlı çıkarım hızıyla YOLOv10x'ten daha yüksek bir mAP'ye ulaşmaktadır.
YOLOv10 etkileyici parametre verimliliği gösterse de, YOLO11'in mimari optimizasyonları, özellikle çoklu görev yetenekleri ve dağıtım kolaylığı göz önüne alındığında, daha iyi gerçek dünya performansı sunar.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Sonuç: Hangi Modeli Seçmelisiniz?
Geliştiricilerin, araştırmacıların ve işletmelerin büyük çoğunluğu için Ultralytics YOLO11 önerilen seçimdir. Birden fazla bilgisayarla görme görevini ele almak için benzersiz çok yönlülükle birleştirilmiş, en son teknoloji ürünü doğruluk ve hız sunar. Temel avantajı, kullanım kolaylığı, verimli eğitim ve üretime sorunsuz bir geçiş sağlayan sağlam, iyi yönetilen ekosisteminde yatmaktadır. Bu bütünsel yaklaşım, YOLO11'i sadece güçlü bir model değil, aynı zamanda gelişmiş yapay zeka sistemleri oluşturmak için eksiksiz bir çözüm haline getirir.
YOLOv10, onu son derece özel, gecikmeye duyarlı nesne algılama görevleri için güçlü bir seçenek haline getiren yenilikçi bir NMS'siz tasarıma sahip takdire şayan bir modeldir. Ancak, dar odak noktası ve kapsamlı bir destek ekosisteminin olmaması, onu genel amaçlı kullanım veya ek vizyon yetenekleri gerektirecek şekilde gelişebilecek projeler için daha az uygun hale getirir.
Diğer son teknoloji modelleri keşfetmekle ilgileniyorsanız, belgelerimizde YOLO11 - YOLOv9 ve YOLOv8 - YOLOv10 gibi daha fazla karşılaştırma bulabilirsiniz.