Model Karşılaştırması: Nesne Algılama için YOLOv8 - YOLOv10
Doğru nesne algılama modelini seçmek, herhangi bir bilgisayarla görü projesinin başarısı için çok önemlidir. Bu sayfa, alanındaki son teknoloji modellerden ikisi olan Ultralytics YOLOv8 ve YOLOv10 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Özel ihtiyaçlarınız için bilinçli bir karar vermenize rehberlik etmek amacıyla mimari nüanslarını, performans metriklerini, eğitim metodolojilerini ve ideal uygulamalarını analiz edeceğiz.
Ultralytics YOLOv8: Çok Yönlülük ve Olgunluk
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/
Ultralytics tarafından Ocak 2023'te piyasaya sürülen Ultralytics YOLOv8, YOLO seleflerinin güçlü yönleri üzerine inşa edilmiş olgun ve son derece çok yönlü bir modeldir. Nesne tespiti, örnek segmentasyonu, görüntü sınıflandırması, poz tahmini ve yönlendirilmiş sınırlayıcı kutular (OBB) dahil olmak üzere çok çeşitli yapay görme görevlerinde hız, doğruluk ve kullanım kolaylığı için tasarlanmıştır.
Mimari ve Temel Özellikler
YOLOv8, model mimarisini basitleştiren ve farklı veri kümelerinde genellemeyi geliştiren, çapa içermeyen bir algılama yaklaşımına sahip YOLO serisinde önemli bir evrimi temsil eder. Esnek backbone'u ve optimize edilmiş kayıp fonksiyonları, gelişmiş doğruluğa ve daha kararlı eğitime katkıda bulunur. YOLOv8'in temel bir avantajı, çeşitli hesaplama ve doğruluk gereksinimlerini karşılamak için Nano (n) ila Ekstra büyük (x) arasında değişen model boyutları sunan ölçeklenebilirliğidir. Bu çok yönlülük, tek, birleşik bir çerçeve içinde birden çok görevi desteklediği için onu yalnızca nesne algılamadan daha fazlasını gerektirebilecek projeler için başvurulacak bir seçim haline getirir.
Performans ve Güçlü Yönler
YOLOv8, gerçek zamanlı uygulamalar için uygun hızlı çıkarım hızlarını korurken yüksek mAP puanları elde ederek güçlü bir performans dengesi sağlar. Örneğin, YOLOv8x, COCO veri kümesinde %53,9 mAPval 50-95'e ulaşır. Verimli tasarımı, özellikle RT-DETR gibi transformatör tabanlı modellere kıyasla eğitim ve çıkarım sırasında daha düşük bellek gereksinimleri sağlar.
- Olgun ve İyi Belgelenmiş: YOLOv8, kapsamlı belgelendirme, geniş bir topluluk ve kolayca erişilebilen kaynaklardan yararlanır, bu da onu son derece kullanıcı dostu yapar ve basit Python ve CLI arayüzleri aracılığıyla uygulanmasını kolaylaştırır.
- Çok Yönlü ve Çoklu Görev: Çok çeşitli görüntü işleme görevlerini desteklemesi, daha özel modellere göre önemli bir avantajdır ve karmaşık proje gereksinimleri için benzersiz esneklik sunar.
- İyi Yönetilen Ekosistem: Model, eğitimden dağıtıma kadar iş akışlarını kolaylaştıran bir platform olan Ultralytics HUB ile sorunsuz bir şekilde entegre edilmiştir. Ultralytics'ten gelen aktif geliştirme ve sık güncellemelerle desteklenmektedir.
- Performans Dengesi: Hız, doğruluk ve model boyutu arasında mükemmel bir denge sağlayarak, çok çeşitli gerçek dünya dağıtım senaryoları için uygun hale getirir.
- Eğitim Verimliliği: YOLOv8, verimli eğitim süreçleri ve kolayca erişilebilen önceden eğitilmiş ağırlıklar sunarak geliştirme döngülerini önemli ölçüde hızlandırır.
Zayıflıklar
Yüksek verimli olmasına rağmen, YOLOv8, ham hıza veya parametre sayısına her şeyden çok öncelik veren YOLOv10 gibi daha yeni modeller tarafından belirli, yüksek düzeyde kısıtlanmış kıyaslamalarda marjinal olarak geride bırakılabilir. Ancak, YOLOv8 genellikle daha iyi bir genel kullanılabilirlik, çok yönlülük ve destek paketi sunar.
İdeal Kullanım Senaryoları
YOLOv8'in çok yönlülüğü ve kullanım kolaylığı, onu geniş bir uygulama yelpazesi için ideal kılar:
- Güvenlik Sistemleri: Güvenlik alarm sistemlerinde gerçek zamanlı nesne tespiti için mükemmeldir.
- Perakende Analitiği: Müşteri davranışını ve envanter yönetimini anlamak için akıllı perakende sektöründe kullanışlıdır.
- Endüstriyel Kalite Kontrol: Üretimde otomatik görsel denetim için uygulanabilir.
- Çoklu Görev Projeleri: Tek bir modelden aynı anda algılama, segmentasyon ve poz tahmini gerektiren projeler için idealdir.
YOLOv8 hakkında daha fazla bilgi edinin
YOLOv10: Verimliliğin Sınırlarını Zorlamak
Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri
Kuruluş: Tsinghua Üniversitesi
Tarih: 2024-05-23
Arşiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Belgeler: https://docs.ultralytics.com/models/yolov10/
Mayıs 2024'te tanıtılan YOLOv10, rekabetçi doğruluğu korurken verimliliği ve hızı en üst düzeye çıkarmaya odaklanıyor. Özellikle gerçek zamanlı ve uç uygulamaları hedeflemektedir. Temel bir yenilik, işlem sonrası gecikmeyi azaltmaya yardımcı olan ve gerçek uçtan uca nesne algılamayı sağlayan Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldıran eğitim yaklaşımıdır.
Mimari ve Temel Özellikler
YOLOv10, bütünsel bir verimlilik-doğruluk odaklı model tasarımına sahiptir. Hesaplama yedekliliğini azaltmak ve algılama yeteneklerini geliştirmek için çeşitli bileşenleri optimize eder. Eğitim için tutarlı çift atamalar kullanarak, NMS adımını kaldırır ve dağıtım hattını basitleştirir. Bu önemli bir adım olmasına rağmen, YOLOv10'un öncelikle nesne algılamaya odaklandığını ve YOLOv8'in yerleşik çoklu görev yönlülüğünden yoksun olduğunu belirtmek önemlidir.
Performans Analizi
YOLOv10, birçok önceki YOLO sürümüne kıyasla daha hızlı çıkarım hızları ve daha küçük model boyutları sunarak son teknoloji verimlilik gösterir. Örneğin, YOLOv10-S, yalnızca 7,2M parametre ile %46,7 mAPval 50-95'e ulaşır. Aşağıdaki tablo, belirli bir doğruluk düzeyi için YOLOv10 modellerinin genellikle YOLOv8 muadillerinden daha az parametreye ve daha düşük FLOP'lara sahip olduğunu göstermektedir. Ancak, YOLOv8 özellikle CPU'da yüksek düzeyde optimize edildiği yerde çok rekabetçi hızları korur.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Güçlü ve Zayıf Yönler
- Gelişmiş Verimlilik: Birçok karşılaştırmada daha hızlı çıkarım hızları ve daha küçük model boyutları sunar; bu da kaynak kısıtlı ortamlar için faydalıdır.
- NMS'siz Eğitim: NMS işlem sonrası adımını kaldırarak dağıtım hattını basitleştirir, gecikmeyi azaltır.
- Son Teknoloji Performansı: Özellikle gecikme odaklı kıyaslamalarda mükemmel performans elde eder.
Ancak, YOLOv10'un da bazı sınırlamaları vardır:
- Daha Yeni Model: Daha yeni bir model olduğundan, köklü YOLOv8'e kıyasla daha küçük bir topluluğa ve daha az hazır kaynağa veya üçüncü taraf entegrasyonuna sahiptir.
- Ekosistem Entegrasyonu: Ultralytics kütüphanesine entegre edilmiş olmasına rağmen, kapsamlı Ultralytics ekosistemine özgü YOLOv8 gibi modellere kıyasla, yerleşik MLOps iş akışlarına uyması daha fazla çaba gerektirebilir.
- Görev Uzmanlığı: Öncelikli olarak nesne algılamaya odaklanmıştır ve YOLOv8 tarafından sunulan segmentasyon, sınıflandırma ve poz tahmini için yerleşik çok yönlülükten yoksundur.
İdeal Kullanım Senaryoları
YOLOv10, gerçek zamanlı performans ve kaynak verimliliğinin mutlak en yüksek öncelikler olduğu uygulamalar için özellikle uygundur:
- Uç Cihazlar: Cep telefonları ve gömülü sistemler gibi sınırlı işlem gücüne sahip cihazlarda dağıtım için idealdir.
- Yüksek Hızlı İşleme: Otonom dronlar ve robotik gibi çok düşük gecikme gerektiren uygulamalar için uygundur.
- Gerçek Zamanlı Analiz: Trafik yönetimi gibi anında nesne algılama gerektiren hızlı tempolu ortamlar için mükemmeldir.
YOLOv10 hakkında daha fazla bilgi edinin
Sonuç
Hem Ultralytics YOLOv8 hem de YOLOv10 güçlü ve etkili nesne algılama modelleridir. Aralarındaki seçim büyük ölçüde projeye özgü önceliklere bağlıdır.
Ultralytics YOLOv8, çoğu geliştirici ve araştırmacı için önerilen seçimdir. Olağanüstü çok yönlülüğü, kullanım kolaylığı, sağlam ekosistemi ve hız ile doğruluk arasındaki mükemmel denge ile öne çıkar. Çoklu görev yetenekleri, segmentasyon, poz tahmini veya diğer görme görevlerini içerecek şekilde gelişebilecek projeler için geleceğe yönelik bir çözüm olmasını sağlar.
YOLOv10, özel, gecikme açısından kritik uygulamalar için zorlayıcı verimlilik kazanımları sunar. Projenizin temel kısıtlaması düşük güçlü uç cihazlarda dağıtım yapmak veya tek bir görev için mümkün olan en düşük çıkarım süresini elde etmekse, YOLOv10 güçlü bir adaydır.
Son teknoloji ürünü diğer modelleri keşfetmek isteyen kullanıcılar için Ultralytics, saygın YOLOv5, yenilikçi YOLOv9 ve en son YOLO11 dahil olmak üzere bir dizi seçenek sunar. İhtiyaçlarınız için en iyi modeli seçmenize yardımcı olmak için YOLOv9 - YOLOv8 ve YOLOv5 - YOLOv8 gibi daha fazla karşılaştırma mevcuttur.