YOLOv7 ve YOLOv10: Ayrıntılı Teknik Karşılaştırma
Doğru nesne algılama modelini seçmek, doğruluk, hız ve dağıtım gereksinimleri arasında bir denge kurmayı içerir. Bu sayfa, gerçek zamanlı nesne algılama alanındaki iki önemli model olan YOLOv7 ve YOLOv10 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bilgisayar görüşü projeleriniz için en uygun olanı seçmenize yardımcı olmak amacıyla, mimari farklılıklarını, performans metriklerini ve ideal kullanım durumlarını inceleyeceğiz.
YOLOv7: Yüksek Doğruluk ve Hız
Temmuz 2022'de tanıtılan YOLOv7, hız ve doğruluk arasındaki etkileyici dengesiyle hızla tanındı ve o zamanlar yeniState-of-the-art ölçütler belirledi. Çıkarım maliyetlerini artırmadan doğruluğu artırmak için "eğitilebilir bedava hediyeler çantası" kullanarak eğitim sürecini optimize etmeye odaklandı.
Teknik Detaylar:
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2022-07-06
- Arxiv: https://arxiv.org/abs/2207.02696
- GitHub: https://github.com/WongKinYiu/yolov7
- Belgeler: https://docs.ultralytics.com/models/yolov7/
Mimari ve Temel Özellikler
YOLOv7, performansına ulaşmak için çeşitli mimari iyileştirmeler ve eğitimde ince ayarlar sunmuştur:
- Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN): Backbone'daki bu temel bileşen, gradyan yolunu kontrol ederken ağın çeşitli özellikleri öğrenme yeteneğini geliştirir, bu da yakınsamayı ve genel doğruluğu artırır.
- Model Ölçeklendirme: Farklı hesaplama bütçelerine uyacak şekilde model derinliğinin ve genişliğinin etkili bir şekilde ayarlanmasına olanak tanıyan, birleştirme tabanlı modeller için bileşik ölçeklendirme yöntemleri uyguladı.
- Eğitilebilir Bedava Hediyeler (Trainable Bag-of-Freebies): YOLOv7, çıkarım sırasında herhangi bir ek yük getirmeden performansı artırmak için etiket atama stratejileri ve toplu normalleştirme ayarlamaları gibi eğitim sırasında gelişmiş tekniklerden yararlandı.
- Yardımcı Başlık Kabadan İnceye: Model, derin denetimi iyileştirmek ve modelin öğrenme sürecini daha etkili bir şekilde yönlendirmek için eğitim sırasında yardımcı başlıklar kullanır.
Güçlü ve Zayıf Yönler
Güçlü Yönler
- Yüksek Doğruluk ve Hız Dengesi: YOLOv7, yüksek mAP ve hızlı çıkarım hızının güçlü bir kombinasyonunu sunarak, birçok gerçek zamanlı uygulama için uygun hale getirir.
- Verimli Eğitim: Model, çıkarım sırasında hesaplama taleplerini önemli ölçüde artırmadan performansı artıran gelişmiş eğitim teknikleri içerir.
- Yerleşik: Olgun bir model olarak, en yeni modellere kıyasla daha geniş bir kullanıcı tabanından ve daha fazla topluluk kaynağından yararlanır.
Zayıflıklar
- NMS Bağımlılığı: YOLOv7, işlem sonrası için Non-Maximum Suppression'a (NMS) dayanır, bu da hesaplama yükünü ekler ve çıkarım gecikmesini artırır.
- Karmaşıklık: Mimari ve eğitim stratejileri, etkili olmakla birlikte, özel uygulamalar için tam olarak anlamayı ve ince ayar yapmayı karmaşık hale getirebilir.
Kullanım Alanları
YOLOv7, hız ve doğruluğun dengesinin kritik olduğu zorlu uygulamalar için çok uygundur:
- Gelişmiş Gözetim: Yüksek doğruluğu, güvenlik sistemlerinde nesneleri veya tehditleri tanımlamak için değerlidir.
- Otonom Sistemler: Kendi kendine giden arabalar gibi uygulamalar için sağlam algılama sağlar.
- Endüstriyel Otomasyon: Model, üretimde güvenilir kusur tespiti ve kalite kontrolü için kullanılabilir.
YOLOv7 hakkında daha fazla bilgi edinin
YOLOv10: Uçtan Uca Gerçek Zamanlı Algılama
Tsinghua Üniversitesi'nden araştırmacılar tarafından Mayıs 2024'te tanıtılan YOLOv10, gerçek zamanlı nesne algılamada önemli bir ilerlemeyi temsil etmektedir. Temel yeniliği, gecikmeyi azaltan ve dağıtım verimliliğini artıran Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırarak uçtan uca bir çözüm oluşturmaktır.
Teknik Detaylar:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
- Kuruluş: Tsinghua University
- Tarih: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- Belgeler: https://docs.ultralytics.com/models/yolov10/
Mimari ve Temel Özellikler
YOLOv10, hız-doğruluk dengesini optimize etmeyi amaçlayan çeşitli mimari yenilikler sunar:
- NMS'siz Eğitim: Eğitim sırasında tutarlı çift atamalar kullanır ve NMS işlem sonrası adımı olmadan rekabetçi performans sağlar. Bu, dağıtım hattını basitleştirir ve çıkarım gecikmesini azaltır.
- Bütünsel Verimlilik-Doğruluk Odaklı Tasarım: Model, hesaplama yedekliliğini azaltmak ve yeteneği geliştirmek için sınıflandırma başlığı ve alt örnekleme katmanları gibi çeşitli bileşenleri optimize eder. Bu, rank-guided blok tasarımı ve kısmi self-attention (PSA) gibi teknikleri içerir.
- Anchor'sız Yaklaşım: Diğer modern YOLO modelleri gibi, anchor'sız bir dedektör tasarımı benimser, bu da algılama başlığını basitleştirir ve genellemeyi iyileştirir.
Güçlü ve Zayıf Yönler
Güçlü Yönler
- Yüksek Verimlilik: NMS'siz tasarım ve diğer mimari optimizasyonlar, daha hızlı çıkarıma, daha düşük gecikmeye ve azaltılmış hesaplama maliyetine yol açar.
- Rekabetçi Doğruluk: Hızı önemli ölçüde artırırken ve model boyutunu küçültürken güçlü doğruluğunu korur.
- End-to-End Deployment: NMS'nin kaldırılması, dağıtım hattını basitleştirerek uygulamalara entegre etmeyi kolaylaştırır.
Zayıflıklar
- Nispeten Yeni: Daha yeni bir model olduğundan, topluluk desteği ve gerçek dünya örneklerinin sayısı, YOLOv7 veya Ultralytics YOLOv8 gibi yerleşik modellere kıyasla daha az kapsamlı olabilir.
- Optimum Performans için Ayarlama: En iyi sonuçları elde etmek dikkatli bir hiperparametre ayarlaması gerektirebilir ve potansiyel olarak model eğitimi ipuçları gibi kaynaklardan yararlanılabilir.
Kullanım Alanları
YOLOv10'un gerçek zamanlı verimliliğe odaklanması, onu kaynak kısıtlı ortamlar için ideal hale getirir:
- Uç Yapay Zeka Uygulamaları: Düşük gecikme süresinin kritik olduğu NVIDIA Jetson veya Raspberry Pi gibi cihazlarda dağıtım için mükemmeldir.
- Robotik: Navigasyon ve etkileşim için daha hızlı algılama sağlar, bu da yapay zekanın robotikteki rolünün önemli bir yönüdür.
- Otonom Dronlar: Hafif ve hızlı mimarisi, dronlarda ve diğer insansız hava araçlarında hızlı nesne algılama için uygundur.
YOLOv10 hakkında daha fazla bilgi edinin
Karşılaştırmalı Performans Kıyaslaması
YOLOv7 ve YOLOv10'u karşılaştırırken, en önemli fark tasarım felsefelerinde yatmaktadır. YOLOv7, yüksek doğruluk ve hız arasında bir denge kurmaya çalışarak onu güçlü bir genel amaçlı dedektör haline getirir. Buna karşılık, YOLOv10, NMS'yi ortadan kaldırarak hesaplama verimliliğine ve düşük gecikmeye öncelik vererek, onu uç cihazlardaki gerçek zamanlı uygulamalar için üstün bir seçim haline getirir.
Aşağıdaki tablo, YOLOv10 modellerinin benzer mAP seviyelerinde YOLOv7 modellerine göre sürekli olarak daha düşük gecikme süresi sağladığını ve daha az parametre ve FLOP gerektirdiğini göstermektedir. Örneğin, YOLOv10b, yalnızca 6,54 ms gecikmeyle 52,7 mAP elde ederek, benzer bir mAP'ye sahip ancak daha yüksek gecikme süresine sahip olan YOLOv7l'yi geride bırakır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Sonuç ve Öneri
Hem YOLOv7 hem de YOLOv10 güçlü modellerdir, ancak farklı ihtiyaçlara hizmet ederler. YOLOv7, yüksek mAP elde etmenin öncelikli olduğu uygulamalar için sağlam bir seçim olmaya devam eden, güçlü ve doğru bir dedektördür. YOLOv10, yenilikçi NMS'siz mimarisiyle, özellikle uçtan uca dağıtımlarda en yüksek verimliliği ve en düşük gecikmeyi gerektiren uygulamalar için açık bir kazanan.
Modern, çok yönlü ve kullanıcı dostu bir çerçeve arayan geliştiriciler için, Ultralytics YOLOv8 ve en son YOLO11 gibi Ultralytics ekosisteminden modeller genellikle daha cazip bir seçenek sunar. Bu modeller şunları sunar:
- Kullanım Kolaylığı: Kolaylaştırılmış bir Python API'si, kapsamlı dokümantasyon ve basit CLI komutları.
- İyi Yönetilen Ekosistem: Aktif geliştirme, güçlü bir açık kaynak topluluğu ve sorunsuz MLOps için Ultralytics HUB gibi araçlarla entegrasyon.
- Görev Çok Yönlülüğü: Segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne algılama (OBB) dahil olmak üzere nesne algılamanın ötesinde birden fazla görev için destek.
Diğer Modelleri İnceleyin
Başka modellerle ilgileniyorsanız, bu ek karşılaştırmalara göz atın:
- YOLOv7 - YOLOv8 karşılaştırması
- YOLOv10 - YOLOv8 Karşılaştırması
- YOLOv10 - YOLOv9 Karşılaştırması
- RT-DETR - YOLOv7 Karşılaştırması
- YOLOv7 - YOLOv5 karşılaştırması
- YOLO11 gibi en son modelleri keşfedin.