Model Karşılaştırması: Nesne Algılama için YOLOv8 - YOLOv7
Doğru nesne algılama modelini seçmek, bilgisayar görüşü görevlerinde optimum performans elde etmek için çok önemlidir. Bu sayfa, alandaki iki önemli model olan Ultralytics YOLOv8 ve YOLOv7 arasında teknik bir karşılaştırma sunmaktadır. Model seçim sürecinize rehberlik etmek amacıyla, mimari nüanslarını, performans kıyaslamalarını ve ideal uygulamalarını analiz edecek ve Ultralytics ekosisteminin sunduğu avantajları vurgulayacağız. Her iki model de son teknolojiyi geliştirmiş olsa da, YOLOv8 gelişmiş performansı, çok yönlülüğü ve olağanüstü kullanım kolaylığı sayesinde modern uygulamalar için daha üstün bir seçim olarak ortaya çıkmaktadır.
YOLOv8: En Son Verimlilik ve Uyarlanabilirlik
2023'te piyasaya sürülen Ultralytics YOLOv8, Ultralytics'in en son amiral gemisi modelidir. Yeni bir performans, esneklik ve verimlilik düzeyi sunarak, önceki sürümlerinin başarıları üzerine inşa edilmiştir. Son teknoloji bir model olarak YOLOv8, geniş bir bilgisayarlı görü görevleri yelpazesinde üstün performans göstermek üzere tasarlanmıştır.
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/
Mimari ve Tasarım
YOLOv8, hem güçlü hem de kullanıcı dostu olan gelişmiş bir mimariye sahiptir. Temel mimari iyileştirmeler arasında yeni bir anchor-free algılama başlığı ve daha verimli bir backbone bulunur. Anchor-free tasarım, kutu tahminlerinin sayısını azaltır, bu da Non-Maximum Suppression (NMS) gibi işlem sonrası adımları basitleştirir ve çıkarım hızını hızlandırır. Bu, YOLOv8'i manuel anchor ayarlaması olmadan çeşitli nesne şekillerine ve boyutlarına daha uyarlanabilir hale getirir.
Güçlü Yönler
- Son Teknoloji Performansı: YOLOv8, tüm ölçeklerde önceki modellerden daha iyi performans göstererek olağanüstü bir doğruluk ve hız dengesi sunar. Daha küçük modelleri, karşılaştırılabilir YOLOv7 varyantlarından daha hızlı ve daha doğrudur, daha büyük modelleri ise hassasiyet için yeni standartlar belirler.
- Rakipsiz Çok Yönlülük: Öncelikli olarak bir nesne algılayıcısı olan YOLOv7'nin aksine, YOLOv8, kutudan çıkar çıkmaz birden çok görevi destekleyen birleşik bir çerçevedir: nesne algılama, örnek segmentasyonu, poz tahmini, görüntü sınıflandırması ve yönlendirilmiş nesne algılama (OBB).
- Kullanım Kolaylığı: Ultralytics, kolaylaştırılmış bir geliştirici deneyimine öncelik verir. YOLOv8, kodsuz eğitim ve dağıtım için basit bir Python API'si ve CLI, kapsamlı belgelendirme ve Ultralytics HUB gibi araçlarla sorunsuz entegrasyon ile birlikte gelir.
- İyi Yönetilen Ekosistem: Resmi bir Ultralytics modeli olarak YOLOv8, aktif geliştirme, sık güncellemeler ve güçlü bir açık kaynak topluluğundan yararlanır. Bu, güvenilirliği, en son özelliklere erişimi ve kapsamlı desteği garanti eder.
- Eğitim ve Bellek Verimliliği: YOLOv8 modelleri, genellikle transformatörler gibi diğer mimarilerden daha az CUDA belleği gerektiren verimli eğitim için tasarlanmıştır. COCO gibi veri kümelerinde hazırda bulunan önceden eğitilmiş ağırlıklar, özel veriler üzerinde daha hızlı yakınsamayı sağlar.
Zayıflıklar
- Son derece gelişmiş bir model olarak, en büyük YOLOv8 varyantları eğitim için önemli miktarda işlem kaynağı gerektirir, ancak performans seviyeleri için oldukça verimlidirler.
İdeal Kullanım Senaryoları
YOLOv8'in üstün performansı ve çok yönlülüğü, onu uç cihazlardan bulut sunucularına kadar geniş bir uygulama yelpazesi için ideal bir seçim haline getirir.
- Gerçek Zamanlı Endüstriyel Otomasyon: Yüksek hızlı, doğru algılama ile üretimde kalite kontrol ve süreç izlemeyi güçlendirme.
- Gelişmiş Yapay Zeka Çözümleri: Tarımda ürün izleme ve sağlık hizmetlerinde tıbbi görüntü analizi için karmaşık uygulamaları mümkün kılar.
- Otonom Sistemler: Otonom araçlar ve robotik için güçlü algılama sağlar.
YOLOv8 hakkında daha fazla bilgi edinin
YOLOv7: Gerçek Zamanlı Algılamada Bir Kriter
YOLOv7, 2022'de gerçek zamanlı nesne algılamada önemli bir adım olarak tanıtıldı ve yayınlandığı sırada yeni bir son teknoloji standardı belirledi. Çıkarım maliyetlerini artırmadan doğruluğu artırmak için eğitim süreçlerini optimize etmeye odaklandı.
Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
Tarih: 2022-07-06
Arşiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Belgeler: https://docs.ultralytics.com/models/yolov7/
Mimari ve Tasarım
YOLOv7, öğrenme verimliliğini artırmak için backbone'unda Genişletilmiş Verimli Katman Toplama Ağı (E-ELAN) dahil olmak üzere çeşitli mimari yenilikler sunmuştur. En dikkat çekici katkısı, çıkarım yüküne ekleme yapmadan model doğruluğunu artıran eğitim stratejileri olan "eğitilebilir bedava hediyeler çantası" kavramı olmuştur. Bunlar, yardımcı başlıklar ve kabadan inceye etiket atama gibi teknikleri içerir.
Güçlü Yönler
- Piyasaya Sürüldüğünde Yüksek Performans: YOLOv7, o zamanlar mevcut olan diğer dedektörlerden daha iyi performans göstererek mükemmel bir hız ve doğruluk kombinasyonu sunmuştur.
- Verimli Eğitim: "Bedava hediyeler" konsepti, optimize edilmiş eğitim rutinleriyle yüksek doğruluk elde etmesini sağladı.
- Yerleşik Kıyaslama: MS COCO gibi standart veri kümeleri üzerinde kapsamlı bir şekilde test edilmiş, saygın bir modeldir.
Zayıflıklar
- Sınırlı Çok Yönlülük: YOLOv7 öncelikli olarak bir nesne algılayıcısıdır. Segmentasyon veya poz tahmini gibi diğer görevlere genişletmek, YOLOv8'in entegre yaklaşımının aksine, ayrı, genellikle topluluk tarafından yönlendirilen uygulamalar gerektirir.
- Mimari Karmaşıklık: Eğitim teknikleri ve mimari bileşenler, YOLOv8'in aerodinamik tasarımına kıyasla anlamak ve değiştirmek için daha karmaşık olabilir.
- Yeni Modeller Tarafından Geride Bırakıldı: Güçlü olmasına rağmen, YOLOv7 hem hız hem de doğruluk açısından YOLOv8 tarafından geride bırakılmıştır. Ultralytics ekosistemi ayrıca daha kullanıcı dostu ve kapsamlı bir deneyim sunar.
İdeal Kullanım Senaryoları
YOLOv7, daha yeni alternatiflerin piyasaya sürülmesinden önce entegre edildiği uygulamalar için yetenekli bir model olmaya devam ediyor.
- Gerçek Zamanlı Güvenlik Sistemleri: Hızlı ve doğru tespitin önemli olduğu hırsızlık önleme gibi uygulamalar için uygundur.
- Eski Projeler: YOLOv7 mimarisi üzerine inşa edilmiş mevcut sistemleri korumak veya genişletmek için uygun bir seçenektir.
YOLOv7 hakkında daha fazla bilgi edinin
Performans ve Kıyaslamalar: YOLOv8 - YOLOv7
Performans karşılaştırması, YOLOv8 ile kaydedilen gelişmeleri açıkça göstermektedir. YOLOv8 modelleri genel olarak doğruluk ve hız arasında daha iyi bir denge sunmaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Verilerden, çeşitli önemli içgörüler ortaya çıkıyor:
- Üstün Doğruluk: En büyük model olan YOLOv8x, YOLOv7x modelinin 53.1 mAP değerini aşarak 53.9 mAP değerine ulaşır.
- Rakipsiz Hız: YOLOv8 modelleri, özellikle CPU'da önemli ölçüde daha hızlıdır. YOLOv8n modeli, ONNX ile CPU'da sadece 80.4 ms çıkarım süresine sahiptir; bu, YOLOv7 için mevcut olmayan ancak pratikte gözle görülür şekilde daha hızlı olan bir metriktir. GPU'da YOLOv8n, TensorRT ile inanılmaz bir 1.47 ms elde ederek YOLOv7'nin verimliliğini katbekat aşar.
- Daha Yüksek Verimlilik: YOLOv8 modelleri, karşılaştırılabilir veya daha iyi performans için daha az parametreye ve FLOP'a sahiptir. Örneğin, YOLOv8l, YOLOv7x ile neredeyse aynı mAP'ye (52.9'a karşı 53.1) ulaşır, ancak önemli ölçüde daha az parametreyle (43.7M'ye karşı 71.3M) ve FLOP'la (165.2B'ye karşı 189.9B).
Sonuç: Neden YOLOv8 Tercih Edilen Seçenek?
YOLOv7 etkileyici bir model olmasına rağmen, YOLOv8 yeni projeler ve geliştirme için açık ara kazanan modeldir. Üstün mimarisi, son teknoloji performansı ve inanılmaz çok yönlülüğü, onu nesne tespiti ve diğer bilgisayar görüşü görevleri için mevcut olan en güçlü ve kullanıcı dostu araç haline getiriyor.
Entegre Ultralytics ekosistemi, eğitimden dağıtıma kadar kusursuz bir deneyim sunarak önemli bir avantaj sağlar. Güçlü, iyi desteklenen ve yüksek performanslı bir model arayan geliştiriciler ve araştırmacılar için YOLOv8 kesin bir seçimdir.
Diğer Modelleri İnceleyin
Daha fazla keşfetmek isteyenler için Ultralytics bir dizi model ve karşılaştırma sunar. Şunlara göz atmayı düşünün:
- YOLOv8 vs. YOLOv5: YOLOv8'i, yaygın olarak benimsenmiş ve verimli başka bir modelle karşılaştırın.
- YOLOv8 vs. RT-DETR: YOLOv8'in transformer tabanlı mimarilere karşı nasıl bir performans sergilediğine bakın.
- YOLO11 - YOLOv8 Karşılaştırması: En son Ultralytics modeli olan YOLO11'deki gelişmeleri keşfedin.