YOLOv10 - YOLOv5 Karşılaştırması: Detaylı Teknik Bir Karşılaştırma
Doğru nesne algılama modelini seçmek, herhangi bir bilgisayarla görü projesi için çok önemlidir, çünkü performans uygulama başarısını doğrudan etkiler. You Only Look Once (YOLO) model ailesi, hızı ve doğruluğu ile ünlüdür. Bu sayfa, Tsinghua Üniversitesi'nden son teknoloji bir model olan YOLOv10 ve çok yönlü ve yaygın olarak benimsenen bir endüstri standardı olan Ultralytics YOLOv5 arasında ayrıntılı bir teknik karşılaştırma sunmaktadır. Bu analiz, geliştiricilerin ve araştırmacıların özel ihtiyaçlarına göre bilinçli bir karar vermelerine yardımcı olacaktır.
YOLOv10: En Son Teknolojiye Sahip Gerçek Zamanlı Algılayıcı
YOLOv10, Non-Maximum Suppression (NMS) işlem sonrası gereksinimini ortadan kaldırarak gerçek uçtan uca verimlilik elde etmeye odaklanarak gerçek zamanlı nesne tespitinde önemli bir ilerlemeyi temsil eder.
Teknik Detaylar:
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
- Kuruluş: Tsinghua University
- Tarih: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- Belgeler: https://docs.ultralytics.com/models/yolov10/
Mimari ve Temel Özellikler
YOLOv10, hız-doğruluk dengesinin sınırlarını zorlamak için çeşitli mimari gelişmeler sunar. arXiv makalesinde ayrıntılı olarak açıklandığı gibi, temel özellikleri şunlardır:
- NMS'siz Eğitim: Eğitim sırasında tutarlı çift atamalar kullanır, bu da modelin NMS adımı olmadan temiz tahminler üretmesini sağlar. Bu yenilik, dağıtım hattını basitleştirir ve birçok gerçek zamanlı sistemde kritik bir darboğaz olan çıkarım gecikmesini azaltır.
- Bütünsel Verimlilik-Doğruluk Tasarımı: Model mimarisi, backbone'dan boyuna ve başlığa kadar kapsamlı bir şekilde optimize edildi. Bu, hesaplama yedekliliğini azaltan ve model yeteneğini geliştiren hafif bir sınıflandırma başlığı ve uzamsal-kanal ayrıştırılmış alt örneklemeyi içerir.
- Anchor-Free (Çapa Kutusu Olmayan) Algılama: Birçok modern algılayıcı gibi, YOLOv10 da mimariyi basitleştiren ve çeşitli nesne boyutları ve en boy oranları arasında genellemeyi geliştiren bir anchor-free (çapa kutusu olmayan) yaklaşım kullanır.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Üstün Hız ve Verimlilik: Düşük gecikme gereksinimleri için çok önemli olan daha hızlı işlem sunarak gerçek zamanlı çıkarım için optimize edilmiştir.
- NMS'siz Mimari: NMS işlem sonrasını ortadan kaldırır, dağıtımı basitleştirir ve genel çıkarım süresini azaltır.
- Daha Az Parametre ile Yüksek Doğruluk: Daha küçük model boyutlarıyla rekabetçi doğruluk elde ederek, kaynak kısıtlı ortamlar için oldukça uygun hale getirir.
- End-to-End Deployment: Sorunsuz uçtan uca dağıtım için tasarlanmıştır; bu, üretim sistemleri için önemli bir avantajdır.
- Ultralytics Entegrasyonu: Harici olarak geliştirilmiş olmasına rağmen, YOLOv10, eğitim, doğrulama ve çıkarım için basit Python ve CLI arayüzlerinden yararlanarak Ultralytics ekosistemine iyi bir şekilde entegre edilmiştir.
Zayıflıklar:
- Daha Yeni Model: Yakın zamanda piyasaya sürülen bir model olduğu için, topluluk desteği ve üçüncü taraf entegrasyonlarının sayısı, YOLOv5 gibi köklü modellere kıyasla hala gelişiyor olabilir.
- Optimizasyon Karmaşıklığı: En yüksek performansı elde etmek, belirli donanımlar ve veri kümeleri için özel ince ayar ve optimizasyon gerektirebilir; bu da daha olgun modellere göre daha karmaşık olabilir.
Kullanım Alanları
YOLOv10, ultra hızlı ve verimli nesne algılama gerektiren uygulamalarda öne çıkar:
- Yüksek Hızlı Robotik: Dinamik ortamlardaki robotlar için gerçek zamanlı görsel işlemeyi mümkün kılarak robotiğin geleceğinde önemli bir bileşen oluşturur.
- Gelişmiş Sürücü Destek Sistemleri (ADAS): Gelişmiş yol güvenliği için hızlı nesne algılama sağlayarak kendi kendine giden arabalarda yapay zeka gibi çözümleri tamamlar.
- Gerçek Zamanlı Video Analizi: Trafik yönetimi gibi uygulamalarda faydalı olan anında içgörüler için yüksek kare hızlı videoları işler.
YOLOv10 hakkında daha fazla bilgi edinin
Ultralytics YOLOv5: Çok Yönlü ve Yaygın Olarak Benimsenen Model
Ultralytics YOLOv5, mükemmel hız, doğruluk ve dikkate değer kullanım kolaylığı dengesiyle tanınan bir endüstri standardı haline gelmiştir. Piyasaya sürülmesinden bu yana binlerce geliştirici ve araştırmacı için başvurulan bir model olmuştur.
Teknik Detaylar:
- Yazarlar: Glenn Jocher
- Kuruluş: Ultralytics
- Tarih: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Belgeler: https://docs.ultralytics.com/models/yolov5/
Mimari ve Temel Özellikler
PyTorch üzerine inşa edilen YOLOv5, özellik toplama için bir CSPDarknet53 backbone ve bir PANet boynu kullanır. Mimarisi, farklı hesaplama bütçelerine uyacak şekilde çeşitli boyutlarda (n, s, m, l, x) sunulan, son derece ölçeklenebilirdir. Popülerliğinin temel nedenlerinden biri, Ultralytics tarafından sağlanan ve aşağıdakileri içeren akıcı kullanıcı deneyimidir:
- Basit ve Tutarlı API: Eğitim, doğrulama ve çıkarım için basit bir arayüz.
- Kapsamlı Dokümantasyon: Özel verileri eğitime almaktan dağıtıma kadar her şeyi kapsayan kapsamlı kılavuzlar ve eğitimler.
- Entegre Ekosistem: Kodsuz eğitim ve MLOps yönetimi için Ultralytics HUB gibi araçlar dahil olmak üzere Ultralytics ekosistemi içinde tam destek.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- Olağanüstü Kullanım Kolaylığı: Basit API'si, kapsamlı belgeleri ve sorunsuz entegrasyonu ile ünlüdür, bu da onu hem yeni başlayanlar hem de uzmanlar için oldukça erişilebilir kılar.
- Olgun ve Güçlü Ekosistem: Geniş ve aktif bir topluluktan, sık güncellemelerden, kolayca erişilebilen önceden eğitilmiş ağırlıklardan ve kapsamlı kaynaklardan yararlanır.
- Performans Dengesi: Çok çeşitli gerçek dünya uygulamaları için pratik bir seçim olmasını sağlayan hız ve doğruluk arasında mükemmel bir denge sunar.
- Eğitim Verimliliği: Verimli eğitim süreci, birçok karmaşık mimariye kıyasla daha düşük bellek gereksinimleri ve önceden eğitilmiş ağırlıklarla daha hızlı yakınsama özelliği ile bilinir.
- Çok Yönlülük: örnek segmentasyonu ve görüntü sınıflandırması dahil olmak üzere, nesne algılama ötesindeki birden fazla görevi destekler.
Zayıflıklar:
- Anchor Tabanlı Algılama: Anchor kutularına dayanır ve bu durum bazen alışılmadık nesne şekillerine sahip veri kümelerinde optimum performans için ayarlama gerektirebilir.
- Doğruluk Dengesi: Yüksek performanslı olmasına rağmen, daha küçük YOLOv5 modelleri hıza öncelik verir ve YOLOv10 gibi daha yeni mimariler standart kıyaslama testlerinde daha yüksek mAP skorları elde edebilir.
Kullanım Alanları
YOLOv5'in çok yönlülüğü ve verimliliği, onu çok sayıda alan için uygun hale getirir:
- Edge Computing: Hızı ve daha küçük model boyutları, Raspberry Pi ve NVIDIA Jetson gibi cihazlarda dağıtım için mükemmel kılar.
- Endüstriyel Otomasyon: Üretimde kalite kontrolü ve süreç otomasyonu için yaygın olarak kullanılır.
- Güvenlik ve Gözetim: Güvenlik sistemleri ve kamu güvenliği uygulamalarında gerçek zamanlı izleme için idealdir.
- Mobil Uygulamalar: Kaynak tüketiminin önemli bir endişe kaynağı olduğu cihaz üzerinde nesne algılama görevleri için uygundur.
YOLOv5 hakkında daha fazla bilgi edinin
Karşılaştırmalı Analiz: Performans Dökümü
Aşağıdaki tablo, COCO veri kümesi üzerinde kıyaslanan çeşitli YOLOv10 ve YOLOv5 model varyantlarının ayrıntılı bir karşılaştırmasını sunmaktadır. Metrikler, doğruluk (mAP), çıkarım hızı ve model karmaşıklığı (parametreler ve FLOP'lar) arasındaki ödünleşimleri vurgulamaktadır.
Model | boyut (piksel) |
mAPval 50-95 |
Hız CPU ONNX (ms) |
Hız T4 TensorRT10 (ms) |
parametreler (M) |
FLOP'lar (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.20 | 56.9 | 160.4 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Verilerden, YOLOv10 modellerinin, YOLOv5 muadillerine kıyasla önemli ölçüde daha az parametre ve FLOP ile sürekli olarak daha yüksek mAP puanları elde ettiği açıkça görülmektedir. Örneğin, YOLOv10-S, YOLOv5-m'yi doğrulukta (46,7'ye karşı 45,4 mAP) geride bırakırken, parametrelerinin yalnızca yaklaşık üçte birine sahiptir. Bu, YOLOv10'un üstün mimari verimliliğini göstermektedir.
Ancak, Ultralytics YOLOv5, özellikle belirli donanımlardaki çıkarım hızı konusunda güçlü bir konumunu koruyor. YOLOv5n modeli, hem CPU hem de T4 GPU'larda dikkat çekici bir hız göstererek, her milisaniyenin önemli olduğu ve kaynakların son derece kısıtlı olduğu uygulamalar için mükemmel bir seçimdir.
Sonuç: Hangi Modeli Seçmelisiniz?
Hem YOLOv10 hem de Ultralytics YOLOv5 olağanüstü modellerdir, ancak farklı önceliklere hitap ederler.
YOLOv10, performans ve verimliliğin sınırlarını zorlaması gereken geliştiriciler ve araştırmacılar için ideal bir seçimdir. NMS'siz mimarisi, gecikme süresinin kritik olduğu uygulamalarda somut bir avantaj sağlar ve daha küçük bir model ayak iziyle yüksek doğruluk sunabilmesi, uç cihazlarda dağıtım için oyun değiştiricidir. Projeniz mutlak en iyi hız-doğruluk dengesini gerektiriyorsa ve daha yeni, gelişen bir modelle çalışmaya istekliyseniz, YOLOv10 zorlayıcı bir seçenektir.
Ultralytics YOLOv5, özellikle kullanım kolaylığına, hızlı geliştirmeye ve kararlı, iyi desteklenen bir ekosisteme öncelik veren kullanıcıların çoğu için önerilen seçim olmaya devam ediyor. Kanıtlanmış geçmişi, kapsamlı dokümantasyonu ve Ultralytics HUB gibi araçlarla sorunsuz entegrasyonu, onu inanılmaz derecede erişilebilir kılar. Olağanüstü bir performans dengesine sahip, güvenilir, çok yönlü ve kolayca dağıtılabilen bir model gerektiren projeler için YOLOv5 olağanüstü ve güvenilir bir seçimdir.
Sonuç olarak, karar projenizin özel kısıtlamalarına ve hedeflerine bağlıdır. En üst düzey verimlilik için YOLOv10'a bakın. Sağlam, kullanıcı dostu ve çok yönlü bir çözüm için Ultralytics YOLOv5'i geçmek zordur.
Diğer YOLO Modellerini İnceleyin
YOLO dünyası sürekli olarak gelişiyor. YOLOv10 ve YOLOv5'in ötesini keşfetmek isteyenler için Ultralytics bir dizi güçlü model sunuyor. Birden fazla görüş görevi için destekle performans ve çok yönlülüğün harika bir dengesini sunan Ultralytics YOLOv8'e veya son teknoloji sonuçlar için en son YOLO11'e göz atmayı düşünün.
İhtiyaçlarınız için en iyi modeli seçmenize yardımcı olacak daha fazla karşılaştırma mevcuttur: