YOLOv5 YOLOv10: Gerçek Zamanlı Nesne Algılayıcılarının Teknik Karşılaştırması
You Only Look Once (YOLO) mimarisinin evrimi, bilgisayar görme tarihinin belirleyici bir öyküsü olmuştur. Bu zaman çizelgesindeki iki önemli dönüm noktası şunlardır YOLOv5, güvenilirlik ve kullanım kolaylığı açısından endüstri standardıdır ve YOLOv10, son işlemdeki darboğazları ortadan kaldırmaya odaklanan akademik bir atılımdır. Bu kılavuz, geliştiricilerin uygulamaları için doğru aracı seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sunarken, en son YOLO26'nın her ikisinin güçlü yönlerini nasıl birleştirdiğini de incelemektedir.
Model Kökenleri ve Özellikleri
Performans ölçütlerine dalmadan önce, her modelin arka planını anlamak çok önemlidir.
YOLOv5
Yazar: Glenn Jocher
Kuruluş: Ultralytics
Tarih: 2020-06-26
GitHub: yolov5
Belgeler: YOLOv5
YOLOv10
Yazarlar: Ao Wang, Hui Chen, Lihao Liu, et al.
Kuruluş: Tsinghua Üniversitesi
Tarih: 2024-05-23
Arxiv: arXiv:2405.14458
GitHub: THU-MIG/yolov10
Belgeler: YOLOv10
YOLOv5 hakkında daha fazla bilgi edinin.
Performans Analizi
Aşağıdaki tablo, nesne algılama için standart bir karşılaştırma ölçütü olan COCO indeki modelleri karşılaştırmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv10 daha az parametre ile daha yüksek ortalama hassasiyet (mAP) elde eder ve bu da yeni mimarisinin verimlilik artışını vurgular. Ancak YOLOv5 , yüksek düzeyde optimize edilmiş CUDA sayesinde, özellikle eski donanımlarda GPU hızlarında rekabet güc YOLOv5 .
YOLOv10 hakkında daha fazla bilgi edinin.
Mimari ve Tasarım
YOLOv5: Güvenilir Standart
YOLOv5 değiştirilmiş bir CSPNet backbone bir PANet boynu üzerine inşa YOLOv5 . Standart çapa tabanlı algılama başlıkları kullanır ve bu başlıklar, yinelenen sınırlayıcı kutuları filtrelemek için son işlem sırasında Non-Maximum Suppression (NMS) gerektirir.
- Güçlü yönleri: Son derece olgun kod tabanı, üçüncü taraf araçlar tarafından geniş çapta desteklenir ve Raspberry Pi gibi uç cihazlarda kararlı bir şekilde kullanılır.
- Zayıf yönleri: NMS dayanır ve sahnedeki nesne sayısına bağlı olarak gecikme değişkenliği yaratabilir.
YOLOv10: NMS Öncü
YOLOv10 , NMS eğitim için Tutarlı Çift Atamalar kullanarak bir paradigma değişikliği YOLOv10 . Bu, modelin nesne başına tam olarak bir kutu tahmin etmesini sağlar ve NMS adımlarına olan ihtiyacı ortadan kaldırır.
- Güçlü yönleri: NMS sayesinde yüksek yoğunluklu sahnelerde daha düşük çıkarım gecikmesi; verimli sıralama kılavuzlu blok tasarımı, hesaplama fazlalığını azaltır.
- Zayıf yönler: Yeni mimari, bazı derleyiciler için özel dışa aktarım ayarları gerektirebilir; v5'e kıyasla daha az tarihsel topluluk desteği vardır.
NMS Darboğazı
Maksimum Olmayan Bastırma (NMS), üst üste binen sınırlayıcı kutuları filtreleyen bir son işlem adımıdır. Etkili olmakla birlikte, sıralıdır ve CPU'larda hesaplama açısından maliyetlidir. YOLOv10 YOLO26'da olduğu gibi bunu kaldırmak, uç donanımdaki gerçek zamanlı uygulamalar için çok önemlidir.
Ekosistem ve Kullanım Kolaylığı
Geliştiriciler için en önemli faktörlerden biri, modeli çevreleyen ekosistemdir. Araştırma deposu ile üretim platformu arasındaki farkın netleştiği nokta da budur.
Ultralytics'in Avantajı
Her iki model de ultralytics Python , onlara sağlam bir araç setine erişim sağlar.
- Ultralytics : Kullanıcılar, Ultralytics kullanarak veri kümelerini yönetebilir, bulutta eğitim alabilir ve modelleri sorunsuz bir şekilde uygulayabilir.
- Eğitim Verimliliği: Ultralytics , eğitim sırasında bellek verimliliği için optimize edilmiştir ve genellikle transformatör tabanlı alternatiflere göre önemli ölçüde daha az VRAM gerektirir.
- Çok yönlülük: YOLOv10 öncelikle bir algılama modeli YOLOv10 da, Ultralytics temel modellerinde Görüntü Segmentasyonu, Poz Tahmini ve Yönlendirilmiş Nesne Algılama (OBB) özelliklerini destekler.
Kod Örneği
Modeller arasında geçiş yapmak, model adı dizesini değiştirmek kadar basittir.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)
# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")
İdeal Kullanım Senaryoları
YOLOv5 Ne Zaman Tercih Edilmeli?
- Eski Sistemler: YOLOv5 formatları etrafında oluşturulmuş mevcut bir boru hattınız varsa.
- En geniş uyumluluk: Yeni operatörlerin henüz desteklenmediği eski gömülü sistemlerde kullanım için.
- Topluluk Kaynakları: Son beş yılda oluşturulan binlerce öğretici ve üçüncü taraf entegrasyonlarına erişmeniz gerektiğinde.
YOLOv10 Ne Zaman Tercih Edilmeli?
- Yüksek Yoğunluklu Algılama: NMS işlemeyi NMS kalabalık sayımı veya trafik analizi gibi senaryolar.
- S ık ı Gecikme Kısıtlamaları: Her milisaniyenin önemli olduğu gerçek zamanlı robotik veya otonom sürüş.
- Araştırma: Ödev stratejileri ve mimari budama alanındaki en son gelişmeleri deneme.
En İyi Öneri: YOLO26
YOLOv5 istikrar YOLOv5 , YOLOv10 NMS çıkarım YOLOv10 . Yeni piyasaya sürülen Ultralytics ise bu avantajları tek bir üstün çerçeve içinde birleştirir.
Neden YOLO26'ya yükseltmelisiniz? YOLO26, YOLOv10 tarafından başlatılan NMS tasarımı benimseyen, YOLOv10 bunu sağlam Ultralytics boru hattıyla geliştiren, doğal olarak uçtan uca bir sistemdir.
- MuSGD Optimizer: LLM eğitimi (özellikle Moonshot AI'nın Kimi K2'si) esinlenerek geliştirilen bu optimizer, istikrarlı yakınsama ve daha hızlı eğitim sağlar.
- Performans: Kenar bilişim için optimize edilmiş olup, önceki nesillere kıyasla %43'e kadar daha hızlı CPU sağlar.
- Doğruluk: ProgLoss ve STAL (Semantik Token Hizalama Kaybı) özelliklerine sahiptir ve önceki modellerde genellikle zayıf olan küçük nesne algılamasını önemli ölçüde iyileştirir.
- Tam Çok Yönlülük: Algılama üzerine YOLOv10 farklı olarak, YOLO26 segmentasyon, poz, sınıflandırma ve OBB için son teknoloji modelleri sunar.
2026 yılında başlayacak tüm yeni projeler için, veri seti açıklamalarından model dışa aktarmaya kadar en kolay yolu sunan YOLO26 önerilen seçimdir.
YOLO26 hakkında daha fazla bilgi edinin
Sonuç
Hem YOLOv5 YOLOv10 , bilgisayar görüşünde önemli dönüm YOLOv10 . YOLOv5 AI'yı erişilebilir ve güvenilir hale getirerek demokratikleştirirken, YOLOv10 uçtan uca işlemenin teknik sınırlarını zorladı. Ancak bu alan hızla gelişiyor. YOLO26'nın piyasaya sürülmesiyle, geliştiriciler artık Ultralytics güvenilirliği ile NMS mimarilerin hızı arasında seçim yapmak zorunda kalmıyor. YOLO26 her ikisini de sunuyor.
Diğer modern alternatifler için, aşağıdakileri de inceleyebilirsiniz YOLO11 veya transformatör tabanlı algılama için Real-Time DETR (RT-DETR) seçeneklerini de değerlendirebilirsiniz.