YOLOv5 YOLO11: Nesne Algılamada Gelenek ve Yenilik Arasındaki Köprü
YOLO You Only Look Once) mimarisinin evrimi, bilgisayar görme alanında belirleyici bir yolculuk olmuştur. YOLOv5 temel güvenilirliğinden YOLO11 gelişmiş verimlili YOLOv5 , her yineleme hız ve doğruluk sınırlarını zorlamıştır. Bu kılavuz, geliştiricilerin, araştırmacıların ve mühendislerin belirli dağıtım ihtiyaçları için doğru modeli seçmelerine yardımcı olmak amacıyla ayrıntılı bir teknik karşılaştırma sunmaktadır.
Modele Genel Bakış
YOLOv5: Endüstri Standardı
2020 yılında Glenn Jocher ve Ultralyticstarafından piyasaya sürülen YOLOv5YOLO , pratik nesne algılama için altın standart haline geldi. Bu, PyTorch'da yerel olarak uygulanan ilk YOLO modeliydi ve bu sayede daha geniş AI topluluğu için son derece erişilebilir hale geldi. Kullanım kolaylığı, sağlam eğitim süreçleri ve dağıtım esnekliği arasındaki dengesi, binlerce akademik ve endüstriyel uygulamada yerini sağlamlaştırdı.
- Yazarlar: Glenn Jocher
- Kuruluş:Ultralytics
- Tarih: 2020-06-26
- GitHub:ultralytics/yolov5
YOLOv5 hakkında daha fazla bilgi edinin.
YOLO11: Geliştirilmiş Halefi
YOLO11, 2024 yılında piyasaya sürüldü ve Ultralytics önemli bir adımdır. YOLOv8 mimari gelişmelerini temel alan bu ürün, üstün özellik çıkarma ve verimlilik için tasarlanmış rafine bir backbone baş yapısı sunar. YOLO11 , hesaplama-doğruluk oranını en üst düzeye çıkarmaya YOLO11 ve önceki sürümlerine kıyasla daha az parametre ile daha yüksek ortalama hassasiyet (mAP) sağlar.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2024-09-27
- GitHub:ultralytics/ultralytics
YOLO11 hakkında daha fazla bilgi edinin
Son Öneri
YOLO11 , YOLOv5 göre önemli iyileştirmeler YOLO11 , 2026'da yeni projelere başlayan geliştiriciler YOLO26'yı da değerlendirmelidir. Yerel olarak uçtan uca tasarım ( NMS kaldırma), yenilikçi MuSGD optimizörü ve %43'e kadar daha hızlı CPU sahip olan bu ürün, modern uç dağıtım için en iyi seçimdir.
Teknik Mimari Karşılaştırması
Backbone ve Özellik Çıkarımı
YOLOv5 CSPDarknet backbone kullanır. Bu Çapraz Aşamalı Kısmi ağ tasarımı, zengin gradyan akışını korurken hesaplama fazlalığını azaltmak için devrim niteliğindeydi. Derinlik ve genişliği etkili bir şekilde dengeleyerek, modelin parametre sayısını patlatmadan karmaşık özellikleri öğrenmesini sağlar.
YOLO11 , gelişmiş bir CSP backbone C3k2) ile bu konsepti geliştirir ve iyileştirilmiş uzamsal dikkat mekanizmaları sunar. Mimari, ince ayrıntıları yakalamak için özel olarak ayarlanmıştır, bu da küçük nesne algılamada performansı önemli ölçüde artırır. Bu rafine tasarım, YOLO11 daha küçük bir model ayak izi ile daha yüksek doğruluk YOLO11 sağlar.
Tespit Başlığı
Algılama kafası YOLOv5 , nesne konumlarını tahmin etmek için önceden tanımlanmış bağlantı kutularına dayanan bağlantı tabanlıdır. Etkili olmasına rağmen, bu yaklaşım özel veri kümeleri için bağlantı boyutlarının dikkatli bir şekilde hiperparametre ayarını gerektirir.
YOLO11 ankrajsız algılama kafası kullanır. Bu modern yaklaşım, nesne merkezlerini ve boyutlarını doğrudan tahmin ederek eğitim sürecini basitleştirir ve ankraj kutusu hesaplamalarına olan ihtiyacı ortadan kaldırır. Bu, eğitim sürecini kolaylaştırmakla kalmaz, aynı zamanda çeşitli nesne şekilleri ve en boy oranları arasında genellemeyi de iyileştirir.
Performans Metrikleri
Aşağıdaki tablo, YOLOv5 YOLO11 arasındaki performans farklarını göstermektedir. Önemli bir gözlem, hız ve doğruluk arasındaki dengedir. YOLO11 , özellikle GPU , rekabetçi veya üstün çıkarım hızlarını korurken, YOLO11 daha yüksek mAP elde etmektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 1.9 | 4.5 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 7.2 | 16.5 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 21.2 | 49.0 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 46.5 | 109.1 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 86.7 | 205.7 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Analiz:
- Doğruluk: YOLO11n (Nano), %39,5 mAP gibi etkileyici bir sonuç elde ederek YOLOv5n'in %28,0'lık sonucunu önemli ölçüde geride bırakıyor. Bu da YOLO11 yüksek hassasiyet gerektiren hafif uygulamalar için çok daha üstün YOLO11 seçenek haline getiriyor.
- H CPU : YOLO11 , ONNX formatında daha hızlıGPU çıkarım hızları sergilerler. Bu,GPU dağıtım için çok önemlidir.
- Verimlilik: YOLO11 , benzer veya genellikle daha düşük parametre sayısı ile (örneğin, YOLO11x ile YOLOv5x karşılaştırması) bu kazanımları YOLO11 , mimari optimizasyonlarının verimliliğini ortaya koymaktadır.
Eğitim ve Ekosistem
Kullanım Kolaylığı
Her iki model de, geliştirici deneyimini ön planda tutan, tanınmış Ultralytics yararlanmaktadır.
- YOLOv5 sezgisel yapısı ve standart PyTorch dataloader'lara güvenmesiyle "5 dakikada eğitime başla" standardını belirledi.
- YOLO11 birleşik yapıya sorunsuz bir şekilde entegre olur
ultralyticsPython . Bu paket, tüm görevler için tutarlı bir API sağlar, yani Algılama için Örnek Segmentasyonu veya Poz Tahmini yalnızca tek bir dize argümanını değiştirmeyi gerektirir.
Eğitim Verimliliği
YOLO11 , genellikle daha hızlı yakınsama sağlayan optimize edilmiş eğitim rutinleri YOLO11 . Mozaik büyütme gibi özellikler iyileştirilmiştir ve bağlantı noktası içermeyen tasarım, YOLOv5 bulunan otomatik bağlantı noktası evrimini ön işleme adımını ortadan kaldırır. Ayrıca, her iki model de, transformatör tabanlı dedektörlere kıyasla eğitim sırasında önemli ölçüde daha düşük bellek kullanımı sergiler. RT-DETRgibi dönüştürücü tabanlı dedektörlere kıyasla önemli ölçüde daha düşük bellek kullanımı sergiler, bu da tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.
Ultralytics ile eğitim
YOLO11 eğitimi, Python kullanılarak son derece YOLO11 . Aynı sözdizimi, YOLOv5 için YOLOv5 geçerlidir. ultralytics paketi.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Çok Yönlülük
YOLOv5 , yaşam döngüsünün ilerleyen aşamalarında segmentasyon ve sınıflandırma desteği YOLOv5 , YOLO11 baştan sona çoklu görev öğrencisi olarak YOLO11 . Yerel olarak şunları destekler:
- Nesne Algılama
- Örnek Segmentasyonu
- Görüntü Sınıflandırması
- Poz Tahmini
- Yönlendirilmiş Sınırlayıcı Kutu (OBB)
Bu, YOLO11 , aynı anda birden fazla analiz türünün gerekli olduğu karmaşık bilgisayar görme süreçleri için daha çok yönlü YOLO11 "İsviçre çakısı" haline getirir.
İdeal Kullanım Senaryoları
YOLOv5 Ne Zaman Tercih Edilmeli?
- Eski Sistemler: YOLOv5 formatı veya
requirements.txtYOLOv5 ile devam etmek istikrarı YOLOv5 . - Özel Donanım Kısıtlamaları: Çok eski donanımlarda veya belirli FPGA uygulamalarında, YOLOv5 daha basit mimarisi mevcut optimize edilmiş bit akışlarına sahip YOLOv5 .
- Araştırma Tekrarlanabilirliği: 2020-2023 yılları arasında YOLOv5 temel YOLOv5 kullanan akademik makaleleri yeniden üretmek için.
Ne Zaman YOLO11 Seçmeli
- Edge AI Dağıtımı: Üstün hız-doğruluk oranı, YOLO11 NVIDIA veya Raspberry Pi gibi cihazlar için, özellikle gerçek zamanlı video işleme için YOLO11 getirir.
- Yüksek Doğruluk Gereksinimleri: mAP her yüzde puanı mAP olan tıbbi görüntüleme veya kusur tespiti uygulamaları.
- Çoklu Görev Uygulamaları: Poz tahmini (ör. spor analitiği) veya döndürülmüş sınırlayıcı kutular (ör. hava ölçümü) gerektiren projeler, YOLO11 yerel desteğinden yararlanır.
- Bulut Eğitimi: Verimli veri kümesi yönetimi ve model eğitimi için Ultralytics kullanma.
Sonuç
Hem YOLOv5 YOLO11 , Ultralytics açık kaynak mükemmelliğine olan bağlılığının YOLO11 . YOLOv5 güvenilir, savaşta test edilmiş bir iş gücü olmaya devam etmektedir. Ancak, YOLO11 , mimari iyileştirmeleri, üstün doğruluğu ve daha geniş görev desteği ile cazip bir yükseltme yolu sunmaktadır.
Geleceğe bakan geliştiriciler için seçim açıktır: YOLO11 , modern uygulamalar için gerekli performans avantajını YOLO11 . En son teknolojiyi arayanlar için, daha da basit bir dağıtım için uçtan uca NMS algılama özelliği sunan YOLO26'yı da kesinlikle incelemenizi öneririz.
İlginizi çekebilecek diğer modeller şunlardır YOLOv10 gerçek zamanlı performans araştırması için veya YOLO açık sözlük algılama için.