YOLOv8 vs YOLO11: Gerçek Zamanlı Nesne Tespitinin Evrimi
Doğru bilgisayarla görme mimarisini seçmek, yapay zeka projelerinizin hızını, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu kılavuz, aşağıdakiler arasında derinlemesine bir teknik karşılaştırma sağlar Ultralytics YOLOv82023'te piyasaya sürülen ve yaygın olarak benimsenen bir endüstri standardı olan Ultralytics YOLO11üstün verimlilik ve performans için tasarlanmış YOLO serisinin en son evrimi. İhtiyaçlarınıza en uygun modeli seçmenize yardımcı olmak için mimari farklılıklarını, kıyaslama ölçümlerini ve ideal kullanım durumlarını analiz edeceğiz.
Ultralytics YOLOv8
Yazarlar Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Organizasyon:Ultralytics
Tarih: 2023-01-10
GitHubultralytics
Docsultralyticsyolov8
2023 yılının başlarında piyasaya sürülen YOLOv8 , nesne algılama tarihinde önemli bir dönüm noktası oldu. Tek bir havuzda algılama, örnek segmentasyonu, poz tahmini ve görüntü sınıflandırmasıdahil olmak üzere birden fazla bilgisayarla görme görevini destekleyen birleşik bir çerçeve sundu. YOLOv8 , çapa tabanlı algılamadan, tasarımı basitleştiren ve farklı nesne şekilleri arasında genelleştirmeyi geliştiren çapasız bir yaklaşıma geçmiştir.
Mimari ve Temel Özellikler
YOLOv8 'de bulunan C3 modüllerinin yerini YOLOv5C2f modülü ile (iki konvolüsyonlu Çapraz Aşamalı Kısmi darboğaz). Bu değişiklik, hafif bir ayak izini korurken gradyan akışını ve özellik entegrasyonunu geliştirdi. Mimari ayrıca doğruluğu artırmak için nesnellik, sınıflandırma ve regresyon görevlerini ayıran ayrıştırılmış bir kafaya sahiptir.
Güvenilirlik Mirası
YOLOv8 , üretim otomasyonundan otonom araçlara kadar binlerce ticari uygulamada test edilmiş, istikrar ve dağıtım kolaylığı konusunda itibar kazanmıştır.
Güçlü ve Zayıf Yönler
- Güçlü Yönler:
- Olgun Ekosistem: Çok çeşitli topluluk eğitimleri, entegrasyonlar ve dağıtım kılavuzları tarafından desteklenir.
- Çok yönlülük: Standart algılamanın yanı sıra OBB (Oriented Bounding Box) ve sınıflandırmayı yerel olarak destekler.
- Kanıtlanmış Kararlılık: Uzun bir track sahip bir model gerektiren üretim ortamları için güvenli bir seçim.
- Zayıflıklar:
- Hız Verimliliği: Hızlı olmasına rağmen, CPU çıkarım hızlarında ve parametre verimliliğinde YOLO11 'den daha iyi performans gösterir.
- Hesaplama Gereksinimleri: Daha büyük varyantlar (L, X), optimize edilmiş YOLO11 eşdeğerlerine kıyasla daha fazla VRAM ve FLOP gerektirir.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
YOLOv8 hakkında daha fazla bilgi edinin
Ultralytics YOLO11
Yazarlar: Glenn Jocher ve Jing Qiu
Organizasyon:Ultralytics
Tarih: 2024-09-27
GitHubultralytics
Docsultralyticsyolo11
YOLO11Ultralytics model ailesinin en ileri noktasını temsil eder. Gerçek zamanlı çıkarımı yeniden tanımlamak üzere tasarlanan bu model, YOLOv8 ' in başarılarını temel almakla birlikte önemli mimari iyileştirmeler de getirmektedir. YOLO11 , hesaplama maliyetini en aza indirirken doğruluğu en üst düzeye çıkarmaya odaklanır ve bu da onu uç cihazlardan bulut sunucularına kadar değişen modern yapay zeka uygulamaları için önde gelen seçim haline getirir.
Mimari ve Temel Özellikler
YOLO11 , C3k2 bloğunu ve C2PSA (Uzamsal Dikkat ile Çapraz Aşamalı Kısmi) modülünü tanıttı. Bu bileşenler, modelin karmaşık özellikleri çıkarma ve oklüzyonu önceki yinelemelere göre daha etkili bir şekilde ele alma yeteneğini geliştirir. Mimari hız için optimize edilmiştir ve GPU kaynaklarının kullanılamadığı uç yapay zeka dağıtımları için kritik bir faktör olan CPU'larda önemli ölçüde daha hızlı işlem süreleri sunar.
Model, Ultralytics'in birleşik arayüz özelliğini koruyarak geliştiricilerin iş akışlarını değiştirmeden OBB veya segmentasyon gibi görevler arasında geçiş yapabilmelerini sağlar.
Güçlü ve Zayıf Yönler
- Güçlü Yönler:
- Üstün Verimlilik: YOLOv8'e göre %22 'ye kadar daha az parametre ile daha yüksek mAP elde ederek model boyutunu ve depolama ihtiyaçlarını azaltır.
- Daha Hızlı Çıkarım: Hem CPU hem de GPU arka uçlarında daha yüksek hızlar sunan modern donanımlar için özel olarak optimize edilmiştir.
- Geliştirilmiş Özellik Çıkarımı: Yeni backbone , küçük nesnelerin algılanmasını ve dağınık sahnelerdeki performansı artırır.
- Daha Düşük Bellek Kullanımı: gibi dönüştürücü tabanlı modellere kıyasla eğitim sırasında daha az CUDA belleği gerektirir. RT-DETRdaha erişilebilir donanımlar üzerinde eğitim verilmesini sağlar.
- Zayıflıklar:
- Daha Yeni Sürüm: Yeni bir model olarak, belirli niş üçüncü taraf araçların desteğini tam olarak güncellemesi zaman alabilir, ancak çekirdek Ultralytics ekosistemi ilk günden itibaren desteklemektedir.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
YOLO11 hakkında daha fazla bilgi edinin
Performans Kafa Kafaya
Aşağıdaki karşılaştırma YOLO11'in verimlilik kazanımlarını vurgulamaktadır. YOLOv8 güçlü bir rakip olmaya devam ederken, YOLO11 daha düşük hesaplama karmaşıklığı (FLOP'lar) ve daha yüksek çıkarım hızları ile sürekli olarak daha yüksek doğruluk (mAP) sağlamaktadır. Bu durum özellikle YOLO11n'in YOLOv8n'in 37,3 mAP değerine kıyasla 39,5 mAP değerine ulaştığı ve CPU'da önemli ölçüde daha hızlı çalıştığı "Nano" ve "Small" modellerinde göze çarpmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Metrik Analiz
YOLO11 , hız-doğruluk dengesinde açık bir avantaj göstermektedir. Örneğin, YOLO11l modeli yaklaşık %42 daha az parametre kullanırken ve CPU' da %36 daha hızlı çalışırken doğrulukta YOLOv8l 'yi geçmektedir (+0,5 mAP).
Ekosistem ve Kullanım Kolaylığı
Her iki model de, en son teknolojiyi herkes için erişilebilir hale getirerek yapay zekayı demokratikleştirmek için tasarlanan sağlam Ultralytics ekosisteminden yararlanır.
- Birleşik API: YOLOv8 ve YOLO11 arasında geçiş yapmak, model dizesini şu şekilde değiştirmek kadar basittir
yolov8n.ptiçinyolo11n.pt. Kodun yeniden düzenlenmesi gerekmez. - Eğitim Verimliliği: Ultralytics , otomatik indirilen veri kümeleri ve önceden eğitilmiş ağırlıklar sağlayarak veri toplamadan model eğitimine kadar boru hattını kolaylaştırır.
- Dağıtım Çok Yönlülüğü: Her iki model de ONNX, TensorRT, CoreML ve TFLite gibi formatlara tek tıkla dışa aktarımı destekleyerek Raspberry Pis, cep telefonları ve bulut örnekleri gibi çeşitli donanımlarda dağıtımı kolaylaştırır.
- Bakımlı: Sık sık yapılan güncellemeler, Discord ve GitHub'daki aktif bir topluluk tarafından desteklenen PyTorch ve CUDA'nın en son sürümleriyle uyumluluğu sağlar.
Sonuç ve Öneriler
Bir yandan YOLOv8 eski sistemlerin bakımı için uygun, güvenilir ve son derece yetenekli bir model olmaya devam etmektedir, YOLO11 tüm yeni gelişmeler için açık bir öneridir.
- Aşağıdaki durumlarda YOLO11 'i seçin: Mümkün olan en yüksek doğruluğa, daha yüksek çıkarım hızlarına (özellikle CPU'da) ihtiyacınız varsa veya bellek ve depolamanın birinci sınıf olduğu, kaynakları kısıtlı uç cihazlara dağıtım yapıyorsanız. Mimari iyileştirmeleri, ticari uygulamalar için geleceğe dönük bir temel sağlar.
- Aşağıdaki durumlarda YOLOv8 'i seçin: v8'e özgü davranışlar için yoğun bir şekilde ayarlanmış mevcut bir boru hattınız varsa veya en son mimariye güncellemeyi engelleyen katı proje gereksinimleri tarafından kısıtlanıyorsanız.
Diğer mimarileri keşfetmekle ilgilenenler için Ultralytics dokümanları aşağıdaki gibi modelleri de kapsamaktadır YOLOv9, YOLOv10ve RT-DETR. Daha geniş karşılaştırmaları model karşılaştırma sayfamızda görebilirsiniz.