YOLOv10 - YOLO11 Karşılaştırması: Gerçek Zamanlı Nesne Algılamanın Sınırlarında Gezinme
Herhangi bir yapay zeka projesinin başarısı için doğru bilgisayar görüşü modelini seçmek önemlidir ve hız, doğruluk ve dağıtım kolaylığı arasındaki dengeyi sağlar. Bu kılavuz, YOLOv10, NMS'siz eğitime odaklanan akademik bir sürüm ve kurumsal düzeyde performans ve çok yönlülük için tasarlanmış, ünlü YOLO serisindeki en son gelişme olan Ultralytics YOLO11 arasında ayrıntılı bir teknik karşılaştırma sunar.
YOLOv10 gecikmeyi azaltmak için ilginç mimari kavramlar sunarken, YOLO11 üstün doğruluk, daha geniş görev desteği ve veri açıklamasından model dağıtımına kadar iş akışını basitleştiren sağlam bir ekosistem ile en son teknolojiyi geliştirmektedir.
YOLOv10: NMS'siz Uzman
YOLOv10, belirli bir hedefle akademik araştırmalardan ortaya çıktı: Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldırarak çıkarım hattını optimize etmek. Bu yaklaşım, belirli uç senaryolarında daha düşük gecikmeyi hedefler.
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu, ve diğerleri.
- Kuruluş:Tsinghua Üniversitesi
- Tarih: 2024-05-23
- Arxiv:2405.14458
- GitHub:THU-MIG/yolov10
- Belgeler:YOLOv10 Dökümantasyonu
Mimari ve İnovasyon
YOLOv10'un belirleyici özelliği, NMS'siz eğitim için tutarlı çift atama stratejisidir. Geleneksel YOLO modelleri genellikle tek bir nesne için birden çok sınırlayıcı kutu tahmin eder ve yinelenenleri filtrelemek için NMS son işlemeyi gerektirir. YOLOv10, modelin doğrudan nesne başına tek bir en iyi kutu çıkarmasını teşvik etmek için eğitim kaybını değiştirir. Ek olarak, FLOP sayısını ve parametre sayılarını azaltmak için hafif sınıflandırma başlıkları kullanan bütünsel bir verimlilik-doğruluk odaklı model tasarımı kullanır.
Güçlü ve Zayıf Yönler
Güçlü Yönler:
- NMS'siz Çıkarım: NMS adımı kaldırılarak model, matris dışı işlemler için sınırlı CPU gücüne sahip donanımlarda faydalı olabilecek son işlemleme gecikmesini azaltır.
- Parametre Verimliliği: Mimari, nispeten daha az parametreyle iyi doğruluk elde ederek hafif olacak şekilde tasarlanmıştır.
Zayıflıklar:
- Sınırlı Çok Yönlülük: YOLOv10 neredeyse tamamen nesne algılama'ya odaklanır. Örnek segmentasyonu veya poz tahmini gibi karmaşık görevler için yerel desteğe sahip değildir ve bu da çok yönlü AI uygulamalarındaki faydasını sınırlar.
- Araştırma Odaklı Destek: Akademik bir proje olduğundan, kurumsal destekli modellerle aynı düzeyde uzun vadeli bakım, güncelleme sıklığı veya dağıtım araçlarıyla entegrasyon sunmayabilir.
İdeal Kullanım Durumu
YOLOv10, NMS adımını ortadan kaldırmanın belirli gömülü donanımlarda katı gecikme bütçelerini karşılamak için kritik olduğu, son derece özel, tek görevli uygulamalar için en uygunudur.
YOLOv10 hakkında daha fazla bilgi edinin
Ultralytics YOLO11: Çok Yönlülük ve Performansın Zirvesi
Ultralytics YOLO11, YOLOv8 ve YOLOv5'in mirası üzerine inşa edilen, vizyon yapay zekasının en son noktasını temsil eder. Sadece bir model olarak değil, gerçek dünya yapay zeka zorlukları için kapsamlı bir çözüm olarak tasarlanmıştır.
- Yazarlar: Glenn Jocher, Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2024-09-27
- GitHub:ultralytics/ultralytics
- Belgeler:YOLO11 Dökümantasyonu
Mimari ve Ekosistem
YOLO11, özellik çıkarma verimliliğini artıran C3k2 ve C2PSA modüllerini içeren geliştirilmiş bir backbone ve neck mimarisiyle anchor-free detect mekanizmasını iyileştirir. Rakiplerinin aksine, YOLO11 bir çoklu görev gücü merkezidir. Tek bir çerçeve detect, segmentasyon, classify, poz tahmini ve Yönlendirilmiş Sınırlandırma Kutuları (obb) için destek sağlar ve geliştiricilerin yapay zeka yığınlarını birleştirmesine olanak tanır.
En önemlisi, YOLO11, Ultralytics Ekosistemi tarafından desteklenmektedir. Bu, veri yönetimi araçlarıyla sorunsuz entegrasyon, model dışa aktarımının ONNX ve TensorRT gibi formatlara kolayca yapılabilmesini ve güçlü topluluk desteğini sağlar.
Temel Avantajlar
- Üstün Performans Dengesi: YOLO11, olağanüstü çıkarım hızlarını korurken sürekli olarak daha yüksek mAP skorları elde eder ve genellikle GPU'lardaki gerçek dünya veriminde NMS'siz alternatiflerden daha iyi performans gösterir.
- Rakipsiz Çok Yönlülük: İster sporda oyuncuları izlemeniz, ister tıbbi görüntüleri segmentlere ayırmanız, ister havadan çekilmiş görüntülerde döndürülmüş nesneleri algılamanız gereksin, YOLO11 tümünü tek bir Python API içinde halleder.
- Kullanım Kolaylığı: Ultralytics arayüzü, basitliğiyle ünlüdür. Son teknoloji bir modeli eğitmek yalnızca birkaç satır kod gerektirir ve bu da gelişmiş yapay zekaya erişimi demokratikleştirir.
- Eğitim Verimliliği: Optimize edilmiş eğitim rutinleri ve yüksek kaliteli önceden eğitilmiş ağırlıklar, daha hızlı yakınsamaya olanak tanıyarak zamandan ve işlem kaynaklarından tasarruf sağlar.
- Daha Düşük Bellek Gereksinimleri: RT-DETR gibi transformatör tabanlı mimarilerle karşılaştırıldığında, YOLO11 eğitim sırasında önemli ölçüde daha bellek verimlidir ve daha geniş bir donanım yelpazesine erişilebilir olmasını sağlar.
Ekosistem Faydası
YOLO11 kullanımı, deney takibi için MLFlow da dahil olmak üzere bir dizi entegrasyona erişim sağlar ve OpenVINOIntel donanımında optimize edilmiş çıkarım için, projenizin prototipten üretime sorunsuz bir şekilde ölçeklenmesini sağlar.
YOLO11 hakkında daha fazla bilgi edinin
Performans Karşılaştırması: Hız, Doğruluk ve Verimlilik
YOLOv10 ve YOLO11'i karşılaştırırken, parametre sayılarını aşmak ve gerçek dünya performans metriklerini incelemek önemlidir. YOLOv10, NMS'yi kaldırarak teorik karmaşıklığı azaltırken, YOLO11, TensorRT ile T4 GPU gibi standart donanım yapılandırmalarında üstün çıkarım hızları sergilemektedir.
Veriler, YOLO11'in çoğu uygulama için daha iyi bir denge sunduğunu ortaya koymaktadır. Örneğin, YOLO11n, YOLOv10n ile aynı doğruluğu (39,5 mAP) elde eder, ancak Ultralytics API'si tarafından desteklenen daha sağlam bir mimari ile. Model boyutu arttıkça, YOLO11'in doğruluktaki avantajları daha belirgin hale gelir ve YOLO11x, 54,7 mAP'ye ulaşarak algılama hassasiyeti için yüksek bir çıta belirler.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Analiz
- Hız: YOLO11, neredeyse tüm model boyutlarında GPU'larda (TensorRT) daha hızlı çıkarım sağlar. Örneğin, YOLO11l, YOLOv10l'nin 8,33 ms'sine kıyasla 6,2 ms'de çalışır ve bu da gerçek zamanlı video analizleri için önemli bir verim avantajı anlamına gelir.
- Doğruluk: YOLO11, mAP'de YOLOv10'u sürekli olarak geride bırakarak daha az yanlış negatif ve daha iyi lokalizasyon sağlıyor; bu da otonom navigasyon veya kusur tespiti gibi güvenlik açısından kritik görevler için çok önemli.
- Hesaplama: YOLOv10 parametreleri en aza indirirken, YOLO11 daha hızlı yürütme süreleri sağlamak için gerçek hesaplama grafiğini optimize eder ve tek başına parametre sayısının hızı belirlemediğini kanıtlar.
Gerçek Dünya Uygulaması ve Kod Örneği
Bir modelin gerçek testi, bir üretim iş akışına ne kadar kolay entegre olduğudur. YOLO11, basit Python arayüzü ile burada öne çıkıyor. Aşağıda, önceden eğitilmiş bir YOLO11 modelinin nasıl yükleneceğine ve bir görüntü üzerinde çıkarım çalıştırmanın nasıl yapılacağına dair bir örnek bulunmaktadır.
from ultralytics import YOLO
# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("path/to/image.jpg")
# Display the results
results[0].show()
Bu basit kod parçacığı, son teknoloji performansa erişim sağlar. Aynı API, özel veri kümelerinde eğitim, model performansını doğrulama veya video akışlarında nesneleri izleme konularına zahmetsizce geçiş yapmanızı sağlar.
Sonuç: Karar
YOLOv10 NMS'siz mimarilere yenilikçi bir bakış sunsa ve akademik araştırma veya yüksek oranda kısıtlanmış uç senaryoları için saygın bir seçim olsa da, Ultralytics YOLO11 geliştiricilerin ve işletmelerin büyük çoğunluğu için üstün bir seçim olarak öne çıkıyor.
YOLO11'in daha yüksek doğruluk, daha hızlı gerçek dünya çıkarım hızı ve rakipsiz çok yönlülük kombinasyonu, onu modern bilgisayar görüşü için kesin çözüm haline getiriyor. Aktif olarak sürdürülen Ultralytics ekosistemi tarafından desteklenen geliştiriciler, yalnızca bir model değil, aynı zamanda yapay zeka yolculuklarında uzun vadeli bir ortak kazanarak uygulamalarının sağlam, ölçeklenebilir ve en son teknoloji olmasını sağlıyor.
Daha fazlasını keşfedenler için, YOLOv9 veya RT-DETR gibi diğer modellerle yapılan karşılaştırmalar, nesne algılamanın gelişen ortamı hakkında ek bağlam sağlayabilir.