YOLO11 YOLOv9: Mimari ve Performansa Derinlemesine Bakış
Doğru nesne algılama modelini seçmek, bilgisayar görme uygulamalarınızın hızını, doğruluğunu ve ölçeklenebilirliğini etkileyen kritik bir karardır. Bu kılavuz, aşağıdakiler arasında kapsamlı bir teknik karşılaştırma sunar YOLO11, Ultralytics'in güçlü yinelemesi ve YOLOv9arasında kapsamlı bir teknik karşılaştırma sunar.
Her iki model de görme modellerinin tarihinde önemli bir ilerlemeyi temsil etmekle birlikte, yapay zeka geliştirme alanında biraz farklı ihtiyaçları karşılıyor.
Modele Genel Bakış
YOLO11
YOLO11 , sağlam Ultralytics temel alarak hesaplama verimliliği ve algılama doğruluğu arasındaki dengeyi iyileştirir. Modern MLOps iş akışlarıyla sorunsuz bir şekilde entegre olan, çok yönlü ve üretime hazır bir model olarak tasarlanmıştır.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: Eylül 2024
- Odak noktası: Gerçek zamanlı hız, kullanım kolaylığı, geniş görev desteği (Algılama, Segmentleme, Sınıflandırma, Poz, OBB).
YOLO11 hakkında daha fazla bilgi edinin
YOLOv9
YOLOv9 derin ağlardaki bilgi kaybını ele almak için GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı) ve PGI gibi yeni kavramlar getirmiştir. Akademik benchmarklarda yüksek doğruluk elde etmesine rağmen, genellikle eğitim için daha fazla hesaplama kaynağı gerektirir.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: Şubat 2024
- Odak noktası: Derin CNN'lerde parametre verimliliğini en üst düzeye çıkarmak ve bilgi darboğazını azaltmak.
YOLOv9 hakkında daha fazla bilgi edinin.
Performans Analizi
Bu modelleri değerlendirirken, gecikme (hız) ve mAP (doğruluk) arasındaki denge çok önemlidir. Ultralytics , YOLO11 hem uç cihazlarda hem de GPU'larda üstün verim sağlamak YOLO11 optimize etmiştir.
Önemli Metriklerin Karşılaştırması
Aşağıdaki tablo, COCO indeki performans farklılıklarını göstermektedir. YOLO11 , gerçek zamanlı çıkarım uygulamaları için kritik bir faktör olan önemli ölçüde daha düşük gecikme süresiyle benzer veya daha iyi doğruluk YOLO11 dikkat edin.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Verileri Yorumlama
YOLOv9e, doğruluğun üst sınırlarını zorlarken (55,6% mAP), bunu hız açısından önemli bir maliyetle yapmaktadır (16,77 ms'ye karşı YOLO11x için 11,3 ms). Çoğu ticari uygulama için, YOLO11 ailesi, yüksek fps video akışlarını işleyebilecek hızlarda yüksek doğruluk sunarak daha pratik bir "ideal nokta" sunar.
Mimari Farklılıklar
Temel fark, tasarım felsefelerinde yatmaktadır. YOLOv9 , gradyan akışında derin teorik iyileştirmelere YOLOv9 , YOLO11 ise dağıtım ve çok yönlülük için pratik mühendisliğe YOLO11 .
YOLOv9: PGI ve GELAN
YOLOv9 , veriler derin katmanlardan geçerken anlamsal bilgilerin kaybolmasını önlemek için Programlanabilir Gradyan Bilgisi (PGI) YOLOv9 . Temel olarak, eğitim sırasında yardımcı bir denetim dalı sağlar ve bu dal, çıkarım sırasında kaldırılır. GELAN mimarisiyle birleştirildiğinde, modelin hafif ancak doğru olmasını sağlar. Bu, sinir mimarisi araştırması ve gradyan akışı üzerinde çalışanlar için onu ilgi çekici bir konu haline getirir.
YOLO11: Rafine C3k2 ve C2PSA
YOLO11 , önceki sürümlerde kullanılan CSP darboğazının geliştirilmiş bir versiyonu olan ve GPU için optimize edilmiş C3k2 bloğunuYOLO11 . Ayrıca, karmaşık sahnelerde kritik özelliklere odaklanma yeteneğini artıran C2PSA (Cross-Stage Partial with Spatial Attention) özelliğini de içerir. Bu mimari, özellik çıkarma yeteneklerinden ödün vermeden FLOP'ları azaltmak için özel olarak ayarlanmıştır ve yukarıda görülen etkileyici hız ölçümlerini sağlar.
Eğitim Verimliliği ve Ekosistem
Ultralytics seçmenin en önemli avantajlarından biri, onu çevreleyen ekosistemdir.
Kullanım Kolaylığı ve Belgeleme
YOLO11 eğitimi minimum düzeyde standart kod YOLO11 . Ultralytics Python , süreci standartlaştırarak yeni başlayanlar için bile erişilebilir hale getirir. Buna karşılık, YOLOv9 de, yerel uygulaması daha karmaşık yapılandırma dosyaları ve manuel kurulum gerektirebilir.
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Train on COCO8 with just one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Bellek Gereksinimleri
Ultralytics , bellek verimliliği ile ünlüdür. YOLO11 , sınırlı CUDA sahip tüketici sınıfı donanımlarda eğitim için optimize edilmiştir. Bu, geri yayılım adımları sırasında bellek şişkinliği sorunu yaşayan birçok dönüştürücü tabanlı model veya eski mimarilere göre belirgin bir avantajdır.
Görevler Arası Çok Yönlülük
YOLOv9 esas olarak bir nesne algılayıcı YOLOv9 da, YOLO11 çok görevli bir güç merkezidir. Aynı çerçeve içinde, aşağıdakiler arasında sorunsuz bir şekilde geçiş yapabilirsiniz:
- Nesne Algılama
- Örnek Segmentasyonu
- Poz Tahmini
- Görüntü Sınıflandırması
- Yönlendirilmiş Sınırlayıcı Kutu (OBB)
Görme Yapay Zekasının Geleceği: YOLO26
En son teknolojiyi arayan geliştiriciler için Ultralytics , YOLO26'yı piyas Ultralytics . Bu model, YOLO11 YOLOv10 alınan dersleri bir araya getiren yeni nesil görsel yapay zeka teknolojisini temsil ediyor.
YOLO26, doğal olarak uçtan uca NMS bir tasarıma sahiptir ve Non-Maximum Suppression son işlemine gerek kalmaz. Bu da daha hızlı çıkarım ve daha basit dağıtım süreçleri sağlar. Ayrıca, SGD Muon'un bir karışımı olan MuSGD optimizer'ı kullanır ve Large Language Model (LLM) eğitimindekine benzer istikrarlı bir eğitim dinamiği sağlar. ProgLoss + STAL gibi optimize edilmiş kayıp fonksiyonları ile YOLO26, küçük nesne algılamada mükemmeldir ve bu da onu 2026 ve sonrası için en iyi seçim haline getirir.
YOLO26 hakkında daha fazla bilgi edinin
İdeal Kullanım Senaryoları
YOLOv9 Ne Zaman Tercih Edilmeli?
- Akademik Araştırma: CNN bilgi saklama ve gradyan programlamanın teorik sınırlarını incelemek için mükemmeldir.
- Statik Görüntü Analizi: Tıbbi görüntüleme (örneğin, tümörlerin tespiti) gibi, tek bir kareden maksimum ayrıntı elde etmek için çıkarım hızının ikincil öneme sahip olduğu senaryolarda.
Ne Zaman YOLO11 Seçmeli
- Edge AI Dağıtımı: TensorRT TFLite gibi dışa aktarım formatlarının TFLite Raspberry Pi veya NVIDIA gibi cihazlar için idealdir.
- Ticari Üretim: Güvenilirlik, hız ve desteğin kritik öneme sahip olduğu perakende analitiği, akıllı şehir izleme veya üretim kalite kontrolü için.
- Karmaşık Boru Hatları: Uygulamanız, tek bir birleşik API kullanarak birden fazla görme görevini (örneğin, bir kişiyi algılama ve ardından pozunu tahmin etme) gerektirdiğinde.
Sonuç
Hem YOLO11 YOLOv9 , bilgisayar görme mühendislerinin cephaneliğinde olağanüstü YOLOv9 . Ancak, çoğu gerçek dünya uygulaması için YOLO11 (ve daha yeni olan YOLO26) hız, doğruluk ve geliştirici deneyimi arasında üstün bir denge sunar. Aktif Ultralytics ve sık güncellemelerle desteklenen bu araç, projelerinizin geleceğe dönük ve verimli kalmasını sağlar.
Daha fazla araştırma yapmak için, bu modelleri aşağıdakilerle karşılaştırmak da ilginizi çekebilir RT-DETR ile karşılaştırmak veya hafif YOLOv10 mimarisini keşfetmek ilginizi çekebilir.