YOLO11 ile YOLOv9: Kapsamlı Bir Teknik Karşılaştırma
Bilgisayar görüşü alanı sürekli gelişmekte olup, yeni mimariler gerçek zamanlı nesne algılamada mümkün olanın sınırlarını zorlamaktadır. Bu yolculuktaki iki önemli kilometre taşı Ultralytics YOLO11 ve YOLOv9'dur. Her iki model de olağanüstü performans sunarken, derin öğrenme çıkarımı ve eğitiminin temel zorluklarını çözmek için farklı yaklaşımları temsil ederler.
Bu kılavuz, bir sonraki yapay zeka projeniz için doğru modeli seçmenize yardımcı olmak amacıyla YOLO11 ve YOLOv9 arasındaki mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını analiz eden kapsamlı bir teknik karşılaştırma sunar.
Modele Genel Bakış
Ultralytics YOLO11
YOLO11, üretim sınıfı ortamlar için tasarlanmış, yüksek düzeyde optimize edilmiş, çok yönlü bir modeldir. En son doğruluğu, uç bilişim ve büyük ölçekli dağıtımın pratik gereksinimleriyle dengeler.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Belgeler:https://docs.ultralytics.com/models/YOLO11/
YOLO11 hakkında daha fazla bilgi edinin
YOLOv9
YOLOv9, derin sinir ağlarındaki bilgi kaybını azaltmak için yeni kavramlar sunan, özellik çıkarımındaki teorik gelişmelere yoğunlaşan güçlü bir akademik katkıdır.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
- Belgeler:https://docs.ultralytics.com/models/yolov9/
YOLOv9 hakkında daha fazla bilgi edinin.
Mimari Yenilikler
YOLOv9: Programlanabilir Gradyan Bilgisi
YOLOv9, verilerin derin bir ağın ardışık katmanlarından geçerken kaybolduğu "bilgi darboğazı" sorununu ele alır. Bunu çözmek için yazarlar, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) kavramlarını tanıttılar. PGI, geri yayılım sırasında ağırlıkları güncellemek için kullanılan gradyanların eksiksiz bilgi içermesini sağlayarak yüksek doğrulukta özellik temsilleri elde edilmesini sağlar. GELAN mimarisi, parametre verimliliğini en üst düzeye çıkararak YOLOv9'un nispeten hafif bir yapıyla yüksek doğruluk elde etmesine olanak tanır.
YOLO11: Ekosistem ve Verimlilik
YOLOv9 gradyan akışına odaklanırken, YOLO11 gerçek dünya sağlamlığı ve çok yönlülüğü için tasarlanmıştır. Temel YOLO mimarisini, transformatör ağırlıklı alternatiflere kıyasla eğitim sırasında CUDA bellek gereksinimlerini önemli ölçüde azaltacak şekilde iyileştirir. Ayrıca, YOLO11 sadece bir nesne algılayıcı değildir; doğal olarak örnek segmentasyonunu, görüntü sınıflandırmasını, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) destekler.
Kolaylaştırılmış Geliştirme
YOLO11'in en büyük güçlerinden biri, veri yükleme, artırma ve dağıtılmış eğitimin karmaşıklıklarını birleşik bir API'ye soyutlayan Ultralytics Platformu ile entegrasyonudur.
Performans Karşılaştırması
Üretim için bir model seçerken, ortalama Hassasiyet (mAP), çıkarım hızı ve parametre sayısı arasındaki dengeyi değerlendirmek kritik öneme sahiptir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Tabloda görüldüğü gibi, YOLOv9e en yüksek genel doğruluğu elde ederek akademik kıyaslama için mükemmeldir. Ancak, YOLO11 genel olarak üstün bir hız-doğruluk oranı sunar. Örneğin, YOLO11m, 4.7 ms'de (TensorRT) 51.5 mAP elde ederek benzer boyuttaki YOLOv9m'yi hız açısından geride bırakır.
Eğitim Metodolojileri ve Ekosistem
Geliştirici deneyimi, iki çerçeve arasında önemli ölçüde farklılık gösterir.
YOLOv9 Eğitimi
YOLOv9 eğitimi genellikle yoğun şekilde özelleştirilmiş araştırma koduyla etkileşim kurmayı, belirli bağımlılık sürümlerini yönetmeyi ve karmaşık komut satırı argümanlarını kullanmayı gerektirir. Güçlü olsa da, hızlı tempolu kurumsal ortamlar için göz korkutucu olabilir.
YOLO11 Eğitimi
YOLO11, iyi bakımı yapılmış Ultralytics Python API'sinden yararlanarak sorunsuz bir "sıfırdan kahramana" deneyimi sunar. Verimli eğitim süreçleri, hazır önceden eğitilmiş ağırlıklar ve mükemmel topluluk desteği ile desteklenir.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")
Yalnızca üç satır Python koduyla geliştiriciler bir modeli yükleyebilir, optimize edilmiş hiperparametre varsayılanlarıyla eğitimi başlatabilir ve eğitilmiş mimariyi uç dağıtım için ONNX veya TensorRT gibi çerçevelere aktarabilir.
Gerçek Dünya Uygulamaları
YOLOv9 Ne Zaman Tercih Edilmeli?
YOLOv9, derin öğrenme mimarilerini keşfetmek isteyen araştırmacılar için harika bir seçimdir. PGI çerçevesi, yoğun veri kümelerinde aşırı doğruluk gerektiren ve dağıtım karmaşıklığının algoritmik performanstan sonra geldiği yüksek hızlı perakende analitiği için ideal bir aday olmasını sağlar.
Ne Zaman YOLO11 Seçmeli
YOLO11, üretim için nihai araçtır. Akıcı nesne algılama yetenekleri, onu akıllı şehir trafik yönetimi ve Raspberry Pi veya NVIDIA Jetson gibi uç cihazlar için mükemmel kılar. Ayrıca, çeşitli görevlerdeki çok yönlülüğü, tek bir geliştirme hattının üretimde segmentasyon ve spor analitiğinde poz tahmini gibi işlemleri halledebileceği anlamına gelir.
En Son Teknoloji: YOLO26 Sahneye Çıkıyor
YOLO11 ve YOLOv9 dikkat çekici olsa da, yapay zeka alanı hızla gelişmektedir. Bugün yeni projelere başlayan geliştiriciler için Ultralytics, bilgisayar görüşünün sınırlarını daha da zorlayan YOLO26'yı (Ocak 2026'da piyasaya sürüldü) şiddetle tavsiye etmektedir.
YOLO26, son yeniliklerin en iyilerini üretim ortamına hazır bir güç merkezinde birleştiriyor:
- Uçtan Uca NMS'siz Tasarım: YOLO26, Maksimum Olmayan Bastırma (NMS) işlem sonrasını doğal olarak ortadan kaldırarak çok daha basit ve hızlı dağıtım hatları sağlar.
- DFL Kaldırma: Dağıtım Odaklı Kaybın (Distribution Focal Loss) kaldırılması, düşük güçlü mikrodenetleyiciler ve uç yapay zeka hızlandırıcıları ile daha iyi uyumluluk sağlar.
- MuSGD Optimizatörü: LLM eğitim yeniliklerinden ilham alan MuSGD optimizatörü (SGD ve Muon'un bir hibriti), istikrarlı eğitim ve daha hızlı yakınsama sunar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Özel GPU'ları olmayan uç bilişim cihazları için özel olarak optimize edilmiştir.
- ProgLoss + STAL: Bu geliştirilmiş kayıp fonksiyonları, tarımsal izleme ve hava görüntüleri için kritik olan küçük nesne tanımayı önemli ölçüde geliştirir.
Farklı mimarileri keşfetmek isteyen kullanıcılar, transformatör tabanlı takip için RT-DETR'e veya sıfır atışlı açık kelime dağarcığı algılama için YOLO-World'e de göz atmak isteyebilirler.
Sonuç
Hem YOLO11 hem de YOLOv9, bilgisayar görüşü tarihinde yerlerini sağlamlaştırmıştır. YOLOv9, maksimum özellik tutma için parlak mimari yenilikler sunar. Ancak, kurumsal yapay zeka uygulamalarından mobil uç cihazlara kadar gerçek dünya dağıtımlarının büyük çoğunluğu için YOLO11'in kullanım kolaylığı, bellek verimliliği ve çok yönlü görev desteği rakipsiz bir avantaj sağlar. Sektör ilerledikçe, daha yeni YOLO26'yı benimsemek, sistemlerinizin bugün mevcut olan en hızlı ve en güvenilir çıkarımı çalıştırdığını garanti eder.