YOLO11 ile YOLOv9: Kapsamlı Bir Teknik Karşılaştırma
Bilgisayarlı görü dünyası sürekli gelişiyor ve yeni mimariler, gerçek zamanlı nesne tespitinde nelerin mümkün olduğunun sınırlarını zorluyor. Bu yolculuktaki iki önemli dönüm noktası Ultralytics YOLO11 ve YOLOv9'dur. Her iki model de olağanüstü performans sunsa da, derin öğrenme çıkarımı ve eğitimiyle ilgili temel zorlukları çözmeye yönelik farklı yaklaşımları temsil ederler.
Bu rehber, bir sonraki yapay zeka projeniz için doğru modeli seçmenize yardımcı olmak amacıyla YOLO11 ve YOLOv9 arasında kapsamlı bir teknik karşılaştırma sunmakta; mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını analiz etmektedir.
Model Genel Bakışı
Ultralytics YOLO11
YOLO11, üretime hazır ortamlar için tasarlanmış, yüksek oranda optimize edilmiş ve çok yönlü bir modeldir. En son teknoloji doğruluğu ile uç bilişim ve geniş ölçekli dağıtımın pratik gereksinimlerini dengeler.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş: Ultralytics
- Tarih: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Dokümanlar: https://docs.ultralytics.com/models/yolo11/
YOLO11 hakkında daha fazla bilgi edin
YOLOv9
YOLOv9, derin sinir ağlarında bilgi kaybını azaltmak için özgün kavramlar getiren ve özellik çıkarımındaki teorik ilerlemelere yoğun bir şekilde odaklanan güçlü bir akademik katkıdır.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Organizasyon: Institute of Information Science, Academia Sinica, Tayvan
- Tarih: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Dokümanlar: https://docs.ultralytics.com/models/yolov9/
YOLOv9 hakkında daha fazla bilgi edin
Mimari Yenilikler
YOLOv9: Programlanabilir Gradyan Bilgisi
YOLOv9, verilerin derin bir ağın ardışık katmanlarından geçerken kaybolduğu "bilgi darboğazı" sorununu ele alır. Bunu çözmek için yazarlar, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) kavramlarını tanıttılar. PGI, geri yayılım sırasında ağırlıkları güncellemek için kullanılan gradyanların tam bilgi içermesini sağlayarak oldukça doğru özellik temsilleri elde edilmesini sağlar. GELAN mimarisi, parametre verimliliğini maksimize ederek YOLOv9'un nispeten hafif bir yapıyla yüksek doğruluk elde etmesine olanak tanır.
YOLO11: Ekosistem ve Verimlilik
YOLOv9 gradyan akışına odaklanırken, YOLO11 gerçek dünya sağlamlığı ve çok yönlülüğü için tasarlanmıştır. Temel YOLO mimarisini, eğitim sırasında CUDA bellek gereksinimlerini Transformer ağırlıklı alternatiflere kıyasla önemli ölçüde azaltacak şekilde geliştirir. Ayrıca YOLO11 sadece bir nesne tespit edicisi değildir; örnek bölümleme, görüntü sınıflandırma, poz tahmini ve yönlendirilmiş sınırlayıcı kutuları (OBB) yerel olarak destekler.
YOLO11'in en büyük güçlerinden biri, veri yükleme, artırma ve dağıtık eğitim karmaşıklıklarını birleşik bir API içinde soyutlayan Ultralytics Platform entegrasyonudur.
Performans Karşılaştırması
Üretim için bir model seçerken, ortalama Hassasiyet (mAP), çıkarım hızı ve parametre sayısı arasındaki dengenin değerlendirilmesi kritiktir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Tabloda görüldüğü gibi, YOLOv9e en yüksek genel doğruluğu elde eder, bu da onu akademik kıyaslamalar için mükemmel kılar. Ancak YOLO11, genel olarak üstün bir hız-doğruluk oranı sağlar. Örneğin YOLO11m, 4.7 ms'de (TensorRT) 51.5 mAP elde ederek benzer boyuttaki YOLOv9m'i hız konusunda geride bırakır.
Eğitim Metodolojileri ve Ekosistem
Geliştirici deneyimi iki çerçeve arasında önemli ölçüde farklılık gösterir.
YOLOv9 Eğitimi
YOLOv9 eğitimi genellikle yoğun şekilde özelleştirilmiş araştırma kodlarıyla etkileşim kurmayı, belirli bağımlılık sürümlerini yönetmeyi ve karmaşık komut satırı argümanlarını kullanmayı gerektirir. Güçlü olsa da, hızlı tempolu kurumsal ortamlar için göz korkutucu olabilir.
YOLO11 Eğitimi
YOLO11, iyi bakımı yapılan Ultralytics Python API'sinden yararlanarak sorunsuz bir "sıfırdan uzmanlığa" deneyimi sunar. Verimli eğitim süreçleri, kolayca erişilebilen önceden eğitilmiş ağırlıklar ve mükemmel topluluk desteği ile desteklenir.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")Sadece üç satır Python koduyla geliştiriciler bir modeli yükleyebilir, optimize edilmiş varsayılan hiperparametrelerle eğitimi başlatabilir ve eğitilen mimariyi uç cihazda dağıtım için ONNX veya TensorRT gibi çerçevelere aktarabilir.
Gerçek Dünya Uygulamaları
Ne Zaman YOLOv9 Seçilmeli
YOLOv9, derin öğrenme mimarilerini keşfetmek isteyen araştırmacılar için harika bir tercihtir. PGI çerçevesi, yoğun veri kümelerinde aşırı doğruluğun gerektiği ve dağıtım karmaşıklığının algoritmik performansın ikincil olduğu yüksek hızlı perakende analitiği için onu ideal bir aday haline getirir.
Ne Zaman YOLO11 Seçilmeli
YOLO11 üretim için en iyi araçtır. Kolaylaştırılmış nesne tespiti yetenekleri, onu akıllı şehir trafik yönetimi ve Raspberry Pi veya NVIDIA Jetson gibi uç cihazlar için mükemmel kılar. Ayrıca, çeşitli görevlerdeki çok yönlülüğü, tek bir geliştirme hattının üretimde segmentasyon ve spor analitiğinde poz tahmini süreçlerini yönetebileceği anlamına gelir.
En İleri Nokta: YOLO26 ile Tanışın
YOLO11 ve YOLOv9 dikkat çekici olsa da, yapay zeka alanı hızla gelişiyor. Ultralytics, bugün yeni projelere başlayan geliştiriciler için bilgisayarlı görünün sınırlarını daha da zorlayan (Ocak 2026'da yayınlanan) YOLO26 modelini şiddetle önermektedir.
YOLO26, en son yeniliklerin en iyilerini üretime hazır bir güç merkezinde birleştirir:
- Uçtan Uca NMS-Free Tasarım: YOLO26, Maksimum Olmayan Baskılama (NMS) son işlem adımını yerel olarak ortadan kaldırarak çok daha basit ve hızlı dağıtım hatları sağlar.
- DFL Kaldırma: Distribution Focal Loss'un kaldırılması, düşük güçlü mikro denetleyiciler ve uç yapay zeka hızlandırıcıları ile daha iyi uyumluluk sağlar.
- MuSGD Optimize Edici: LLM eğitim yeniliklerinden esinlenen MuSGD optimize edici (SGD ve Muon'un bir hibriti), kararlı bir eğitim ve daha hızlı yakınsama sunar.
- %43'e Varan Daha Hızlı CPU Çıkarımı: Özel GPU'ları olmayan uç bilişim cihazları için özel olarak optimize edilmiştir.
- ProgLoss + STAL: Bu geliştirilmiş kayıp fonksiyonları, tarımsal izleme ve hava görüntüleri için kritik öneme sahip olan küçük nesne tanımayı önemli ölçüde artırır.
Çeşitli mimarileri keşfetmek isteyen kullanıcılar, Transformer tabanlı takip için RT-DETR veya sıfır örnekli (zero-shot) açık sözcük dağarcığı tespiti için YOLO-World modellerine de göz atabilirler.
Sonuç
Hem YOLO11 hem de YOLOv9, bilgisayarlı görü tarihindeki yerlerini sağlamlaştırmıştır. YOLOv9, maksimum özellik tutma için parlak mimari yenilikler sunar. Ancak kurumsal yapay zeka uygulamalarından mobil uç cihazlara kadar gerçek dünyadaki uygulamaların büyük çoğunluğu için, YOLO11'in kullanım kolaylığı, bellek verimliliği ve çok yönlü görev desteği rakipsiz bir avantaj sağlar. Endüstri ilerledikçe, daha yeni olan YOLO26 modelini benimsemek, sistemlerinizin bugün mevcut olan en hızlı ve en güvenilir çıkarımı çalıştırmasını garanti eder.