YOLOv9 ve YOLO11: Modern Nesne Algılamaya Teknik Bir Derin Dalış
Bilgisayar görüşünün hızlı evrimi, gerçek zamanlı nesne algılamada mümkün olanın sınırlarını sürekli olarak zorlamıştır. Önde gelen mimarileri karşılaştırdığımızda, YOLOv9 ve Ultralytics YOLO11, her biri farklı teknik ihtiyaçlara hizmet eden, anıtsal ilerlemeler olarak öne çıkmaktadır. YOLOv9, derin ağ eğitimi sırasında gradyan akışını korumak için yeni yollar sunarken, YOLO11 eşsiz verimlilik, çok yönlülük ve kullanım kolaylığı ile genel amaçlı görüş ekosisteminde devrim yaratmıştır.
Bu kapsamlı teknik karşılaştırma, bir sonraki yapay zeka projeniz için en uygun modeli seçmenize yardımcı olmak amacıyla mimarilerini, performans metriklerini, bellek gereksinimlerini ve ideal dağıtım senaryolarını analiz etmektedir.
Projenizi YOLO26 ile Geleceğe Hazırlayın
YOLOv9 ve YOLO11 mükemmel modeller olsa da, yeni piyasaya sürülen YOLO26 bir sonraki büyük adımı temsil etmektedir. Basitleştirilmiş dağıtım için uçtan uca NMS-free tasarıma, %43'e kadar daha hızlı CPU çıkarımına ve hızlı yakınsama için yenilikçi MuSGD optimize edicisine sahiptir. Tüm yeni üretim projeleri için YOLO26 şiddetle tavsiye edilir.
Teknik Özellikler ve Yazarlık
Bu modellerin soy ağacını anlamak, mimari kararları ve çerçeve bağımlılıkları için temel bir bağlam sağlar.
YOLOv9
YOLOv9, derin öğrenme bilgi darboğazlarına güçlü bir akademik odaklanma getirerek, özel ağ blokları aracılığıyla maksimum özellik doğruluğunu yüksek oranda önceliklendirdi.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica
- Tarih: 21 Şubat 2024
- Arxiv:https://arxiv.org/abs/2402.13616
- GitHub:https://github.com/WongKinYiu/yolov9
YOLOv9 hakkında daha fazla bilgi edinin.
Ultralytics YOLO11
YOLO11, üretim ortamları için sıfırdan tasarlanmış olup, üst düzey doğruluk, gerçek dünya dağıtım hızları ve çok görevli çok yönlülük dengesine odaklanmıştır.
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 27 Eylül 2024
- GitHub:https://github.com/ultralytics/ultralytics
YOLO11 hakkında daha fazla bilgi edinin
Mimari Yenilikler
YOLOv9'da Programlanabilir Gradyan Bilgisi
YOLOv9, Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) ile birlikte Programlanabilir Gradyan Bilgisi (PGI) kavramını sunar. Sinir ağları derinleştikçe, genellikle ileri besleme süreci sırasında kritik detayların kaybolduğu bilgi darboğazlarından muzdariptirler. PGI, ince taneli uzamsal bilgiyi koruyan güvenilir gradyan güncellemeleri sağlayarak bu sorunu çözerken, GELAN parametre verimliliğini en üst düzeye çıkarır. Bu durum, YOLOv9'u yüksek özellik doğruluğu gerektiren görevlerde özellikle yetenekli kılar, ancak işlem sonrası aşamada kenar cihazlarda gecikmeye neden olabilecek standart Non-Maximum Suppression (NMS) yöntemine dayanır.
YOLO11'de Akıcı Verimlilik
YOLO11, yıllarca süren temel araştırmalar üzerine inşa edilerek yüksek düzeyde optimize edilmiş bir mimari sunar. Hesaplama yükünü azaltırken özellik çıkarımını en üst düzeye çıkararak önceki iterasyonları geliştirir. CPU performansını darboğaza sokan geleneksel NMS hatlarının aksine, YOLO11 gecikme ve hassasiyet arasında inanılmaz bir denge sağlayan rafine algılama başlıkları kullanır. Ayrıca, YOLO11 hem model eğitimi hem de çıkarım sırasında, genellikle daha yavaş eğitilen ve büyük miktarda CUDA belleği gerektiren ağır Transformer modellerine kıyasla doğal olarak daha düşük bellek kullanımına sahiptir.
Performans Metrikleri Karşılaştırması
Bu modelleri standart COCO veri kümesi üzerinde karşılaştırdığımızda, her ikisi de inanılmaz yetenekler sergiler, ancak ham parametre sayısı ile operasyonel hız arasında ödünleşimler ortaya çıkar.
Aşağıda YOLO Performans Metrikleri'nin detaylı bir dökümü bulunmaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Sonuçların Analizi
- Hız ve Donanım Verimliliği: YOLO11, çıkarım hızında YOLOv9'u sürekli olarak geride bırakır. Örneğin, YOLO11n, bir NVIDIA T4 GPU üzerinde TensorRT kullanarak şaşırtıcı bir 1.5 ms'ye ulaşır, bu da onu katı gerçek zamanlı işlem hatları için inanılmaz derecede uygun hale getirir.
- Hesaplama Gereksinimleri: YOLO11 modelleri genellikle daha az FLOP gerektirir (örn. YOLO11m için 68.0B'ye karşılık YOLOv9m için 76.3B), bu da Raspberry Pi veya mobil donanım gibi pille çalışan uç cihazlarda daha düşük güç tüketimi anlamına gelir.
- Doğruluk Eşitliği: YOLOv9e, mutlak mAP'de (55.6'ya karşı 54.7) YOLO11x'i hafifçe geride bırakırken, YOLO11 önemli ölçüde daha az gecikmeyle (11.3ms'ye karşı 16.77ms) en yüksek doğruluğuna ulaşır ve gerçek dünya dağıtımları için daha avantajlı bir performans dengesi sergiler.
Ekosistem ve Kullanım Kolaylığı
Ham metrikler önemli olsa da, çerçeve ekosistemi genellikle proje başarısını belirler. Ultralytics Avantajı'nın gerçekten parladığı yer burasıdır.
Orijinal YOLOv9 deposu, son teknoloji araştırma uygulamaları sunan oldukça özelleşmiş bir yapıdadır. Ancak, Ultralytics Platformu ve ilgili açık kaynak paketi, pazara sunma süresini önemli ölçüde azaltan kolaylaştırılmış bir kullanıcı deneyimi, basit bir API ve kapsamlı belgeler sunar.
Çoklu Görev Çok Yönlülüğü
YOLOv9 ağırlıklı olarak sınırlayıcı kutu detect'ine odaklanır. Buna karşılık, YOLO11 yerel olarak şunları destekleyen birleşik bir çok görevli güç merkezidir:
Sorunsuz Dağıtım
Ultralytics ekosistemini kullanmak, geliştiricilerin tek bir Python kodu satırıyla modelleri sorunsuz bir şekilde çeşitli formatlara dışa aktarmasına olanak tanır. ONNX, OpenVINO, TFLite veya CoreML'i hedeflesin, eğitimden üretime geçiş zahmetsizdir.
from ultralytics import YOLO
# Load a highly efficient YOLO11 model
model = YOLO("yolo11n.pt")
# Train rapidly on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to OpenVINO for Intel CPU acceleration
model.export(format="openvino")
İdeal Kullanım Senaryoları
YOLOv9 Ne Zaman Kullanılmalı
YOLOv9, donanım gecikmesinin birincil kısıtlama olmadığı, araştırma odaklı ortamlar veya aşırı özellik doğruluğunu önceliklendiren senaryolar için harika bir araçtır. GELAN mimarisi, en küçük piksel varyasyonlarını detect etmenin kritik olduğu tıbbi görüntüleme analizinde oldukça avantajlı olabilir.
Neden YOLO11 Üstün Bir Seçimdir
Geliştiriciler, mühendisler ve üretim ekipleri için YOLO11 şiddetle tavsiye edilir. Yüksek hızlı, ölçeklenebilir dağıtım gerektiren ortamlarda üstündür:
- Akıllı Perakende Analitiği: Standart Intel standart işlemciler kullanarak ürünleri ve müşterileri sorunsuz bir şekilde track etme.
- Otonom Dronlar: Düşük FLOP mimarilerinin pil ömrünü korurken hala sağlam küçük nesne detect'i sağladığı yerler.
- Dinamik Projeler: detect olarak başlayıp daha sonra poz tahmini veya segment gerektirecek şekilde gelişebilecek iş akışları.
İleriye Bakış: Bir Sonraki Evrim
YOLO11, kendi nesli için en son teknolojiyi temsil etse de, bilgisayar görüşü alanı ilerlemeye devam ediyor. Yapay zekanın sınırlarını keşfeden kullanıcılar ayrıca YOLO26'ya da bakmalıdır.
YOLOv10'da ilk kez keşfedilen uçtan uca NMS-free bir tasarıma öncülük eden YOLO26, eşi benzeri görülmemiş eğitim kararlılığı için MuSGD optimize ediciyi (SGD ve Muon'un bir hibriti) sunar. Dışa aktarımı basitleştirmek için Dağıtım Odaklı Kaybın (DFL) kaldırılması ve ProgLoss ve STAL gibi gelişmiş kayıp mekanizmaları ile YOLO26, %43'e kadar daha hızlı CPU çıkarımı sağlar. Modern projeler için, akademik yenilik ve üretime hazır güvenilirliğin nihai kombinasyonunu sunar. Ayrıca, Ultralytics YOLOv8 gibi eski sistemlerden yükseltme yapan ekipler, birleşik Ultralytics API sayesinde YOLO26 veya YOLO11'e geçişi tamamen sorunsuz bulacaktır.