Link to this sectionYOLOv9 ve YOLOv10: Gerçek Zamanlı Nesne Algılama Evrimine Teknik Bir Bakış#
Gerçek zamanlı bilgisayarlı görü dünyası, araştırmacıların performans ve verimlilik sınırlarını sürekli zorlamasıyla devasa ilerlemelere sahne oldu. En son teknoloji görü modellerinin evrimini analiz ederken, YOLOv9 ve YOLOv10 iki kritik dönüm noktasını temsil ediyor. 2024 başında yayınlanan her iki model de, bilgi darboğazlarından son işleme gecikmelerine kadar derin sinir ağlarındaki uzun süreli sorunları çözmek için paradigma değiştiren mimari tasarımlar ortaya koydu.
Bu kapsamlı teknik karşılaştırma; mimarilerini, performans metriklerini ve ideal dağıtım senaryolarını inceleyerek modern nesne algılama ekosistemlerinin karmaşıklığında yolunu bulmana yardımcı olur.
Link to this sectionModel Kökenleri ve Mimari Atılımlar#
Bu modellerin kökenlerini ve teorik temellerini anlamak, özel bilgisayarlı görü projen için doğru mimariyi seçmek adına çok önemlidir.
Link to this sectionYOLOv9: Bilgi Akışında Uzmanlık#
21 Şubat 2024'te tanıtılan YOLOv9, veriler derin sinir ağlarından geçerken oluşan teorik bilgi kaybı sorununu ele alıyor.
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kurum: Bilgi Bilimleri Enstitüsü, Academia Sinica, Tayvan
- Referans: YOLOv9 arXiv Makalesi
- Depo: YOLOv9 GitHub
YOLOv9, CSPNet ve ELAN'ın güçlü yanlarını birleştirerek parametre kullanımını en üst düzeye çıkaran Genelleştirilmiş Verimli Katman Birleştirme Ağı'nı (GELAN) tanıtır. Ayrıca, derin katmanların kritik uzamsal bilgileri korumasını sağlayan bir yardımcı denetim mekanizması olan Programlanabilir Gradyan Bilgisi'ni (PGI) kullanır. Bu, YOLOv9'u tıbbi görüntü analizi veya uzak mesafe gözetimi gibi yüksek özellik sadakati gerektiren görevler için son derece güçlü kılar.
YOLOv9 hakkında daha fazla bilgi edin
Link to this sectionYOLOv10: Gerçek Zamanlı Uçtan Uca Verimlilik#
Kısa bir süre sonra 23 Mayıs 2024'te yayınlanan YOLOv10, nesne algılamadaki en kötü şöhretli gecikme darboğazlarından birini, yani NMS'yi (Non-Maximum Suppression) ortadan kaldırarak dağıtım hattını yeniden hayal ediyor.
- Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri.
- Organizasyon: Tsinghua Üniversitesi
- Referans: YOLOv10 arXiv Makalesi
- Depo: YOLOv10 GitHub
YOLOv10, eğitim sırasında tutarlı ikili atamalar kullanarak yerel olarak NMS-free (NMS'siz) bir tasarım sağlar. Bu, çıkarım sırasında işleme sonrası yükünü kaldırarak gecikmeyi ciddi oranda düşürür. Bütünsel bir verimlilik-doğruluk odaklı model tasarımıyla birleştiğinde YOLOv10, hesaplama yükünü (FLOPs) düşürürken rekabetçi hassasiyeti koruyarak olağanüstü bir denge yakalar ve onu uç bilgi işlem uygulamaları için oldukça çekici kılar.
YOLOv10 hakkında daha fazla bilgi edin
Link to this sectionPerformans ve Metrik Karşılaştırması#
Bu iki devi standart MS COCO veri setinde kıyaslarken, saf doğruluk ile çıkarım gecikmesi arasında belirgin ödünleşimler ortaya çıkıyor.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Link to this sectionVerileri Analiz Etme#
- Gecikme ve Doğruluk: YOLOv10 modelleri genellikle daha üstün çıkarım hızları sunar. Örneğin, YOLOv10s, TensorRT üzerinde sadece 2.66ms'de %46.7 mAP değerine ulaşırken, YOLOv9s neredeyse aynı %46.8 mAP için 3.54ms'ye ihtiyaç duyar.
- Üst Düzey Hassasiyet: Maksimum algılama doğruluğu gerektiren araştırma senaryoları için YOLOv9e, %55.6 gibi etkileyici bir mAP değerine ulaşan zorlu bir seçenektir. PGI mimarisi, ince ayrıntıların güvenilir bir şekilde çıkarılmasını sağlar.
- Verimlilik: YOLOv10, FLOPs verimliliği konusunda üstündür. Bu, doğrudan daha düşük güç tüketimine dönüşür ki bu da görü yapay zeka modellerini çalıştıran pilli cihazlar için kritik bir metrik değeridir.
Eğer CPU'lara veya Raspberry Pi gibi kaynak kısıtlı uç donanımlara dağıtım yapıyorsan, YOLOv10'un NMS'siz mimarisi, belirleyici olmayan işleme sonrası adımlarını ortadan kaldırarak genellikle daha akıcı bir süreç sağlayacaktır.
Link to this sectionUltralytics Avantajı: Eğitim ve Ekosistem#
Mimari farklılıklar kritik olsa da, çevredeki yazılım ekosistemi bir projenin başarısını büyük ölçüde belirler. Hem YOLOv9 hem de YOLOv10, Ultralytics ekosistemine tam entegredir ve benzersiz bir geliştirici deneyimi sunar.
Link to this sectionKullanım Kolaylığı ve Bellek Verimliliği#
Büyük bellek şişkinliğinden muzdarip karmaşık transformer tabanlı mimarilerin aksine, Ultralytics YOLO modelleri optimal GPU belleği kullanımı için tasarlanmıştır. Bu, araştırmacıların tüketici sınıfı donanımlarda daha büyük yığın boyutları kullanmasına olanak tanıyarak son teknoloji yapay zekayı erişilebilir kılar.
Birleşik Python API'si, veri artırma ve hiperparametre ayarlama karmaşıklıklarını ortadan kaldırır. Sadece ağırlık dosyası dizgisini değiştirerek mimariler arasında sorunsuzca geçiş yapabilirsin.
from ultralytics import YOLO
# Load a YOLOv10 model (Easily swap to "yolov9c.pt" for YOLOv9)
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Validate the model's performance
metrics = model.val()
# Export the trained model to ONNX format for deployment
model.export(format="onnx")İster metrikleri MLflow ile kaydetmen gerek ister yüksek hızlı donanım dağıtımı için TensorRT ile dışa aktarman, Ultralytics platformu bunu doğal bir şekilde yönetir.
Link to this sectionİdeal Kullanım Senaryoları#
Bu modeller arasında seçim yapmak dağıtım kısıtlamalarına bağlıdır:
- Choose YOLOv9 if: You are working on small object detection tasks, such as aerial drone imagery or detecting small tumors, where the GELAN architecture's feature retention provides the highest fidelity.
- Şu durumda YOLOv10'u seç: Birincil hedefin uç cihazlarda gerçek zamanlı çıkarım yapmaksa. NMS'siz tasarım; otonom robotik, gerçek zamanlı trafik izleme ve akıllı gözetim için mükemmeldir.
Link to this sectionGeleceğe Hazırlık: YOLO26'ya Geçiş#
YOLOv8, YOLOv9 ve YOLOv10 mükemmel modeller olsa da, modern yapay zeka çözümleri oluşturmak isteyen geliştiriciler, Ocak 2026'da yayınlanan Ultralytics YOLO26 seçeneğini değerlendirmelidir.
YOLO26, önceki nesillerin nihai sentezini temsil eder; YOLOv9'un doğruluk ve YOLOv10'un verimlilik gibi en iyi yönlerini birleştirir.
Link to this sectionTemel YOLO26 Yenilikleri#
- Uçtan Uca NMS'siz Tasarım: YOLOv10 tarafından atılan temeller üzerine inşa edilen YOLO26, daha kolay dağıtım için NMS sonrası işlemeyi yerel olarak ortadan kaldırır.
- MuSGD Optimize Edici: SGD ve Muon'un bir hibriti olup, inanılmaz derecede kararlı ve hızlı yakınsama için gelişmiş LLM eğitim yeniliklerini bilgisayarlı görüye getirir.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Özellikle uç bilgi işlem ve özel GPU'ları olmayan cihazlar için optimize edilmiştir.
- DFL Kaldırma: Model dışa aktarmayı basitleştirmek ve düşük güçlü cihaz uyumluluğunu artırmak için Distribution Focal Loss kaldırılmıştır.
- ProgLoss + STAL: Bu geliştirilmiş kayıp fonksiyonları, küçük nesne tanımasında kayda değer iyileştirmeler getirerek YOLOv9'un yeteneklerini eşleştirir veya geçer.
Eski mimarileri değerlendiren araştırmacılar için RT-DETR ve YOLO11 de Ultralytics ekosisteminde iyi belgelenmiş alternatiflerdir. Ancak tüm görü görevlerinde maksimum çok yönlülük için Ultralytics Platformu üzerinde YOLO26'ya geçiş yapmak, açık kaynaklı görü yapay zekasının zirvesinden yararlandığından emin olmanı sağlar.