YOLOv9 ve YOLO26: Modern Nesne Detect'ine Teknik Bir Derin Dalış
Gerçek zamanlı nesne detect'i alanı son birkaç yılda önemli ölçüde gelişti. Makine öğrenimi uzmanları modelleri çeşitli donanımlara dağıtmayı hedeflerken, doğru mimariyi seçmek kritik öneme sahiptir. Bu kapsamlı teknik kılavuzda, bilgisayar görüşü alanındaki iki önemli kilometre taşını karşılaştırıyoruz: 2024 başında gradyan yolu optimizasyonlarına odaklanarak tanıtılan YOLOv9 ve 2026 başında piyasaya sürülen, uç çıkarım ve eğitim kararlılığını tamamen yeniden tanımlayan en son teknoloji çerçeve Ultralytics YOLO26.
Yönetici Özeti: Model Soy Ağacı ve Yazarlık
Bu derin öğrenme modellerinin kökenlerini anlamak, mimari tasarım seçimleri ve hedef kitleleri hakkında değerli bir bağlam sağlar.
YOLOv9
Tayvan'daki Academia Sinica Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından geliştirilen YOLOv9, 21 Şubat 2024'te yayınlandı. Model, derin evrişimsel sinir ağlarındaki (CNN'ler) bilgi darboğazı sorununu özel olarak ele alarak teorik derin öğrenme kavramlarına yoğun bir şekilde odaklanmaktadır.
YOLOv9 hakkında daha fazla bilgi edinin.
Ultralytics YOLO26
Ultralytics'ten Glenn Jocher ve Jing Qiu tarafından geliştirilen YOLO26, 14 Ocak 2026'da yayınlandı. YOLO11 ve YOLOv8 gibi öncüllerinin büyük başarısı üzerine inşa edilen YOLO26, üretim hazırlığına, uç cihaz dağıtımına ve yerel uçtan uca verimliliğe öncelik vermek üzere sıfırdan tasarlandı.
YOLO26 hakkında daha fazla bilgi edinin
YOLO26'yı Bugün Deneyin
Bilgisayar görüşü hattınızı yükseltmeye hazır mısınız? Ultralytics Platformu'nu kullanarak hiçbir kod yazmadan YOLO26 modellerini bulutta kolayca eğitebilir ve dağıtabilirsiniz.
Mimari Yenilikler
Her iki model de sinir ağlarının görsel verileri işleme biçiminde çığır açan değişiklikler sunuyor, ancak soruna farklı açılardan yaklaşıyorlar.
YOLOv9'da Programlanabilir Gradyan Bilgisi
YOLOv9'un alana temel katkısı, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN)'nın tanıtılmasıdır. Sinir ağları derinleştikçe, ileri besleme süreci sırasında genellikle bilgi kaybı yaşarlar. PGI, geri yayılım sırasında ağırlıkları güncellemek için kullanılan gradyanların doğru ve güvenilir kalmasını sağlayarak, GELAN mimarisinin daha az parametreyle yüksek doğruluk elde etmesine olanak tanır.
Ancak, YOLOv9, işlem sonrası için geleneksel NMS'ye (Non-Maximum Suppression) büyük ölçüde güvenmektedir, bu da gerçek dünya çıkarımı sırasında bir gecikme darboğazı haline gelebilir.
YOLO26'nın Uç Odaklı Mimarisi
YOLO26, eğitimden gerçek zamanlı dağıtıma kadar tüm hattı optimize ederek kökten farklı bir yaklaşım benimser. YOLOv10'da ilk kez öncülük edilen Uçtan Uca NMS-Serbest Tasarım üzerine inşa edilmiştir ve NMS işlem sonrası ihtiyacını tamamen ortadan kaldırır. Bu, inanılmaz derecede düşük gecikme süresi sağlar ve Raspberry Pi veya NVIDIA Jetson gibi uç cihazlar için yoğun bir şekilde optimize edilmesini sağlar.
Dahası, YOLO26, Dağıtım Odak Kaybı'nı (DFL) tamamen ortadan kaldırır. Bu yapısal değişiklik, modelin ONNX'e aktarımını basitleştirir ve düşük güçlü mikrodenetleyicilerle önemli ölçüde daha iyi uyumluluk sağlar.
Eğitim aşaması için YOLO26, Stokastik Gradyan İnişi ve Muon'un (Moonshot AI'nin Kimi K2'sinin LLM eğitim metodolojilerinden esinlenilmiştir) bir hibriti olan yenilikçi MuSGD Optimizatörünü entegre eder. Bu, Büyük Dil Modeli (LLM) eğitim yenilikleri ile bilgisayar görüşü arasındaki boşluğu kapatarak, önemli ölçüde daha kararlı eğitim ve daha hızlı yakınsama süreleri sunar.
Performans ve Metrik Karşılaştırması
Yaygın olarak kullanılan COCO veri kümesi üzerinde kıyaslama yapıldığında, her iki model de olağanüstü yetenekler sergiler, ancak Ultralytics ekosistemi, pratik çıkarım hızları ve parametre verimliliği açısından öne çıkar.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Sonuçların Analizi
- Hız ve Verimlilik: YOLO26, NMS-serbest bir mimari ve basitleştirilmiş kayıp fonksiyonları kullandığı için, eski mimarilere kıyasla %43'e kadar daha hızlı CPU çıkarımı sunar. YOLO26n modeli, TensorRT kullanarak bir NVIDIA T4 GPU üzerinde şaşırtıcı bir 1.7ms hızında çalışır, bu da onu gerçek zamanlı video akışları için nihai seçim haline getirir.
- Doğruluk: YOLO26x modeli, eşsiz bir 57.5 mAP değerine ulaşır, en büyük YOLOv9e modelini geride bırakırken daha düşük gecikme süresi sağlar.
- Bellek Gereksinimleri: Ultralytics modelleri verimlilikleriyle bilinir. YOLO26, karmaşık transformatör tabanlı görüş modellerine kıyasla model eğitimi ve çıkarım sırasında önemli ölçüde daha az CUDA belleği gerektirir, bu da geliştiricilerin tüketici sınıfı donanımlarda daha büyük yığın boyutları kullanmasına olanak tanır.
Ekosistem, Kullanım Kolaylığı ve Çok Yönlülük
Ultralytics ekosisteminin gerçek gücü, kullanıcı deneyiminde yatmaktadır. YOLOv9 GitHub kod tabanını kullanan araştırmacılar karmaşık ortam kurulumları ve manuel betiklerle uğraşmak zorunda kalırken, YOLO26, sezgisel Ultralytics Python API'sine tamamen entegre edilmiştir.
Akıcı API Örneği
Son teknoloji bir YOLO26 modelini eğitmek için yalnızca birkaç satır Python kodu gerekir:
from ultralytics import YOLO
# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export natively to ONNX format in a single command
model.export(format="onnx")
Benzersiz Görev Çok Yönlülüğü
Esas olarak standart nesne algılama için tasarlanmış YOLOv9'un aksine, YOLO26, kutudan çıktığı gibi çok çeşitli bilgisayar görüşü görevlerini doğal olarak destekler. Mimari, çeşitli uygulamalar için özel geliştirmeler içerir:
- Örnek Segmentasyonu: Kusursuz piksel düzeyinde maskeler için özel bir anlamsal segmentasyon kaybı ve çok ölçekli proto içerir.
- Duruş Tahmini: İskelet anahtar noktalarını son derece hassas bir şekilde izlemek için Artık Log-Olasılık Tahmini'ni (RLE) entegre eder.
- Yönlendirilmiş Sınırlayıcı Kutular (OBB): Hava görüntülerinde döndürülmüş nesne algılamadaki sınır sorunlarını çözmek için özel olarak tasarlanmış özelleştirilmiş bir açı kaybı fonksiyonu içerir.
- Görüntü Sınıflandırma: ImageNet standartlarına dayalı olarak tüm görüntüler için sağlam kategorizasyon.
Entegre Ekosistem
Tüm YOLO26 modelleri, Ultralytics Platformu ile sorunsuz entegrasyondan faydalanır, yerleşik veri kümesi etiketleme, aktif öğrenme ve anında dağıtım hatları sunar.
Gerçek Dünya Uygulamaları
Bu modeller arasında seçim yapmak genellikle dağıtılacakları ortama bağlıdır.
IoT ve Uç Robotik
Robotik, otonom dronlar ve akıllı ev IoT cihazları için YOLO26 tartışmasız şampiyondur. ProgLoss + STAL entegrasyonu, yüksek irtifa dronlarından tarımsal izleme için kritik olan küçük nesne tanımada önemli iyileştirmeler sağlar. %43 daha hızlı CPU çıkarımı ve NMS-serbest tasarımıyla birleştiğinde, YOLO26 özel GPU'ları olmayan donanımlarda akıcı bir şekilde çalışabilir.
Akademik Araştırma ve Gradyan Analizi
YOLOv9, akademik çevrelerde oldukça saygın bir model olmaya devam etmektedir. Gradyan akışının teorik sınırlarını araştıran veya PGI konseptine dayalı özel PyTorch katmanları oluşturmak isteyen araştırmacılar, YOLOv9'un kod tabanını derin öğrenme teorisi keşfi için mükemmel bir temel olarak bulacaklardır.
Yüksek Hızlı Üretim Hatları
Yüksek hızlı konveyör bantlarındaki otomatik hata tespiti gibi endüstriyel ortamlarda, YOLO26 modellerinin son derece hızlı TensorRT hızları, hiçbir karenin atlanmamasını sağlayarak kalite güvence sistemlerinin verimini en üst düzeye çıkarır.
Kullanım Durumları ve Öneriler
YOLOv9 ve YOLO26 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
YOLOv9 Ne Zaman Tercih Edilmeli?
YOLOv9, aşağıdaki durumlar için güçlü bir tercihtir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için bir referans noktası olarak gerektiği senaryolar.
YOLO26 Ne Zaman Seçilmeli
YOLO26 şunlar için önerilir:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Sonuç
Her iki model de açık kaynak topluluğu için inanılmaz ilerlemeler temsil etmektedir. YOLOv9, gradyan akışına yıllarca mimarilere ilham verecek hayati teorik iyileştirmeler getirdi. Ancak, hız, doğruluk ve dağıtım kolaylığının kusursuz bir dengesini arayan modern geliştiriciler, startup'lar ve kurumsal ekipler için Ultralytics YOLO26 açık ara tavsiye edilir.
NMS'yi ortadan kaldırarak, güçlü MuSGD optimize ediciyi tanıtarak ve detection, segmentation ve poz görevlerinde benzersiz bir araç paketi sunarak, YOLO26, bilgisayar görüşü projelerinizin günümüzdeki en güvenilir, geleceğe dönük çerçeve üzerine inşa edilmesini sağlar.