YOLOv9 ile YOLO26: Modern Nesne Algılamaya Teknik Bir Bakış
Gerçek zamanlı nesne algılama dünyası geçtiğimiz birkaç yıl içinde önemli ölçüde gelişti. Makine öğrenimi uygulayıcıları modellerini farklı donanımlar üzerinde dağıtmayı hedeflerken, doğru mimariyi seçmek kritik önem taşıyor. Bu kapsamlı teknik rehberde, bilgisayarlı görü alanındaki iki önemli dönüm noktasını karşılaştırıyoruz: Gradyan yolu optimizasyonlarına odaklanarak 2024 başlarında tanıtılan YOLOv9 ve uçta çıkarım (inference) ve eğitim kararlılığını tamamen yeniden tanımlayan, 2026 başında piyasaya sürülen en son teknoloji ürünü Ultralytics YOLO26.
Yönetici Özeti: Model Soy ağacı ve Yazarlık
Bu derin öğrenme modellerinin kökenlerini anlamak, mimari tasarım seçimleri ve hedef kitleleri hakkında değerli bir bağlam sunar.
YOLOv9
Tayvan'daki Academia Sinica Bilgi Bilimi Enstitüsü'nden Chien-Yao Wang ve Hong-Yuan Mark Liao tarafından hazırlanan YOLOv9, 21 Şubat 2024'te yayınlandı. Model, özellikle derin evrişimli sinir ağlarındaki (CNN'ler) bilgi darboğazı sorununu ele alarak, teorik derin öğrenme kavramlarına büyük ölçüde odaklanıyor.
YOLOv9 hakkında daha fazla bilgi edin
Ultralytics YOLO26
Ultralytics'ten Glenn Jocher ve Jing Qiu tarafından hazırlanan YOLO26, 14 Ocak 2026'da yayınlandı. YOLO11 ve YOLOv8 gibi seleflerinin büyük başarısının üzerine inşa edilen YOLO26; üretime hazır olma, uçta dağıtım ve yerel uçtan uca verimliliği önceliklendirecek şekilde sıfırdan tasarlandı.
YOLO26 hakkında daha fazla bilgi edin
Bilgisayarlı görü hattını yükseltmeye hazır mısın? Ultralytics Platform'u kullanarak hiçbir kod yazmadan YOLO26 modellerini bulutta kolayca eğitebilir ve dağıtabilirsin.
Mimari Yenilikler
Her iki model de sinir ağlarının görsel veriyi işleme biçiminde çığır açan değişiklikler getiriyor ancak bu soruna farklı açılardan yaklaşıyorlar.
YOLOv9'da Programlanabilir Gradyan Bilgisi
YOLOv9'un alana temel katkısı, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN)'nın tanıtılmasıdır. Sinir ağları derinleştikçe, ileri besleme sürecinde genellikle bilgi kaybına uğrarlar. PGI, geri yayılım (backpropagation) sırasında ağırlıkları güncellemek için kullanılan gradyanların doğru ve güvenilir kalmasını sağlayarak GELAN mimarisinin daha az parametre ile yüksek doğruluk elde etmesine olanak tanır.
Bununla birlikte, YOLOv9, gerçek dünya çıkarımı sırasında gecikme darboğazı oluşturabilen, işlem sonrası aşamasında geleneksel Non-Maximum Suppression (NMS) yöntemine büyük ölçüde güvenmektedir.
YOLO26'nın Uç Öncelikli Mimarisi
YOLO26, eğitimden gerçek zamanlı dağıtıma kadar tüm hattı optimize ederek tamamen farklı bir yaklaşım benimsiyor. İlk kez YOLOv10 ile öncülük edilen NMS'siz Uçtan Uca Tasarım üzerine inşa edilerek NMS sonrası işleme ihtiyacını tamamen ortadan kaldırıyor. Bu, inanılmaz derecede düşük gecikme süresi ile sonuçlanarak onu Raspberry Pi veya NVIDIA Jetson gibi uç cihazlar için yüksek düzeyde optimize edilmiş hale getiriyor.
Ayrıca YOLO26, Distribution Focal Loss (DFL) yapısını tamamen kaldırıyor. Bu yapısal değişiklik, modelin ONNX'e aktarılmasını kolaylaştırıyor ve düşük güçlü mikrodenetleyicilerle önemli ölçüde daha iyi uyumluluk sağlıyor.
Eğitim aşaması için YOLO26, Stochastic Gradient Descent ve Muon'un (Moonshot AI'ın Kimi K2'sinin LLM eğitim metodolojilerinden esinlenilmiştir) bir hibriti olan yenilikçi MuSGD Optimizer'ı entegre ediyor. Bu, Büyük Dil Modeli (LLM) eğitim yenilikleri ile bilgisayarlı görü arasındaki boşluğu doldurarak çok daha kararlı bir eğitim ve daha hızlı yakınsama süreleri sunuyor.
Performans ve Metrik Karşılaştırması
Yaygın olarak kullanılan COCO dataset üzerinde kıyaslama yapıldığında, her iki model de olağanüstü yetenekler sergiliyor, ancak Ultralytics ekosistemi pratik çıkarım hızları ve parametre verimliliğinde öne çıkıyor.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Sonuçların Analizi
- Hız ve Verimlilik: YOLO26, NMS'siz bir mimari ve basitleştirilmiş kayıp fonksiyonları kullandığı için, eski mimarilere kıyasla %43'e kadar daha hızlı CPU çıkarımı sunar. YOLO26n modeli, TensorRT kullanan bir NVIDIA T4 GPU üzerinde 1.7ms gibi baş döndürücü bir hızda çalışarak onu gerçek zamanlı video akışları için nihai seçim haline getiriyor.
- Doğruluk: YOLO26x modeli, en büyük YOLOv9e modelinden daha düşük gecikme süresini korurken, eşsiz bir 57.5 mAP başarısına ulaşıyor.
- Memory Requirements: Ultralytics models are known for their efficiency. YOLO26 requires significantly less CUDA memory during model training and inference compared to complex transformer-based vision models, allowing developers to utilize larger batch sizes on consumer-grade hardware.
Ekosistem, Kullanım Kolaylığı ve Çok Yönlülük
Ultralytics ekosisteminin gerçek gücü kullanıcı deneyiminde yatmaktadır. YOLOv9 GitHub kod tabanını kullanan araştırmacılar karmaşık ortam kurulumları ve manuel betiklerle uğraşmak zorundayken, YOLO26 sezgisel Ultralytics Python API'sine tamamen entegre edilmiştir.
Kolaylaştırılmış API Örneği
En son teknoloji bir YOLO26 modelini eğitmek sadece birkaç satır Python kodu gerektirir:
from ultralytics import YOLO
# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export natively to ONNX format in a single command
model.export(format="onnx")Benzersiz Görev Çok Yönlülüğü
Temelde standart nesne algılama için tasarlanan YOLOv9'un aksine, YOLO26 kutudan çıktığı haliyle çok çeşitli bilgisayarlı görü görevlerini destekler. Mimari, çeşitli uygulamalar için özel geliştirmeler içerir:
- Instance Segmentation: Kusursuz piksel düzeyi maskeler için özel bir anlamsal segmentasyon kaybı ve çok ölçekli proto özellikleri sunar.
- Pose Estimation: İskelet anahtar noktalarını aşırı hassasiyetle izlemek için Artık Log-Olabilirlik Tahmini (RLE) entegre eder.
- Oriented Bounding Boxes (OBB): Hava görüntülerinde döndürülmüş nesne algılamasındaki sınır sorunlarını çözmek için özel olarak tasarlanmış bir açı kayıp fonksiyonu içerir.
- Image Classification: ImageNet standartlarına dayalı tüm görüntülerin sağlam kategorizasyonu.
Tüm YOLO26 modelleri, yerleşik veri seti etiketleme, aktif öğrenme ve anında dağıtım hatları sunan Ultralytics Platform ile kesintisiz entegrasyondan yararlanır.
Gerçek Dünya Uygulamaları
Bu modeller arasında seçim yapmak genellikle dağıtılacakları ortama bağlıdır.
IoT ve Uçta Robotik
Robotik, otonom dronlar ve akıllı ev IoT cihazları için YOLO26 tartışmasız şampiyondur. ProgLoss + STAL entegrasyonu, yüksek irtifalı dronlardan tarımsal izleme için kritik öneme sahip küçük nesne tanıma konusunda kayda değer iyileştirmeler getirir. %43 daha hızlı CPU çıkarımı ve NMS'siz tasarımı ile birleştiğinde, YOLO26 özel GPU'lara ihtiyaç duymadan donanımlar üzerinde akıcı bir şekilde çalışabilir.
Akademik Araştırma ve Gradyan Analizi
YOLOv9, akademik çevrelerde oldukça saygın bir model olmaya devam ediyor. Gradyan akışının teorik sınırlarını araştıran araştırmacılar veya PGI kavramına dayalı özel PyTorch katmanları oluşturmak isteyenler, YOLOv9'un kod tabanını derin öğrenme teorisi keşfi için mükemmel bir temel olarak göreceklerdir.
Yüksek Hızlı Üretim Hatları
Yüksek hızlı konveyör bantları üzerinde otomatik kusur algılama gibi endüstriyel ortamlarda, YOLO26 modellerinin ışık hızındaki TensorRT hızları, hiçbir karenin kaçırılmamasını sağlayarak kalite güvence sistemlerinin verimini en üst düzeye çıkarır.
Kullanım Durumları ve Öneriler
YOLOv9 ile YOLO26 arasında seçim yapmak, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman YOLOv9 Seçilmeli
YOLOv9 şunlar için güçlü bir tercihtir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Birleştirme Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için referans noktası olarak gerektiği senaryolar.
Ne Zaman YOLO26 Seçilmeli
YOLO26 şunlar için önerilir:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Sonuç
Her iki model de açık kaynak topluluğu için inanılmaz ileri sıçramaları temsil ediyor. YOLOv9, gelecek yıllardaki mimarilere ilham verecek gradyan akışı konusunda hayati teorik iyileştirmeler getirdi. Ancak modern geliştiriciler, startup'lar ve hız, doğruluk ve dağıtım kolaylığının kusursuz dengesini arayan kurumsal ekipler için Ultralytics YOLO26 net bir tavsiyedir.
NMS'yi ortadan kaldırarak, güçlü MuSGD optimizer'ı tanıtarak ve algılama, segmentasyon ve poz görevlerinde benzersiz bir araç paketi sunarak YOLO26, bilgisayarlı görü projelerinin bugün mevcut olan en güvenilir ve geleceğe hazır çerçeve üzerine inşa edilmesini sağlar.