YOLO26 vs YOLOv9: Gerçek Zamanlı Nesne Algılamada Bir Sonraki Evrim
Bilgisayar görüşü alanı hızla ilerlemekte, yeni mimariler sürekli olarak hız ve doğruluk sınırlarını zorlamaktadır. Bu teknik karşılaştırmada, gerçek zamanlı nesne algılama alanında son derece etkili iki model olan YOLO26 ve YOLOv9 arasındaki farkları inceliyoruz. Her iki model de farklı mimari yenilikler sunsa da, performans ödünleşimlerini, dağıtım yeteneklerini ve donanım gereksinimlerini anlamak, bir sonraki görüntü işleme projeniz için doğru aracı seçmek açısından kritik öneme sahiptir.
YOLO26: Uç Cihazlar İçin Optimize Edilmiş Güç Kaynağı
2026 yılının başlarında piyasaya sürülen Ultralytics YOLO26, dağıtım verimliliği ve model eğitim kararlılığında nesiller arası bir sıçramayı temsil etmektedir. Yerel olarak uçtan uca bir çerçeve olarak tasarlanan bu model, tarihsel olarak uç yapay zeka uygulamalarına sıkıntı veren dağıtım darboğazlarını doğrudan ele almaktadır.
Model Detayları:
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2026-01-14
- GitHub:Ultralytics Deposu
- Belgeler:YOLO26 Dokümantasyonu
Mimari ve Yenilikler
YOLO26, Uçtan Uca NMS-Serbest Tasarım sunarak işlem sonrası hattını temelden yeniden tasarlar. Maksimum Olmayan Bastırma (NMS) ihtiyacını ortadan kaldırarak, model önemli ölçüde daha düşük gecikme değişkenliği elde eder. Bu durum, özellikle ONNX ve Apple CoreML gibi çerçevelere dışa aktarırken mobil ve uç platformlara dağıtımı önemli ölçüde kolaylaştırır.
Ek olarak, Dağıtım Odak Kaybı (DFL) kaldırılması, dışa aktarma sürecini kolaylaştırır ve düşük güçlü mikrodenetleyicilerle uyumluluğu artırır. Eğitim kararlılığını artırmak için YOLO26, Stokastik Gradyan İnişi (SGD) ve Muon'un (Büyük Dil Modeli eğitimindeki yeniliklerden esinlenilmiştir) bir hibriti olan yeni MuSGD Optimizatörünü entegre eder. Bu, zorlu veri kümelerinde daha hızlı yakınsama ve daha sağlam özellik çıkarımı sağlar.
Uç Cihaz Çıkarımı
Mimari basitleştirmeler ve DFL'nin kaldırılması sayesinde YOLO26, yüzde 43'e kadar daha hızlı CPU çıkarımı elde ederek, Raspberry Pi veya NVIDIA Jetson Nano gibi kaynak kısıtlı uç cihazlar için ideal bir seçim haline gelir.
Drone hava görüntüleri gibi sahnelerde son derece zorlu öğeleri tespit etmek için YOLO26, güncellenmiş ProgLoss + STAL kayıp fonksiyonlarını kullanır. Bunlar, küçük nesne tanıma geri çağırmasında önemli iyileştirmeler sağlar. Ayrıca, instance segmentation için çok ölçekli proto, poz tahmini için Artık Log-Olasılık Tahmini (RLE) ve Oriented Bounding Boxes (OBB) tespiti için özel açı kaybı dahil olmak üzere göreve özel geliştirmeler sunar.
YOLO26 hakkında daha fazla bilgi edinin
YOLOv9: Programlanabilir Gradyan Bilgisi
2024 yılının başlarında tanıtılan YOLOv9, sinir ağlarının eğitim aşamasında gradyan akışını yönetme şekline teorik gelişmeler getirerek, parametre verimliliği ve derin özellik tutma üzerine odaklandı.
Model Detayları:
- Yazarlar: Chien-Yao Wang ve Hong-Yuan Mark Liao
- Kuruluş: Institute of Information Science, Academia Sinica, Taiwan
- Tarih: 2024-02-21
- Arxiv:YOLOv9 Makalesi
- GitHub:YOLOv9 Deposu
- Belgeler:YOLOv9 Belgeleri
Mimari ve Güçlü Yönler
YOLOv9, Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) konseptleri etrafında inşa edilmiştir. Bu konseptler, derin sinir ağlarında sıkça gözlemlenen bilgi darboğazı sorununu ele alır. İleri beslemeli süreç boyunca temel bilgileri koruyarak, GELAN ağırlık güncellemeleri için kullanılan gradyanların güvenilir kalmasını sağlar. Bu mimari yüksek doğruluk sunar ve YOLOv9'u PyTorch çerçevesini kullanarak sinir ağı teorisi ve gradyan yolu optimizasyonu üzerine akademik araştırmalar için güçlü bir aday yapar.
Sınırlamalar
Mükemmel parametre verimliliğine rağmen, YOLOv9 sınırlayıcı kutu işlem sonrası için geleneksel NMS'ye yoğun bir şekilde dayanır, bu da uç cihazlarda çıkarım sırasında hesaplama darboğazları yaratabilir. Ayrıca, resmi depo büyük ölçüde nesne algılamaya odaklanmıştır ve tracking veya poz tahmini gibi uzmanlaşmış görevlere uyarlamak için önemli özel mühendislik gerektirir.
YOLOv9 hakkında daha fazla bilgi edinin.
Performans Karşılaştırması
Bu modelleri gerçek dünya dağıtımı için değerlendirirken, doğruluk (mAP), çıkarım hızı ve bellek kullanımını dengelemek kritik öneme sahiptir. Ultralytics modelleri, hem eğitim hem de çıkarım sırasında düşük bellek gereksinimleriyle tanınır ve RT-DETR gibi transformatör tabanlı alternatiflerden çok daha az CUDA belleği gerektirir.
Aşağıda, COCO veri kümesi üzerinde YOLO26 ve YOLOv9 performansının doğrudan bir karşılaştırması bulunmaktadır. Her sütundaki en iyi değerler kalın olarak vurgulanmıştır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Not: YOLOv9 için CPU hızları, NMS yapılandırmasına göre büyük ölçüde değişiklik gösterdiği ve genellikle YOLO26'nın yerel NMS-serbest uygulamasından daha yavaş olduğu için atlanmıştır.
Kullanım Durumları ve Öneriler
YOLO26 ve YOLOv9 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.
YOLO26 Ne Zaman Seçilmeli
YOLO26 şunlar için güçlü bir seçenektir:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
YOLOv9 Ne Zaman Tercih Edilmeli?
YOLOv9 şunlar için önerilir:
- Bilgi Darboğazı Araştırması: Programlanabilir Gradyan Bilgisi (PGI) ve Genelleştirilmiş Verimli Katman Toplama Ağı (GELAN) mimarilerini inceleyen akademik projeler.
- Gradyan Akışı Optimizasyon Çalışmaları: Eğitim sırasında derin ağ katmanlarındaki bilgi kaybını anlama ve azaltmaya odaklanan araştırmalar.
- Yüksek Doğruluklu Algılama Kıyaslaması: YOLOv9'un güçlü COCO kıyaslama performansının mimari karşılaştırmalar için bir referans noktası olarak gerektiği senaryolar.
Ultralytics'in Avantajı
Bir model seçmek, sadece bir doğruluk karşılaştırması okumaktan daha fazlasını içerir; çevreleyen yazılım ekosistemi, veri toplama aşamasından üretime ne kadar hızlı geçebileceğinizi belirler.
Kullanım Kolaylığı ve Ekosistem
Ultralytics Python API sorunsuz bir "sıfırdan kahramana" deneyimi sunar. Karmaşık depoları klonlamak veya dağıtılmış eğitim betiklerini manuel olarak yapılandırmak yerine, geliştiriciler paketi şuradan yükleyebilirler: pip ve hemen eğitime başlayabilirler. Aktif olarak sürdürülen Ultralytics ekosistemi sık güncellemeleri, ML platformlarıyla otomatik entegrasyonları garanti eder, örneğin Weights & Biases, ve kapsamlı dokümantasyon.
Diğer Ultralytics Modelleri
Ultralytics ekosistemi içindeki diğer modelleri keşfetmekle ilgileniyorsanız, özel uygulamalar için olağanüstü esneklik sağlayan YOLO11 veya klasik YOLOv8'i karşılaştırmayı da düşünebilirsiniz.
Görüntüleme Görevlerinde Çok Yönlülük
YOLOv9 öncelikli olarak bir algılama motoru iken, YOLO26 genel amaçlı bir görüntü işleme aracıdır. Tek bir birleşik sözdizimi kullanarak, nesne algılamadan piksel hassasiyetinde görüntü segmentasyonuna veya tüm görüntü sınıflandırmasına kolayca geçiş yapabilirsiniz. Bu çok yönlülük, farklı bilgisayar görüşü özellikleri için birden fazla ayrı kod tabanını sürdürmenin teknik borcunu azaltır.
Verimli Eğitim ve Dağıtım
Eğitim verimliliği, Ultralytics felsefesinin temel taşlarından biridir. YOLO26, hazır önceden eğitilmiş ağırlıkları kullanır ve hantal görüntü transformatörlerine kıyasla önemli ölçüde daha düşük bellek kullanımı sunar. Eğitildikten sonra, yerleşik dışa aktarma hatları, TensorRT veya TensorFlow Lite gibi optimize edilmiş formatlara tek tıklamayla dönüştürme imkanı sunarak üretim yolunu kolaylaştırır.
Kod Örneği: YOLO26 ile Başlarken
YOLO26'yı uygulamak oldukça basittir. Aşağıdaki python kod parçacığı, önceden eğitilmiş bir modeli nasıl yükleyeceğinizi, özel veriler üzerinde nasıl eğiteceğinizi ve Ultralytics API'sini kullanarak çıkarım yapacağınızı gösterir.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()
YOLO26'nın hızı, basitleştirilmiş mimarisi ve sağlam ekosisteminden yararlanarak, ekipler gelişmiş görüntü yapay zekası uygulamalarını pazara her zamankinden daha hızlı ve daha az teknik engelle sunabilir.