YOLO26 ve YOLOv8: Görsel Yapay Zeka'da Yeni Bir Dönem
Hızla gelişen bilgisayar görme alanında, doğru nesne algılama modelini seçmek başarı için çok önemlidir. YOLO You Only Look Once) serisinin en önemli iki dönüm noktası, yaygın olarak kullanılan YOLOv8 ve devrim niteliğindeki YOLO26'dır. YOLOv8 , 2023 yılında çok yönlülük ve kullanım kolaylığı konusunda standartları YOLOv8 , YOLO26, Büyük Dil Modeli (LLM) eğitiminden esinlenerek uçtan uca mimariler ve optimizasyon yenilikleri sunarak bir sonraki adımı temsil etmektedir.
Bu kapsamlı kılavuz, bu iki güçlü platformu karşılaştırarak mimari farklılıklarını, performans ölçütlerini ve ideal dağıtım senaryolarını analiz eder ve bir sonraki AI projeniz için bilinçli bir karar vermenize yardımcı olur.
Mimari Evrim: Çapalardan Uçtan Uca
YOLOv8 geçiş, algılama boru hatlarının oluşturulma biçiminde temel bir değişimi işaret ediyor. Her iki model de sağlam CSPDarknet backbone kavramlarını kullanıyor olsa da, baş tasarımına ve son işlemeye yaklaşımları önemli ölçüde farklılık gösteriyor.
YOLOv8: Çok Yönlü Standart
2023 yılının başında Ultralyticstarafından piyasaya sürülen YOLOv8 , çapa içermeyen algılama paradigmasını YOLOv8 . Nesneleri, sınıflandırmayı ve regresyon görevlerini bağımsız olarak işleyen ayrıştırılmış bir başlık yapısı kullanır. Bu tasarım, genel amaçlı görevler için oldukça etkili olduğunu kanıtladı ve YOLOv8 perakende analitiğinden otonom sürüşe kadar çeşitli endüstri uygulamaları YOLOv8 güvenilir bir iş gücü YOLOv8 getirdi. Ancak, öncülleri gibi, çakışan sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS) yöntemine dayanmaktadır. Bu adım, gecikme değişkenliği yaratmakta ve belirli kenar hızlandırıcılarında dağıtımı karmaşıklaştırmaktadır.
YOLOv8 hakkında daha fazla bilgi edinin.
YOLO26: Uçtan Uca Devrim
2026 yılının Ocak ayında piyasaya sürülen YOLO26, NMS doğrudan ele almaktadır. Yerel olarak uçtan uca NMS bir tasarım benimseyen YOLO26, sonradan işleme heuristiklerine gerek kalmadan bir görüntüdeki nesnelerin tam setini tahmin eder. Bu yenilik, ilk olarak deneysel olarak YOLOv10'de deneysel olarak ilk kez uygulanan bu yenilik, YOLO26'da tamamen olgunlaşmıştır.
Önemli mimari yenilikler arasında şunlar yer almaktadır:
- Dağıtım Odak Kaybının (DFL) Kaldırılması: Bu basitleştirme, model dışa aktarma sürecini kolaylaştırarak YOLO26'nın karmaşık kayıp katmanlarıyla zorlanan düşük güçlü kenar cihazları ve hızlandırıcılarla önemli ölçüde daha uyumlu hale getirir.
- MuSGD Optimizer: Moonshot AI'nın Kimi K2 ve LLM eğitim tekniklerinden esinlenen bu hibrit optimizer, Stochastic Gradient Descent (SGD) ile Muon'u birleştirerek istikrarlı eğitim dinamikleri ve daha hızlı yakınsama sağlar, böylece en gelişmiş doğruluğa ulaşmak için gereken GPU azaltır.
- ProgLoss + STAL: Yeni kayıp fonksiyonları, küçük nesnelerin algılanmasını iyileştirir; bu, drone görüntüleri ve IoT sensörleri için kritik bir gelişmedir.
YOLO26 hakkında daha fazla bilgi edinin
Performans Karşılaştırması
Bu modelleri değerlendirirken üç faktör çok önemlidir: ortalama hassasiyet (mAP), çıkarım hızı ve hesaplama verimliliği. YOLO26, özellikle CPU ortamlarda bu ölçütlerin tümünde belirgin avantajlar sergilemektedir.
Metriklere Genel Bakış
Aşağıdaki tablo, standart COCO Nano (n) ile X-Large (x) varyantlarının performansını göstermektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Hız ve Verimlilik Analizi
YOLO26 verimlilikte öne çıkıyor. YOLO26n modeli, YOLOv8n kıyasla CPU'larda %43'e kadar daha hızlı YOLOv8n önemli ölçüde daha yüksek mAP +3,6) elde ediyor. Bu hız artışı, büyük ölçüde NMS tasarım sayesinde, binlerce aday kutuyu sıralama ve filtreleme gibi sıralı darboğazları ortadan kaldırıyor. Raspberry Pi veya mobil CPU'larda çalışan uygulamalar için, bu fark genellikle bir uygulamanın gerçek zamanlı olarak çalışıp çalışmayacağını belirler.
Kenar Dağıtım Optimizasyonu
YOLO26'da Dağıtım Odak Kaybının (DFL) kaldırılması, grafiği basitleştirir. ONNX ve TensorRT grafiği basitleştirir. Bu, NPU hızlandırıcılar gibi özel donanımlarda desteklenmeyen operatörlerin sayısını azaltarak dağıtımı daha sorunsuz ve öngörülebilir hale getirir.
Ekosistem ve Kullanım Kolaylığı
Ultralytics seçmenin en büyük avantajlarından biri, çevresindeki ekosistemdir. Hem YOLOv8 YOLO26, birinci sınıf vatandaşlardır. ultralytics Python ve Ultralytics Platform.
Kolaylaştırılmış İş Akışları
Geliştiriciler, kodlarındaki tek bir dizeyi değiştirerek modeller arasında geçiş yapabilirler. Bu "sıfırdan kahramana" deneyimi, eğitim süreçlerini yeniden yazmaya gerek kalmadan hızlı denemeler yapılmasına olanak tanır.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on your custom dataset
# The API remains consistent across model generations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Görevler Arası Çok Yönlülük
Sadece algılamayı destekleyen birçok araştırma odaklı mimariden farklı olarak, hem YOLOv8 YOLO26 çok yönlü platformlardır. Doğal olarak şunları desteklerler:
- Nesne Algılama: Nesneleri tanımlama ve konumlandırma.
- Örnek Segmentasyonu: Nesneler için piksel düzeyinde maskeler.
- Poz Tahmini: Anahtar noktaların (iskeletlerin) algılanması.
- Yönlendirilmiş Sınır Kutuları (OBB): Döndürülmüş nesneleri algılama (ör. gemiler, hava görüntüleri).
- Sınıflandırma: Tüm görüntüleri kategorize etme.
YOLO26, YOLOv8 daha iyi sınır kesintilerini işlemek için OBB için özel açı kaybı ve kalabalık sahnelerde daha doğru poz tahmini için Artık Log-Olasılık Tahmini (RLE) gibi göreve özel iyileştirmeler sunar.
Eğitim Metodolojileri: MuSGD Avantajı
Eğitim verimliliği önemli bir fark yaratır. YOLOv8 , etkili olmakla birlikte bellek yoğunluğu yüksek olabilen standart optimizasyon tekniklerini YOLOv8 .
YOLO26, Büyük Dil Modeli eğitimindeki yenilikleri uyarlayan hibrit bir yaklaşım olan MuSGD Optimizer'ı sunar. Bu optimizer, eğitim sürecine daha fazla istikrar getirerek genellikle daha yüksek öğrenme oranları ve daha hızlı yakınsama sağlar. Ayrıca, geliştirilmiş kayıp fonksiyonları (ProgLoss ve STAL), modelin eğitim döngüsünün erken aşamalarında öğrenilmesi zor örnekler üzerinde odaklanmasına yardımcı olur.
Kullanıcılar için bu, transformatör ağırlıklı modeller veya eski YOLO kıyasla eğitim sırasında daha düşük bellek gereksinimi anlamına gelir. Tüketici sınıfı GPU'larda daha büyük parti boyutlarını eğitebilir, yüksek performanslı model oluşturmaya erişimi demokratikleştirebilirsiniz.
İdeal Kullanım Senaryoları
Doğru modeli seçmek, sizin özel kısıtlamalarınıza bağlıdır.
YOLO26'yı seçin eğer:
- Kenar Bilişim Önceliğidir: Her milisaniyenin önemli olduğu CPU'lara, mobil cihazlara veya IoT cihazlarına dağıtım yapıyorsunuz.
- Basitlik anahtardır: Farklı dağıtım ortamları için NMS ayarlamanın karmaşıklığından kaçınmak istersiniz.
- Küçük Nesne Algılama: Uygulamanız, yeni kayıp fonksiyonlarının somut bir doğruluk artışı sağladığı hava görüntüleri veya uzaktan gözetleme ile ilgilidir.
- En Son Ekosistem Özellikleri: Ultralytics bulunan en yeni entegrasyonlardan yararlanmak istiyorsunuz.
YOLOv8 seçin:
- Miras Tutarlılığı: YOLOv8 tuhaflıkları etrafında özel olarak oluşturulmuş, mevcut, son derece ayarlanmış bir boru hattınız var ve yeni bir mimariyi hemen yeniden doğrulamaya gücünüz yetmiyor.
- Özel Donanım Desteği: YOLOv8 için özel olarak doğrulanmış dışa aktarım yolları zaten sıkı bir şekilde YOLOv8 eski bir donanım kullanıyorsunuz (ancak YOLO26 genellikle daha iyi dışa aktarım sağlar).
Sonuç
Her iki mimari de kendi nesillerinin zirvesini temsil etmektedir. YOLOv8 , dünya çapında milyonlarca uygulamaya güç vermiş, sağlam ve güvenilir bir seçenek olmaya devam etmektedir. Ancak, yeni projeler için YOLO26 açıkça tavsiye edilen seçenektir. Uçtan uca tasarımı, üstün hız-doğruluk dengesi ve eğitim verimliliği, onu 2026 için kesin ve en gelişmiş çözüm haline getirmektedir.
Kapsamlı belgeler ve aktif topluluk desteğinden yararlanarak, geliştiriciler sorunsuz bir şekilde YOLO26'ya yükseltebilir ve bir üst düzey bilgisayar görme performansına ulaşabilirler.
Diğer yeni modelleri keşfetmek isteyenler için, YOLO11 mimari de mükemmel performans sunmaktadır, ancak YOLO26 kenar optimizasyonu ve mimari basitlik açısından onu geride bırakmaktadır.
Yazarlar ve Referanslar
YOLO26
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2026-01-14
- Belgeler:YOLO26 Dokümantasyonu
YOLOv8
- Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2023-01-10
- Belgeler:YOLOv8 Belgeleri