YOLO26 vs YOLOv10: Uçtan Uca Nesne Algılamanın Evrimi
Gerçek zamanlı nesne algılama alanı hızla gelişerek karmaşık çok aşamalı işlem hatlarından, akıcı uçtan uca mimarilere doğru bir değişim göstermiştir. Bu geçişteki iki temel model, Ultralytics'in en son teknoloji ürünü olan YOLO26 ve Tsinghua Üniversitesi'nden akademik bir atılım olan YOLOv10'dur.
Her iki model de basitleştirilmiş dağıtım için Non-Maximum Suppression (NMS) kaldırılmasını savunsa da, optimizasyon hedefleri, ekosistem desteği ve mimari iyileştirmeler açısından önemli ölçüde farklılık gösterirler. Bu kılavuz, bilgisayar görüşü projeleriniz için doğru aracı seçmenize yardımcı olmak amacıyla farklılıklarına teknik bir bakış sunmaktadır.
Performans Kıyaslamaları
Aşağıdaki tablo, YOLO26 ve YOLOv10'un COCO doğrulama veri kümesindeki performansını karşılaştırmaktadır. YOLO26, özellikle kenar dağıtımı için özel olarak optimize edildiği CPU donanımında üstün doğruluk (mAP) ve çıkarım hızları sergilemektedir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Ultralytics YOLO26
YOLO26, Ultralytics model ailesinin zirvesini temsil etmekte olup Ocak 2026'da piyasaya sürülmüştür. YOLOv8 ve YOLO11'in mirası üzerine inşa edilen bu model, NMS sonrası işlem ihtiyacını ortadan kaldıran ve kenar cihazlarda önemli hız kazanımları sağlayan yerel bir uçtan uca tasarım sunar.
Temel Mimari Yenilikler
- Uçtan Uca NMS'siz Çıkarım: YOLOv10 gibi, YOLO26 da NMS adımını kaldırır. Bu, dağıtım hattını basitleştirir, model çıktısının alt akış mantığı için hemen hazır olmasını sağlar ve gerçek zamanlı sistemlerde gecikme varyansını azaltır.
- DFL Kaldırma: Mimari, Distribution Focal Loss (DFL) özelliğini kaldırır. Bu değişiklik, ONNX ve TensorRT gibi formatlara dışa aktarma sürecini önemli ölçüde basitleştirir ve karmaşık çıktı katmanlarıyla zorlanabilecek düşük güçlü kenar donanımlarıyla uyumluluğu artırır.
- MuSGD Optimizatörü: Muon (Moonshot AI'dan LLM eğitim tekniklerinden esinlenilmiştir) ile Stochastic Gradient Descent (SGD)'i birleştiren yeni bir eğitim optimizatörü. Bu, geleneksel AdamW veya SGD kurulumlarına kıyasla daha hızlı yakınsama ve daha kararlı eğitim çalışmaları sağlar.
- ProgLoss + STAL: Aşamalı Kayıp Dengeleme ve Küçük Hedef Odaklı Etiket Atama (STAL) entegrasyonu, nesne algılamadaki yaygın zayıflıkları doğrudan ele alır, özellikle hava görüntülerinde veya lojistikte bulunan küçük nesneler üzerindeki performansı iyileştirir.
YOLO26 hakkında daha fazla bilgi edinin
Kullanım Durumları ve Güçlü Yönleri
YOLO26, evrensel bir görüş modeli olarak tasarlanmıştır. Algılamanın ötesinde, yerel olarak örnek segmentasyonunu, duruş tahmini, yönlendirilmiş sınırlayıcı kutu (OBB) algılama ve görüntü sınıflandırmasını destekler.
CPU çıkarımı için optimizasyonu, GPU kaynaklarının mevcut olmadığı Raspberry Pi veya mobil cihazlarda çalışmak gibi kenar AI uygulamaları için onu ideal bir seçim haline getirir.
Kenar Verimliliği
YOLO26, önceki nesillere kıyasla %43'e kadar daha hızlı CPU çıkarımı için optimize edilmiştir, bu da onu pille çalışan IoT cihazları ve gömülü sistemler için ezber bozan bir hale getirir.
YOLOv10
Tsinghua Üniversitesi araştırmacıları tarafından geliştirilen YOLOv10, YOLO ailesi için NMS'siz eğitimi tanıtan öncü bir modeldi. Model kafasındaki fazlalığı azaltmaya ve işlem sonrası hesaplama darboğazını ortadan kaldırmaya büyük ölçüde odaklanır.
Temel Özellikler
- Tutarlı Çift Atamalar: YOLOv10, eğitim sırasında çift atama stratejisi kullanır; zengin denetim için çoktan bire atama ve verimlilik için bire bir atama. Bu, modelin çıkarım sırasında uçtan uca bir şekilde işlev görürken etkili bir şekilde eğitilmesine olanak tanır.
- Bütünsel Verimlilik Tasarımı: Mimari, hesaplama yükünü (FLOPs) azaltmak için hafif sınıflandırma başlıkları ve uzamsal-kanal ayrık örnekleme kullanır.
- Sıra Odaklı Blok Tasarımı: Verimliliği artırmak için YOLOv10, ağın aşamasına göre blok tasarımını uyarlar ve daha derin katmanlardaki fazlalığı azaltır.
Sınırlamalar
Yenilikçi olsa da, YOLOv10 öncelikle akademik bir araştırma projesidir. YOLO26'da bulunan kapsamlı görev desteğinden (resmi depodaki yerel OBB veya Pose modelleri gibi) yoksundur ve Ultralytics ekosistemi tarafından sağlanan sürekli bakım ve entegrasyon desteği seviyesinden faydalanmaz.
YOLOv10 hakkında daha fazla bilgi edinin.
Detaylı Teknik Karşılaştırma
Eğitim ve Optimizasyon
YOLO26, Büyük Dil Modeli (LLM) eğitiminden gelen kararlılık yeniliklerini bilgisayar görüşüne taşıyan hibrit bir yaklaşım olan MuSGD optimizatörünü tanıtır. Bu, standart optimizasyon tekniklerine dayanan YOLOv10 ile çelişir. Ek olarak, YOLO26, eğitim sırasında kayıp ağırlıklarını dinamik olarak ayarlamak için ProgLoss (Aşamalı Kayıp) kullanır ve eğitim ilerledikçe modelin daha zor örneklere odaklanmasını sağlar.
Çıkarım Hızı ve Dağıtım
Her iki model de NMS darboğazını ortadan kaldırarak uçtan uca çıkarım sunar. Ancak, YOLO26, CoreML veya TFLite dışa aktarımlarını genellikle karmaşıklaştıran DFL'yi kaldırarak bunu daha da ileriye taşır. Kıyaslamalar, YOLO26'nın CPU'larda %43'e kadar daha hızlı çıkarım sağladığını göstererek, yalnızca teorik GPU FLOP azaltımından ziyade pratik, gerçek dünya kenar dağıtımına odaklandığını vurgular.
Çok Yönlülük ve Ekosistem
Ultralytics YOLO26 sadece bir algılama modeli değil; bir platformdur. Kullanıcılar aynı API'yi kullanarak Segmentasyon, Duruş Tahmini ve OBB gibi görevler arasında sorunsuz bir şekilde geçiş yapabilirler.
from ultralytics import YOLO
# Load a YOLO26 model for different tasks
model_det = YOLO("yolo26n.pt") # Detection
model_seg = YOLO("yolo26n-seg.pt") # Segmentation
model_pose = YOLO("yolo26n-pose.pt") # Pose Estimation
# Run inference
results = model_det("image.jpg")
Buna karşılık, YOLOv10 öncelikli olarak nesne algılamaya odaklanmıştır ve bu karmaşık alt akış görevleri için sınırlı resmi desteğe sahiptir.
Neden Ultralytics YOLO26'yı Seçmelisiniz?
Geliştiriciler ve işletmeler için YOLO26 daha sağlam bir çözüm sunar:
- Kullanım Kolaylığı: Ultralytics Python API'si ve CLI'si, basitlik konusunda endüstri standartlarıdır. Eğitim, doğrulama ve dışa aktarma tek satırlık komutlardır.
- İyi Yönetilen Ekosistem: Ultralytics, sık güncellemeler, hata düzeltmeleri ve Discord ile GitHub'da gelişen bir topluluk sunar.
- Eğitim Verimliliği: Tüm görevler ve boyutlar için önceden eğitilmiş ağırlıkların mevcut olması sayesinde, transfer öğrenimi hızlı ve verimlidir; RT-DETR gibi transformatör tabanlı alternatiflere göre daha az GPU belleği gerektirir.
- Dağıtıma Hazır: OpenVINO, TensorRT ve ONNX dahil olmak üzere dışa aktarma formatları için kapsamlı destek, modelinizin her yerde çalışmasını sağlar.
Sonuç
While YOLOv10, NMS içermeyen YOLO mimarisine öncülük ederken, YOLO26 bu konsepti üretim için hazır bir güç merkezine dönüştürerek geliştirir ve genişletir. Üstün doğruluğu, özel kenar optimizasyonları ve kapsamlı görev desteği ile YOLO26, akıllı şehir analitiğinden tarımsal izlemeye kadar modern bilgisayar görüşü uygulamaları için önerilen seçimdir.
Keşfedilecek Diğer Modeller
Ultralytics ekosistemi içindeki diğer seçenekleri keşfetmek isterseniz, şunları düşünebilirsiniz:
- YOLO11: Güvenilir öncül, mükemmel genel amaçlı performans sunar.
- YOLO-World: Eğitim verilerinizde bulunmayan nesneleri detect etmeniz gereken açık-kelime algılama için.
- RT-DETR: Çıkarım hızının daha az kritik olduğu yüksek doğruluk senaryoları için transformatör tabanlı bir detectör.