YOLOv10 ve YOLO26: Uçtan Uca Nesne Algılamanın Evrimi
Bilgisayarlı görü dünyası son yıllarda, karmaşık ve işlem sonrası yoğunluklu mimarilerden, optimize edilmiş uçtan uca modellere geçişle birlikte dikkate değer ilerlemelere tanık oldu. Bu teknik karşılaştırma, bu yolculuktaki iki önemli kilometre taşını inceliyor: akademik bir atılım olan YOLOv10 ve kurumsal kullanıma hazır, en son teknoloji YOLO26. Mimarlarını, eğitim metodolojilerini ve gerçek dünya dağıtım yeteneklerini inceleyerek, bir sonraki vizyon yapay zeka uygulamanı oluştururken bilinçli kararlar alabilirsin.
YOLOv10: Uçtan Uca Nesne Algılamada Öncü
Yazarlar: Ao Wang, Hui Chen, Lihao Liu ve diğerleri. Kurum: Tsinghua University Tarih: 23-05-2024 Bağlantılar: arXiv Makalesi | GitHub Deposu
2024 yılının ortalarında yayınlanan YOLOv10, gerçek zamanlı nesne algılamadaki en kalıcı darboğazlardan biri olan NMS'yi (Non-Maximum Suppression) ele alarak akademik bilgisayarlı görü araştırmalarında önemli bir ileri atılımı temsil etti. Geleneksel nesne dedektörleri, gereksiz sınırlayıcı kutuları filtrelemek için büyük ölçüde NMS'ye güvenir, bu da çıkarım sırasında değişken gecikme süreleri ekler ve uç cihazlara dağıtımı karmaşıklaştırırdı.
Tsinghua Üniversitesi ekibi, NMS içermeyen eğitim için tutarlı bir ikili atama stratejisi sundu. Bu, modelin işlem sonrası bir filtreleme adımına ihtiyaç duymadan sınırlayıcı kutuları doğru bir şekilde tahmin etmesini sağlayarak, doğrudan çıkarım gecikmesini iyileştirdi ve donanım hızlandırıcılarına dağıtım önündeki engelleri düşürdü. Standart algılama görevleri için oldukça verimli olsa da, model öncelikli olarak sınırlayıcı kutu tahminine odaklandı ve örnek segmentasyonu veya poz tahmini gibi daha karmaşık görevler için yerel desteğe sahip değildi.
YOLOv10 hakkında daha fazla bilgi edinin
YOLO26: Uç Nokta ve Bulut Vizyon Yapay Zekası için Yeni Standart
Yazarlar: Glenn Jocher ve Jing Qiu Kurum: Ultralytics Tarih: 14-01-2026 Bağlantılar: GitHub Deposu | Ultralytics Platform
Daha önce öncülük edilen NMS içermeyen kavramlar üzerine inşa edilen, yeni yayınlanan YOLO26, performans ve çok yönlülüğün zirvesini temsil ediyor. Hem akademik araştırma hem de kurumsal düzeyde dağıtım için tasarlanmış olup, tüm desteklenen donanımlarda daha hızlı ve daha basit bir dağıtım için NMS sonrası işlemini tamamen ortadan kaldıran uçtan uca NMS içermeyen bir tasarım içerir.
YOLO26 birçok çığır açan mimari iyileştirme sunuyor. Distribution Focal Loss (DFL) kaldırılması, modelin dışa aktarma sürecini önemli ölçüde basitleştiriyor ve düşük güçlü uç cihazlarla uyumluluğunu artırıyor. Bu yapısal değişikliklerle birlikte YOLO26, %43'e kadar daha hızlı CPU çıkarımı elde ederek, GPU hızlandırmanın mevcut olmayabileceği IoT ve robotik uygulamaları için olağanüstü bir seçim haline geliyor.
Dahası, eğitim kararlılığı ve yakınsama hızı, LLM eğitim tekniklerinden esinlenen SGD ve Muon melezi olan MuSGD Optimizer kullanımıyla devrim yarattı. ProgLoss + STAL gibi gelişmiş kayıp fonksiyonlarıyla birleştiğinde, YOLO26 küçük nesne tanımada kayda değer iyileştirmeler sunar. Ayrıca segmentasyon için çok ölçekli prototipleme, poz tahmini için Residual Log-Likelihood Estimation (RLE) ve Oriented Bounding Box (OBB) algılamasındaki sınır sorunlarını çözmek için özel bir açı kaybı dahil olmak üzere göreve özel geliştirmeler sunar.
YOLO26 hakkında daha fazla bilgi edin
Bilgisayarlı görü iş akışlarını ölçeklendirmek isteyen ekipler için Ultralytics Platform, YOLO26 ile kesintisiz entegrasyon sağlayarak sezgisel veri etiketleme, otomatik bulut eğitimi ve kapsamlı MLOps altyapısı gerektirmeden tek tıkla dağıtım seçenekleri sunar.
Teknik Performans Karşılaştırması
Bu modelleri değerlendirirken doğruluk, model boyutu ve çıkarım hızı arasındaki denge kritiktir. Aşağıdaki tablo, her iki model ailesinin standart COCO dataset üzerinde değerlendirilen çeşitli ölçeklerdeki performansını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametre (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Veriler, yeni mimarinin evrimsel avantajını açıkça ortaya koyuyor. YOLO26, yüksek rekabetçi çıkarım hızlarını korurken tüm boyut kategorilerinde daha yüksek mAP (mean Average Precision) değerine ulaşıyor. YOLO26'daki DFL'nin kaldırılması, önceki nesillerin genellikle zorlandığı bir metrik olan olağanüstü CPU ONNX performansına doğrudan katkıda bulunuyor.
Eğitim Metodolojileri ve Ekosistem
Bir model, onu destekleyen ekosistem kadar kullanışlıdır. YOLOv10, PyTorch tabanlı mükemmel bir akademik uygulama sunsa da, temel algılamanın ötesindeki görevler için genellikle manuel yapılandırma gerektirir.
Buna karşılık YOLO26, iyi bakımı yapılan Ultralytics ekosistemine tamamen entegre edilmiştir. Bu, RT-DETR gibi transformer tabanlı modellere kıyasla eğitim sırasında önemli ölçüde daha düşük bellek gereksinimleri sağlayarak araştırmacıların tüketici sınıfı donanımlarda son teknoloji ağlar eğitmelerine olanak tanır. Kullanım kolaylığı benzersizdir ve veri artırma, hiperparametre ayarlama ve günlük kaydını otomatik olarak yöneten birleşik bir API sunar.
Kod Örneği: YOLO26 Eğitimi
Çok yönlü, oldukça doğru bir modeli eğitmek sadece birkaç satır Python kodu gerektirir:
from ultralytics import YOLO
# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with automatic memory management
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
)
# Export natively to TensorRT without NMS complexities
model.export(format="engine")Gerçek Dünya Uygulamaları ve Kullanım Durumları
Doğru mimariyi seçmek tamamen dağıtım kısıtlamalarına bağlıdır.
Yüksek Hızlı Uç Bilişim
Mikrodenetleyiciler, robotik veya eski mobil cihazlarda hızlı dağıtım gerektiren uygulamalar için, YOLO26'nın %43 daha hızlı CPU çıkarımı onu kesin tercih haline getiriyor. NMS içermeyen, DFL içermeyen mimarisi, akıllı şehir altyapısında gerçek zamanlı video analitiği için ideal olan OpenVINO ve TensorRT gibi formatlara sorunsuz bir şekilde dönüşür.
Gelişmiş Çok Görevli Vizyon
YOLOv10 saf sınırlayıcı kutu algılamada mükemmel olsa da, zengin görsel anlama gerektiren projeler YOLO26'ya güvenmelidir. Tıbbi görüntülemede instance segmentation işleminden spor analitiği için hassas pose estimation işlemine kadar, YOLO26 çeşitli alanlarda üstün doğruluk sağlayan göreve özel kayıp fonksiyonları sunar.
Projen sağlam bir açık kelime dağarcığı algılaması gerektiriyorsa, YOLO-World modelini keşfetmeyi düşün. Eski işlem hatlarını koruyan kullanıcılar için, YOLO11 Ultralytics çerçevesinde tam desteklenen ve güçlü bir alternatif olmaya devam etmektedir.
Kullanım Durumları ve Öneriler
YOLOv10 ve YOLO26 arasındaki seçim, projenin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerine bağlıdır.
Ne Zaman YOLOv10 Seçilmeli
YOLOv10 şunlar için güçlü bir seçimdir:
- NMS-Free Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Takasları: Çeşitli model ölçeklerinde çıkarım hızı ile algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
- Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.
Ne Zaman YOLO26 Seçilmeli
YOLO26 şunlar için önerilir:
- NMS-Free Uç Dağıtımı: Non-Maximum Suppression işlem sonrası zorluğu olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Sadece CPU Ortamları: Özel GPU hızlandırması olmayan, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımının belirleyici bir avantaj sağladığı cihazlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Sonuç
YOLOv10'dan YOLO26'ya geçiş, akademik kavram kanıtından üretime hazır kurumsal çözümlere giden kritik bir değişimi vurgular. Öncü NMS içermeyen tasarımı benimseyerek ve onu MuSGD optimize edici, ProgLoss ve kolaylaştırılmış uç uyumluluğu ile geliştirerek YOLO26, gerçek zamanlı bilgisayarlı görüde mümkün olanlar için yeni bir kıyaslama belirliyor. Hız, doğruluk ve kullanılabilirlik açısından en iyi dengeyi sağlamayı hedefleyen geliştiriciler için YOLO26, nihai öneri olarak öne çıkıyor.