YOLOv10'a Karşı YOLO26: Uçtan Uca Nesne Tespitinin Evrimi
Bilgisayar görüşü alanı son yıllarda önemli ilerlemelere tanık oldu; karmaşık, işlem sonrası ağırlıklı mimarilerden daha akıcı, uçtan uca modellere doğru bir kayış yaşandı. Bu teknik karşılaştırma, bu yolculuktaki iki önemli dönüm noktasına odaklanmaktadır: YOLOv10'un akademik atılımı ve son teknoloji, kurumsal kullanıma hazır YOLO26. Mimari yapılarını, eğitim metodolojilerini ve gerçek dünya dağıtım yeteneklerini inceleyerek, geliştiriciler bir sonraki görsel yapay zeka uygulamalarını oluştururken bilinçli kararlar verebilirler.
YOLOv10: Uçtan Uca Nesne Algılamada Öncü
Yazarlar: Ao Wang, Hui Chen, Lihao Liu, vd.
Kuruluş: Tsinghua Üniversitesi
Tarih: 2024-05-23
Bağlantılar: arXiv Makalesi | GitHub Deposu
2024 ortalarında piyasaya sürülen YOLOv10, gerçek zamanlı nesne tespitindeki en kalıcı darboğazlardan biri olan Non-Maximum Suppression (NMS) sorununu ele alarak akademik bilgisayar görüşü araştırmalarında önemli bir ilerlemeyi temsil etti. Geleneksel nesne dedektörleri, gereksiz sınırlayıcı kutuları filtrelemek için NMS'ye büyük ölçüde güveniyordu, bu da çıkarım sırasında değişken gecikme ekliyor ve kenar dağıtımını karmaşıklaştırıyordu.
Tsinghua Üniversitesi ekibi, NMS'siz eğitim için tutarlı bir ikili atama stratejisi tanıttı. Bu, modelin bir son işleme filtreleme adımı gerektirmeden sınırlayıcı kutuları doğru bir şekilde tahmin etmesini sağlayarak çıkarım gecikmesini doğrudan iyileştirdi ve donanım hızlandırıcılarda dağıtım için engeli düşürdü. Standart tespit görevleri için oldukça verimli olsa da, model öncelikli olarak sınırlayıcı kutu tahminine odaklandı ve örnek segmentasyon veya poz tahmini gibi daha karmaşık görevler için yerel desteğe sahip değildi.
YOLOv10 hakkında daha fazla bilgi edinin.
YOLO26: Kenar ve Bulut Görsel Yapay Zeka için Yeni Standart
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2026-01-14
Bağlantılar: GitHub Deposu | Ultralytics Platformu
Daha önce öncülük edilen NMS'siz konseptler üzerine inşa edilen yeni piyasaya sürülen YOLO26, performans ve çok yönlülüğün zirvesini temsil ediyor. Hem akademik araştırma hem de kurumsal düzeyde dağıtım için tasarlanan bu model, tüm desteklenen donanımlarda daha hızlı ve daha basit dağıtım için NMS son işlemesini tamamen ortadan kaldıran uçtan uca NMS'siz bir tasarımı doğal olarak bünyesinde barındırıyor.
YOLO26, çığır açan birçok mimari iyileştirme sunuyor. Distribution Focal Loss (DFL) kaldırılması, modelin dışa aktarma sürecini önemli ölçüde basitleştiriyor ve düşük güçlü kenar cihazlarla uyumluluğu artırıyor. Bu yapısal değişikliklerle birlikte YOLO26, %43'e kadar daha hızlı CPU çıkarımı sağlıyor, bu da onu GPU hızlandırmasının mevcut olmayabileceği IoT ve robotik uygulamalar için istisnai bir seçenek haline getiriyor.
Ayrıca, LLM eğitim tekniklerinden esinlenen SGD ve Muon'un bir hibriti olan MuSGD Optimize Edici kullanımıyla eğitim kararlılığı ve yakınsama hızı devrim niteliğinde değişti. ProgLoss + STAL gibi gelişmiş kayıp fonksiyonlarıyla birleştiğinde, YOLO26 küçük nesne tanımada kayda değer iyileştirmeler sunuyor. Ayrıca, segmentasyon için çok ölçekli prototipleme, poz tahmini için Residual Log-Likelihood Estimation (RLE) ve Oriented Bounding Box (OBB) tespitindeki sınır sorunlarını çözmek için özel bir açı kaybı dahil olmak üzere göreve özel iyileştirmeler de getiriyor.
YOLO26 hakkında daha fazla bilgi edinin
Kurumsal Dağıtım
Bilgisayar görüşü iş akışlarını ölçeklendirmek isteyen ekipler için Ultralytics Platformu, kapsamlı MLOps altyapısı gerektirmeden sezgisel veri etiketleme, otomatik bulut eğitimi ve tek tıklamayla dağıtım seçenekleri sunarak YOLO26 ile sorunsuz entegrasyon sağlıyor.
Teknik Performans Karşılaştırması
Bu modelleri değerlendirirken doğruluk, model boyutu ve çıkarım hızı arasındaki denge kritiktir. Aşağıdaki tablo, standart COCO veri kümesi üzerinde değerlendirilen her iki model ailesinin çeşitli ölçeklerdeki performansını vurgulamaktadır.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Veriler, yeni mimarinin evrimsel avantajını açıkça göstermektedir. YOLO26, tüm boyut katmanlarında daha yüksek mAP (ortalama Ortalama Hassasiyet) elde ederken, oldukça rekabetçi çıkarım hızlarını da korur. YOLO26'daki DFL'nin kaldırılması, özellikle önceki nesillerin sıklıkla zorlandığı bir metrik olan olağanüstü CPU ONNX performansına katkıda bulunur.
Eğitim Metodolojileri ve Ekosistem
Bir model, onu destekleyen ekosistem kadar kullanışlıdır. YOLOv10, PyTorch tabanlı mükemmel bir akademik uygulama sunsa da, temel tespitin ötesindeki görevler için genellikle manuel yapılandırma gerektirir.
Buna karşılık, YOLO26, iyi yönetilen Ultralytics ekosistemine tamamen entegredir. Bu, RT-DETR gibi dönüştürücü tabanlı modellere kıyasla eğitim sırasında önemli ölçüde daha düşük bellek gereksinimleri sağlayarak araştırmacıların tüketici sınıfı donanımlarda son teknoloji ağları eğitmesine olanak tanır. Kullanım kolaylığı benzersizdir; veri artırma, hiperparametre ayarlama ve günlük kaydını otomatik olarak yöneten birleşik bir API sunar.
Kod Örneği: YOLO26 Eğitimi
Çok yönlü, yüksek doğrulukta bir model eğitmek yalnızca birkaç satır Python kodu gerektirir:
from ultralytics import YOLO
# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with automatic memory management
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
)
# Export natively to TensorRT without NMS complexities
model.export(format="engine")
Gerçek Dünya Uygulamaları ve Kullanım Senaryoları
Doğru mimariyi seçmek tamamen dağıtım kısıtlamalarına bağlıdır.
Yüksek Hızlı Kenar Hesaplama
Mikrodenetleyiciler, robotik veya eski mobil cihazlarda hızlı dağıtım gerektiren uygulamalar için YOLO26'nın %43 daha hızlı CPU çıkarımı onu kesin bir seçim haline getiriyor. NMS'siz, DFL'siz mimarisi, akıllı şehir altyapısında gerçek zamanlı video analizi için ideal olan OpenVINO ve TensorRT gibi formatlara sorunsuz bir şekilde dönüştürülebilir.
Gelişmiş Çok Görevli Görüş
YOLOv10 saf sınırlayıcı kutu tespitinde üstün olsa da, zengin görsel anlama gerektiren projeler YOLO26'ya güvenmelidir. Tıbbi görüntülemede örnek segmentasyondan spor analizi için hassas poz tahminine kadar, YOLO26 çeşitli alanlarda üstün doğruluk garantisi veren göreve özel kayıp fonksiyonları sunar.
Alternatif Seçenekler
Projeniz sağlam açık kelime tespitini gerektiriyorsa, YOLO-World'ü keşfetmeyi düşünebilirsiniz. Eski iş akışlarını sürdüren kullanıcılar için YOLO11, Ultralytics çerçevesinde tam destekli ve güçlü bir alternatif olmaya devam ediyor.
Kullanım Durumları ve Öneriler
YOLOv10 ve YOLO26 arasında seçim yapmak, projenizin özel gereksinimlerine, dağıtım kısıtlamalarına ve ekosistem tercihlerinize bağlıdır.
YOLOv10 Ne Zaman Tercih Edilmeli?
YOLOv10 için güçlü bir seçenektir:
- NMS-Serbest Gerçek Zamanlı Algılama: Non-Maximum Suppression olmadan uçtan uca algılamadan faydalanan, dağıtım karmaşıklığını azaltan uygulamalar.
- Dengeli Hız-Doğruluk Dengelemeleri: Çeşitli model ölçeklerinde çıkarım hızı ve algılama doğruluğu arasında güçlü bir denge gerektiren projeler.
- Tutarlı Gecikme Süreli Uygulamalar: Tahmin edilebilir çıkarım sürelerinin kritik olduğu dağıtım senaryoları, örneğin robotik veya otonom sistemler.
YOLO26 Ne Zaman Seçilmeli
YOLO26 şunlar için önerilir:
- NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
- Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
- Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.
Sonuç
YOLOv10'dan YOLO26'ya geçiş, akademik konsept kanıtından üretime hazır kurumsal çözümlere doğru önemli bir değişimi vurgulamaktadır. Öncü NMS'siz tasarımı benimseyerek ve MuSGD optimize edici, ProgLoss ve kolaylaştırılmış kenar uyumluluğu ile geliştirerek, YOLO26 gerçek zamanlı bilgisayar görüşünde nelerin mümkün olduğuna dair yeni bir ölçüt belirliyor. Hız, doğruluk ve kullanılabilirliğin en iyi dengesini hedefleyen geliştiriciler için YOLO26 nihai öneri olarak öne çıkıyor.