YOLOv7 vs YOLO26: Gerçek Zamanlı Nesne Algılamada Nesiller Arası Bir Sıçrama
Bilgisayar görüşünün evrimi önemli kilometre taşlarıyla işaretlenmiştir ve eski mimarileri modern, son teknoloji modellerle karşılaştırmak ML Mühendisleri için değerli içgörüler sağlar. Bu teknik karşılaştırma, son derece etkili YOLOv7 ile devrim niteliğindeki Ultralytics YOLO26 arasındaki farkları derinlemesine incelerken, mimari, eğitim metodolojileri ve dağıtım verimliliğindeki gelişmeleri vurgulamaktadır.
YOLOv7: "Bag-of-Freebies" Öncüsü
2022 ortalarında tanıtılan YOLOv7, çıkarım maliyetini artırmadan doğruluğu iyileştiren birkaç mimari optimizasyon sunarak GPU donanımında mümkün olanın sınırlarını zorladı.
Model Detayları
- Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy ve Hong-Yuan Mark Liao
- Kuruluş:Institute of Information Science, Academia Sinica
- Tarih: 2022-07-06
- Arxiv:2207.02696
- GitHub:WongKinYiu/yolov7
- Belgeler:Ultralytics YOLOv7 Belgeleri
YOLOv7, yeniden parametrelendirme tekniklerini ve genişletilmiş verimli katman toplama ağlarını (E-ELAN) yoğun bir şekilde kullanan eğitilebilir "bag-of-freebies" kavramını tanıttı. Bu, modelin daha çeşitli özellikler öğrenmesine ve orijinal gradyan yolunu bozmadan ağın öğrenme yeteneğini sürekli olarak geliştirmesine olanak tanıdı. O zamanlar COCO üzerinde etkileyici bir son teknoloji benchmark elde etse de, mimarisi hala çapa tabanlı çıktılara yoğun bir şekilde bağımlıdır ve dağıtım sırasında gecikme darboğazları oluşturabilen karmaşık Non-Maximum Suppression (NMS) son işlemi gerektirir.
YOLOv7 hakkında daha fazla bilgi edinin.
YOLO26: Uç Odaklı Görüntü İşleme Yapay Zeka Standardı
Ocak 2026'da piyasaya sürülen Ultralytics YOLO26, algılama hattını tamamen yeniden düşünerek dağıtım kolaylığını, eğitim kararlılığını ve donanım verimliliğini önceliklendiren bir paradigma değişimini temsil etmektedir.
Model Detayları
- Yazarlar: Glenn Jocher ve Jing Qiu
- Kuruluş:Ultralytics
- Tarih: 2026-01-14
- GitHub:ultralytics/ultralytics
- Platform:Ultralytics YOLO26 Platformda
YOLO26, modern mühendislik zorluklarını çözmek için sıfırdan inşa edilmiştir. Mimarisi, seleflerini önemli ölçüde geride bırakan birkaç kritik yenilik getiriyor:
- Uçtan Uca NMS'siz Tasarım: YOLO26, NMS son işlemeyi yerel olarak ortadan kaldırır; bu, ilk olarak YOLOv10'da öncülük edilen çığır açan bir yaklaşımdır. Bu, daha hızlı, çok daha basit bir dağıtım hattı sağlar ve genellikle kalabalık sahnelerin neden olduğu değişken gecikmeyi önler.
- DFL Kaldırma: Distribution Focal Loss (DFL) kaldırılmasıyla model, dışa aktarım için radikal bir şekilde basitleştirilmiş olup, kenar cihazlar ve düşük güçlü IoT donanımlarıyla çok daha iyi uyumluluk sunar.
- %43'e Kadar Daha Hızlı CPU Çıkarımı: Mimari basitleştirmeler ve yapısal budama sayesinde YOLO26, kenar bilişim ve özel GPU'ları olmayan cihazlar için özel olarak optimize edilmiş olup, standart işlemcilerde eski mimarileri kolayca geride bırakır.
- MuSGD Optimizatörü: Büyük dil modeli eğitim tekniklerinden (özellikle Moonshot AI'ın Kimi K2'sinden) esinlenilen YOLO26, Stochastic Gradient Descent ve Muon'un bir melezi olan MuSGD optimizatörünü kullanır. Bu, bilgisayar görüşü görevlerine eşsiz eğitim kararlılığı ve çok daha hızlı yakınsama sağlar.
- ProgLoss + STAL: Bu gelişmiş kayıp fonksiyonlarının tanıtılması, hava görüntüleme, robotik ve otomatik kalite denetimi için kritik olan küçük nesne tanımada önemli iyileşmeler sağlar.
- Göreve Özel İyileştirmeler: Standart nesne algılama'nın ötesinde, YOLO26; segmentasyon görevleri için çok ölçekli proto ve özel semantik segmentasyon kaybı, poz tahmini için Residual Log-Likelihood Estimation (RLE) ve Oriented Bounding Boxes (OBB)'daki sınır sorunlarını çözmek için özel açı kaybı algoritmaları sunar.
YOLO26 hakkında daha fazla bilgi edinin
YOLO26'ya Geçiş
Eski bir mimariden YOLO26'ya yükseltme, Python kodunuzdaki model dizesini şuna değiştirmek kadar basittir: yolo26n.pt. Ultralytics paketi, otomatik ağırlık indirmeleri ve yapılandırma ölçeklendirmesi dahil olmak üzere tüm geçişi yönetir.
Performans ve Metrik Karşılaştırması
Hesaplama ayak izini karşılaştırırken, YOLO26 performans ve bellek gereksinimlerini dengelemede açık bir üstünlük sergiler. Transformer tabanlı modeller veya eski ağır mimariler genellikle büyük CUDA bellek tahsisleri gerektirirken, YOLO26 tüketici sınıfı GPU'larda verimli bir şekilde eğitilir.
| Model | boyut (piksel) | mAPval 50-95 | Hız CPU ONNX (ms) | Hız T4 TensorRT10 (ms) | parametreler (M) | FLOP'lar (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Yukarıda görüldüğü gibi, YOLO26m modeli, devasa YOLOv7x, ancak bunu parametrelerin üçte birinden daha azıyla (20.4M'ye karşı 71.3M) ve inanılmaz hızlı çıkarım süreleriyle yapar. TensorRT.
Ultralytics Ekosisteminin Avantajı
Eski modelleri dağıtmak genellikle karmaşık üçüncü taraf depoları, bağımlılık cehennemi ve manuel dışa aktarım betikleriyle uğraşmayı gerektirir. Buna karşılık, Ultralytics Platformu, tüm makine öğrenimi yaşam döngüsünü kolaylaştıran, iyi yönetilen, uyumlu bir ekosistem sunar.
- Kullanım Kolaylığı: Sezgisel bir Python API'si ve kapsamlı belgelerle, modelleri dakikalar içinde açıklayabilir, eğitebilir ve dağıtabilirsiniz. ONNX veya CoreML gibi formatlara dışa aktarım yalnızca tek bir kod satırı gerektirir.
- Bellek Gereksinimleri: Ultralytics modelleri, düşük bellek kullanımlarıyla ünlüdür. Bazı hantal vizyon transformatörlerinin aksine, YOLO26, bellek yetersizliği (OOM) hatalarına takılmadan standart donanımlarda kolayca ince ayar yapılabilir.
- Çok Yönlülük: YOLOv7 öncelikli olarak bir nesne algılayıcı iken (diğer görevler için bazı deneysel dalları olsa da), YOLO26; algılama, sınıflandırma, track, poz ve OBB'yi eşit yeterlilikle ele alan yerel olarak birleşik bir çerçevedir.
Diğer Ultralytics Modelleri
YOLO26 önerilen standart olsa da, eski sistemleri taşıyan geliştiriciler, uzun vadeli destek projeleri için mükemmel kararlılık sunan Ultralytics serisindeki bir diğer oldukça yetenekli nesil olan YOLO11'i de keşfedebilirler.
Kod Örneği: Eğitim ve Dağıtım
Aşağıdaki örnek, ultralytics paketinin zarif basitliğini göstermektedir. Eski modeller için uzun komut satırı argümanları çağırmaya kıyasla arayüzün ne kadar temiz olduğuna dikkat edin.
from ultralytics import YOLO
# Load the lightweight YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model efficiently on a dataset (e.g., COCO8)
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
batch=32, # Efficient memory usage allows larger batch sizes
device=0,
)
# Run an NMS-free, end-to-end inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export directly to ONNX for edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to: {export_path}")
Gerçek Dünya Kullanım Durumları
Doğru mimariyi seçmek tamamen üretim kısıtlamalarınıza bağlıdır.
YOLOv7 Ne Zaman Düşünülmeli: YOLOv7, 2022 standartlarına karşı akademik karşılaştırmalar için değerli bir araç olmaya devam etmektedir. Altyapınız, YOLOv7'nin belirli anchor çıktılarına sıkıca kodlanmış derin eski CUDA işlem hatlarını yoğun bir şekilde kullanıyorsa ve yeniden düzenleme için kaynak ayıramıyorsanız, sağlam bir temel algılayıcı olarak işlev görmeye devam edecektir.
YOLO26 Ne Zaman Seçilmeli: Herhangi yeni bir proje için YOLO26 kesin tercihtir. NMS'siz mimarisi, düşük gecikmeli otonom navigasyon ve gerçek zamanlı güvenlik sistemleri için mükemmeldir. DFL'nin kaldırılması ve büyük CPU hız artışları, onu Raspberry Pi veya tüketici elektroniği içinde dağıtım gibi kenar AI dağıtımları için tartışmasız şampiyon yapar. Ayrıca, ProgLoss + STAL iyileştirmeleri, üretim kalite güvencesi veya uydu görüntülemede küçük anormallikleri tespit etmede oldukça yetenekli hale getirir.
Sonuç olarak, YOLO26, açık kaynak topluluğunun kapsamlı desteğiyle desteklenen, doğruluk, hız ve basitliğin eşsiz bir karışımını geliştiricilere sunar.