YOLO26 ve YOLOv7: Bilgisayar Görüşünde Nesiller Arası Bir Sıçrama

Nesne algılama alanı, son on yılda hızlı bir gelişme göstermiş ve YOLO You Only Look Once) ailesi, gerçek zamanlı performans konusunda sürekli olarak öncülük etmiştir. Bu serideki iki önemli dönüm noktası şunlardır YOLOv7ve 2026'nın başlarında piyasaya sürülen son teknoloji ürünü YOLO26'dır. YOLOv7 , çıkarım maliyetini artırmadan eğitimi optimize etmek için "bag-of-freebies" kavramını YOLOv7 , YOLO26 uçtan uca NMS mimarisi ve CPU tasarımıyla bir paradigma değişikliğini temsil etmektedir.

Bu kılavuz, geliştiricilerin, araştırmacıların ve mühendislerin, ister üst düzey GPU'ları ister kaynak kısıtlı uç cihazları hedefliyor olsunlar, özel dağıtım ihtiyaçlarına uygun modeli seçmelerine yardımcı olmak için ayrıntılı bir teknik karşılaştırma sunar.

Model Genel Bakış ve Yazarlık

Bu modellerin kökenini anlamak, mimari kararlarını ve amaçlanan kullanım durumlarını bağlam içine yerleştirmemize yardımcı olur.

YOLO26

YOLO26, Ultralytics dağıtım karmaşıklığı ve uç gecikme süresi gibi kalıcı sorunları çözmek için tasarladığı en son sürümüdür. Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldıran uçtan uca (E2E) bir boru hattı sunarak, eğitimden üretime kadar olan süreci önemli ölçüde kolaylaştırır.

Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 14 Ocak 2026
Anahtar Yenilik: NMS uçtan uca algılama, MuSGD optimize edici ve CPU optimizasyon.

YOLO26 hakkında daha fazla bilgi edinin

YOLOv7

YOLOv7 , eğitim sırasında doğruluğu artırırken tahmin sırasında ek maliyet getirmeyen, eğitilebilir "bag-of-freebies" optimizasyon yöntemlerine odaklanan çığır açan bir sürümdü. 2022 yılında gerçek zamanlı nesne algılayıcılar için yeni ve en gelişmiş kriterler belirledi.

Yazarlar: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica
Tarih: 6 Temmuz 2022
Arxiv:YOLOv7: Eğitilebilir ücretsiz ekstralar, yeniState-of-the-art belirliyor
Anahtar Yenilik: E-ELAN yeniden parametreleştirme ve bileşik ölçeklendirme.

YOLOv7 hakkında daha fazla bilgi edinin.

Mimari Karşılaştırma

YOLO26 ve YOLOv7 arasındaki mimari farklılıklar, hız, doğruluk ve dağıtım kolaylığı açısından her birinin güçlü yönlerini YOLOv7 .

YOLO26: Uçtan Uca Devrim

YOLO26, uçtan uca NMS tasarım benimseyerek algılama sürecini temelden değiştirir. YOLOv7 dahil olmak üzere geleneksel algılayıcılar, Non-Maximum Suppression (NMS) kullanılarak filtrelenmesi gereken binlerce aday kutu üretir. Bu son işlem adımı genellikle yavaştır, hiperparametrelerden etkilenir ve FPGA veya NPU gibi özel donanımlara uygulanması zordur.

YOLO26, eğitim sırasında bire bir eşleştirmeyi öğrenerek NMS ortadan kaldırır. Dağıtım Odak Kaybı (DFL) özelliğinin kaldırılmasıyla birleştiğinde, bu durum ONNX veya TensorRTgibi formatlara aktarılması çok daha kolay bir model yapısı ortaya çıkar. Ayrıca YOLO26, SGD Muon'un (LLM eğitiminden esinlenerek) bir karışımı olan MuSGD Optimizer'ı kullanarak, yeni mimarisiyle bile istikrarlı bir yakınsama sağlar.

YOLOv7: Bag-of-Freebies ve E-ELAN

YOLOv7 , Genişletilmiş Verimli Katman Toplama Ağları (E-ELAN) aracılığıyla mimari verimliliğe YOLOv7 . Bu tasarım, en kısa ve en uzun gradyan yollarını kontrol ederek ağın daha çeşitli özellikleri öğrenmesini sağlar. Karmaşık bir eğitim yapısının basitleştirilmiş bir çıkarım yapısına dönüştürüldüğü yeniden parametreleştirme tekniklerine büyük ölçüde dayanır. GPU için oldukça etkili olan bu yaklaşım, NMS bağımlılığı korur ve bu da CPU veya nesne yoğunluğunun çok yüksek olduğu durumlarda bir darboğaz oluşturabilir.

Neden NMS'siz Olması Önemli

Kenar cihazlarda, NMS genellikle etkili bir şekilde paralel hale getirilemez. YOLO26, bunu ortadan kaldırarak, çapa tabanlı önceki sürümlerine kıyasla CPU'larda %43'e varan daha hızlı çıkarım elde eder ve bu da onu Raspberry Pi, cep telefonları ve IoT sensörleri için üstün bir seçim haline getirir.

Performans Metrikleri

Aşağıdaki tablo, YOLO26'nın YOLOv7 göre performansındaki iyileşmeleri göstermektedir. YOLOv7 , üst düzey GPU'larda güçlü bir rakip YOLOv7 , YOLO26 verimlilik, model boyutu ve CPU açısından üstünlük sağlamaktadır.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv7l	640	51.4	-	6.84	36.9	104.7
YOLOv7x	640	53.1	-	11.57	71.3	189.9

Önemli Çıkarımlar:

Verimlilik: YOLO26l modeli, %32 daha az parametre ve %17 daha az FLOP kullanarak YOLOv7l modelinden +3,6 mAP daha iyi performans gösterir.
Hız: YOLO26n (Nano), CPU yaklaşık 40 ms'de çalışan, kenar AI için inanılmaz bir giriş noktası sunar. Bu, NMS nedeniyle YOLOv7 mimarisinin kolayca eşleşemeyeceği bir metriktir.
Doğruluk: Üst düzeyde, YOLO26x sınırı 57,5 mAP çıkararak YOLOv7x'in 53,1 mAP önemli ölçüde daha yüksek bir değer elde eder.

Kullanım Alanları ve Uygulamalar

Bu modeller arasında seçim yapmak genellikle dağıtım ortamına ve uygulamanın özel gereksinimlerine bağlıdır.

YOLO26 Ne Zaman Seçilmeli

YOLO26, çoğu modern bilgisayar görme projesi için, özellikle aşağıdakileri önceliklendirenler için önerilen seçimdir:

Edge Computing: %43'e varan daha hızlı CPU , Raspberry Pi veya NVIDIA Nano gibi cihazlarda üstün performans gösterir.
Basitleştirilmiş Dağıtım: NMS tasarım, CoreML (iOS) veya TFLite Android) dışa aktarımını sorunsuz hale getirir ve yaygın operatör destek sorunlarını ortadan kaldırır.
Küçük Nesne Algılama: Geliştirilmiş ProgLoss + STAL kayıp fonksiyonları, hava görüntüleri analizi ve drone denetimleri için çok önemli olan küçük nesnelerin algılanmasında kayda değer kazançlar sağlar.
Çeşitli Görevler: Algılama ötesinde, YOLO26 doğal olarak poz tahmini, örnek segmentasyonu ve Yönlendirilmiş Sınırlayıcı Kutular (OBB) destekler.

YOLOv7 Ne Zaman Dikkate Alınmalı

YOLOv7 , "bag-of-freebies" metodolojisinin araştırmanın odak noktası olduğu eski sistemler veya belirli araştırma kriterleri için YOLOv7 geçerliliğini YOLOv7 .

Eski GPU : Bir sistem, yüksek kaliteli YOLOv7 (V100 veya A100 gibi) YOLOv7 belirli bağlantı noktası tabanlı çıktıları için zaten büyük ölçüde optimize edilmişse, geçiş gecikebilir.
Akademik Araştırma: Gradyan yol optimizasyonu ve yeniden parametreleştirmenin etkilerini inceleyen araştırmacılar genellikle YOLOv7 temel referans YOLOv7 kullanır.

Ultralytics Ekosisteminin Avantajı

YOLO26'yı benimsemenin en ikna edici nedenlerinden biri, Ultralytics derinlemesine entegre olmasıdır. Bağımsız depolardan farklı olarak, Ultralytics birleşik, iyi bakımlı bir platformdan yararlanır.

Kullanım Kolaylığı: "Sıfırdan kahramana" felsefesi, kurulumdan eğitime dakikalar içinde geçebileceğiniz anlamına gelir. Python , sürümler arasında tutarlıdır, bu nedenle YOLOv8 'den YOLO26'ya yükseltmek için sadece bir dizeyi değiştirmeniz yeterlidir.
E CUDA itim Verimliliği: Ultralytics , transformatör tabanlı alternatiflere ( RT-DETR) daha hızlı eğitilmek ve daha az CUDA belleği kullanmak üzere optimize edilmiştir. Bu, tüketici GPU'larında daha büyük parti boyutlarına olanak tanır.
Ultralytics : Kullanıcılar, Ultralytics kullanarak veri kümelerini görselleştirebilir, bulutta modeller oluşturabilir ve tek bir tıklama ile dağıtım yapabilir.

Kod Örneği: Eğitim ve Çıkarım

Aşağıdaki kod, Ultralytics kullanarak en son YOLO26 modelini yüklemeyi ve eğitmeyi gösterir. API, karmaşık kurulumları soyutlayarak, yeni başlayanlar için bile erişilebilir hale getirir.

from ultralytics import YOLO

# Load the latest YOLO26 model (recommended for new projects)
# The 'n' suffix denotes the Nano version, optimized for speed.
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The system automatically handles dataset downloads and configuration.
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a sample image
# The NMS-free output ensures fast and clean results.
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the results
predictions[0].show()

Sonuç

YOLOv7 nesne algılama tarihinde önemli bir dönüm noktası YOLOv7 da, YOLO26 geleceği temsil ediyor. Uçtan uca mimarisi, mAP gecikme gibi performans ölçütlerini iyileştirmekle kalmaz, aynı zamanda geliştiriciler için dağıtım iş akışını da temelinden basitleştirir. NMS bağımlılığı ortadan kaldırarak NMS CPU kenar ortamları için büyük ölçüde optimize ederek, YOLO26, otonom araçlardan akıllı şehir analizlerine kadar gerçek dünya uygulamaları için en son teknoloji bilgisayar görüşünün erişilebilir, verimli ve yeterince çok yönlü olmasını sağlar.

Diğer modern mimarileri keşfetmek isteyenler için, belgeler ayrıca şunları da kapsamaktadır YOLO11 ve YOLOv10'yi de ele almaktadır. Bu mimariler, görsel yapay zekanın sürekli gelişiminde farklı ödünleşimler sunmaktadır.