YOLO26 ve YOLOv9: Gerçek Zamanlı Nesne Algılamada Bir Sonraki Evrim

Nesne algılama mimarilerinin evrimi, hız, doğruluk ve verimlilik için sürekli bir çabayla şekillenmiştir. YOLO26 ile YOLOv9 karşılaştırıldığında bu hızlı ilerleme daha da belirgin hale gelmektedir. YOLOv9 , programlanabilir gradyanlarla bilgi saklama sınırlarını YOLOv9 , daha yeni olan YOLO26, uç performans ve büyük CPU için özel olarak optimize edilmiş uçtan uca, NMS bir mimariyle manzarayı yeniden tanımlamaktadır.

Modele Genel Bakış

YOLO26

YOLO26, 2026 yılının başlarında görme yapay zekası alanında en son teknolojiyi temsil etmektedir. Geliştiren Ultralyticstarafından geliştirilen bu teknoloji, Non-Maximum Suppression (NMS) ihtiyacını ortadan kaldıran ve dağıtım süreçlerini kolaylaştıran yerel bir uçtan uca tasarım sunar. Distribution Focal Loss (DFL) özelliğini kaldırarak ve LLM eğitiminden esinlenerek SGD Muon'un birleşiminden oluşan yeni MuSGD optimizer'ıentegre ederek, YOLO26 en üst düzey doğruluğu korurken CPU %43'e kadar artırır.

Yazarlar: Glenn Jocher, Jing Qiu
Kuruluş:Ultralytics
Tarih: 14 Ocak 2026
Ana Özellik: NMS Uçtan Uca Algılama, MuSGD Optimize Edici, ProgLoss + STAL
GitHub:Ultralytics Deposu

YOLO26 hakkında daha fazla bilgi edinin

YOLOv9

2024 yılının başında piyasaya sürülen YOLOv9 , Programlanabilir Gradyan Bilgisi (PGI) ve GELAN mimarisi kavramlarını tanıttı. Bu yenilikler, derin ağlardaki "bilgi darboğazı" sorununu çözerek, ileri besleme sürecinde kritik verilerin kaybolmamasını sağladı. Özellikle yüksek parametre verimliliği gerektiren araştırma uygulamaları için güçlü bir model olmaya devam ediyor.

Yazarlar: Chien-Yao Wang, Hong-Yuan Mark Liao
Kuruluş: Bilgi Bilimi Enstitüsü, Academia Sinica
Tarih: 21 Şubat 2024
Ana Özellik: Programlanabilir Gradyan Bilgisi (PGI), GELAN Mimarisi
Arxiv:YOLOv9
GitHub:YOLOv9 Deposu

YOLOv9 hakkında daha fazla bilgi edinin.

Teknik Mimari Karşılaştırması

Bu iki model arasındaki mimari farklılık, teorik bilgi akışı optimizasyonundan pratik dağıtım verimliliğine doğru bir geçişi ifade etmektedir.

YOLO26: Verimlilik ve Kenar Öncelikli Tasarım

YOLO26, son işlem ve kayıp hesaplamasının hesaplama yükünü azaltmaya odaklanmaktadır.

Uçtan uca NMS: NMS gerektiren yedekli sınır kutuları üreten geleneksel dedektörlerin aksine, YOLO26 nesnelerin tam kümesini doğrudan tahmin eder. Bu, gecikme varyansını azaltır ve karmaşık özel NMS artık ihtiyaç duyulmadığından ONNX TensorRT gibi formatlara aktarımı basitleştirir.
ProgLoss + STAL: Progressive Loss ve Soft-Target Anchor Labeling'in kullanıma sunulması, drone görüntüleme ve robotik inceleme için kritik bir gereklilik olan küçük nesne algılamayı önemli ölçüde iyileştirir.
MuSGD Optimizer: Büyük Dil Modeli eğitiminden bilgisayar görüşüne yenilikler getiren bu hibrit optimizer, eğitim momentumunu stabilize ederek daha az hiperparametre ayarlamasıyla daha hızlı yakınsama sağlar.

YOLOv9: Bilgi Saklama

YOLOv9 mimarisi, derin ağlarda kaybolan bilgi sorununu çözmek üzerine kurulmuştur.

PGI (Programlanabilir Gradyan Bilgisi): Yardımcı bir denetim dalı, ağ ağırlıklarını güncellemek için güvenilir gradyanlar oluşturur ve derin katmanların anlamsal bilgileri korumasını sağlar.
GELAN (Genelleştirilmiş Verimli Katman Toplama Ağı): Bu backbone , parametre kullanımını backbone YOLOv9 bazı öncüllerinden daha az parametre ile yüksek doğruluk YOLOv9 sağlar, ancak genellikle sadeleştirilmiş YOLO26'ya kıyasla daha yüksek hesaplama karmaşıklığı (FLOP) maliyetine sahiptir.

Dağıtım Kolaylığı

NMS kaldırılması, kenar dağıtımı için bir dönüm noktasıdır. YOLOv9 gibi eski modellerde, model GPU üzerinde çalışsa CPU NMS CPU üzerinde çalışır ve bu da bir darboğaz oluşturur. YOLO26'nın çıktısı hemen kullanıma hazırdır, bu da onu Raspberry Pi ve mobil cihazlarda önemli ölçüde daha hızlı hale getirir.

Performans Metrikleri

Aşağıdaki tablo, standart benchmarklarda modelleri karşılaştırmaktadır. YOLO26'nın CPU önemli hız avantajı olduğunu ve bunun mimari optimizasyonlarının doğrudan bir sonucu olduğunu unutmayın.

Model	boyut ^(piksel)	mAP^val 50-95	Hız ^{CPU ONNX (ms)}	Hız ^{T4 TensorRT10 (ms)}	parametreler ^(M)	FLOP'lar ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv9t	640	38.3	-	2.3	2.0	7.7
YOLOv9s	640	46.8	-	3.54	7.1	26.4
YOLOv9m	640	51.4	-	6.43	20.0	76.3
YOLOv9c	640	53.0	-	7.16	25.3	102.1
YOLOv9e	640	55.6	-	16.77	57.3	189.0

Ultralytics Avantajları

YOLOv9 güçlü teorik temeller YOLOv9 , Ultralytics YOLO26 kullanmak geliştiriciler ve işletmeler için belirgin avantajlar sağlar.

Eşsiz Kullanım Kolaylığı

Ultralytics Python , karmaşık eğitim iş akışlarını birkaç satırlık kodlara dönüştürür. Bu "sıfırdan kahramana" deneyimi, diğer birçok deponun araştırma odaklı yapısıyla tezat oluşturur.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled by default
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

Görevler Arası Çok Yönlülük

Öncelikle algılamaya odaklanan YOLOv9 farklı olarak, Ultralytics ve YOLO26, daha geniş bir bilgisayar görme görevleri yelpazesini doğal olarak destekler. Bu, tek bir birleşik API'yi aşağıdakiler için kullanmanıza olanak tanır:

Örnek Segmentasyonu: Hassas piksel düzeyinde nesne maskeleme.
Poz Tahmini: İnsan aktivitesi analizi için kilit nokta tespiti.
OBB (Yönlendirilmiş Sınırlayıcı Kutu): Uydu görüntülerinde gemiler gibi döndürülmüş nesneleri algılama.
Sınıflandırma: Tüm görüntünün kategorize edilmesi.

Eğitim ve Hafıza Verimliliği

Ultralytics kaynak verimliliği için tasarlanmıştır. YOLO26, transformatör ağırlıklı alternatiflere kıyasla eğitim sırasında genellikle daha az GPU (VRAM) gerektirir. Bu verimlilik şunları sağlar:

Tüketici donanımlarında daha büyük parti boyutları.
Bulut bilişim maliyetlerini düşürün.
Hazır önceden eğitilmiş ağırlıklar ile daha hızlı deneme döngüleri.

Gerçek Dünya Uygulamaları

Doğru modeli seçmek, özel dağıtım kısıtlamalarınıza bağlıdır.

Uç Bilişim ve IoT

YOLO26, kenar cihazlar için tartışmasız şampiyondur. %43 daha hızlı CPU özelliği, Raspberry Pi veya NVIDIA Nano gibi cihazlarda ağır niceleme gerektirmeden gerçek zamanlı izlemeyi mümkün kılar. Örneğin, yerel donanımda çalışan akıllı park sistemi, NMS tasarımdan büyük ölçüde yararlanarak gecikme artışlarını azaltır.

Yüksek İrtifa Denetimi

Drone tabanlı tarımsal izleme veya altyapı denetimi için YOLO26, ProgLoss + STAL işlevleri sayesinde öne çıkmaktadır. Bu işlevler, önceki nesillere göre küçük nesneleri ve zorlu en boy oranlarını daha iyi işleyebilecek şekilde özel olarak ayarlanmıştır ve boru hatlarındaki çatlakların veya mahsullerdeki zararlıların daha yüksek geri çağırma oranıyla tespit edilmesini sağlar.

Akademik Araştırma

YOLOv9 akademik araştırmalar için, özellikle gradyan akışı ve ağ mimarisi teorisine odaklanan çalışmalar için güçlü bir aday olmaya devam ediyor. PGI kavramı, sinir ağlarının bilgi derinliğini nasıl koruduğunu keşfetmek için büyüleyici bir yol sunuyor.

Sonuç

Her iki mimari de bilgisayar görüşünde önemli kilometre taşlarıdır. YOLOv9 , derin ağlarda gradyan bilgisinin önemini YOLOv9 . Ancak YOLO26, bu dersleri üretime hazır bir güç merkezine dönüştürmüştür. Uçtan uca NMS tasarımı, üstün CPU ve Ultralytics sorunsuz entegrasyonu ile YOLO26, modern AI uygulamaları için hız, doğruluk ve kullanım kolaylığı arasında en iyi dengeyi sunar.

En son teknolojileri takip etmek isteyen geliştiriciler için, optimizer kararlılığı ve kenar performansı alanındaki en son gelişmelerden yararlanmak üzere YOLO26'ya geçiş yapmalarını öneririz.

Daha Fazla Okuma

Ultralytics indeki diğer yüksek performanslı modellerle ilgileniyorsanız, şu adrese göz atın YOLO11 veya RT-DETR 'yi inceleyin.