İçeriğe geç

YOLO26 ve YOLOv8: Yeni Nesil Nesne Algılamada Gelişmeler

Bilgisayar görüşünün evrimi, doğruluktan ödün vermeden gerçek zamanlı performans arayışıyla tanımlanmıştır. Geliştiriciler ve araştırmacılar modern makine öğrenimi ortamında ilerlerken, doğru model mimarisini seçmek kritik öneme sahiptir. Bu kapsamlı teknik karşılaştırma, 2023'te standardı yeniden tanımlayan son derece popüler bir mimari olan Ultralytics YOLOv8'den, Ocak 2026'da piyasaya sürülen son teknoloji Ultralytics YOLO26'ya kadar olan nesiller arası sıçramayı inceliyor.

Mimari yapılarını, performans metriklerini ve eğitim metodolojilerini derinlemesine inceleyerek, en son yeniliklere yükseltmenin nesne algılama, segmentasyon ve ötesi için neden belirgin avantajlar sağladığını vurguluyoruz.

Model Geçmişi ve Meta Verileri

Bu mimarilerin kökenlerini anlamak, ilgili atılımları için bir bağlam sağlar. Her iki model de, son teknoloji yapay zekayı erişilebilir ve kolayca dağıtılabilir hale getirmesiyle tanınan Ultralytics şirketi tarafından geliştirilmiştir.

YOLO26 Detayları:
Yazarlar: Glenn Jocher ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2026-01-14
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolo26/

YOLO26 hakkında daha fazla bilgi edinin

YOLOv8 Detayları:
Yazarlar: Glenn Jocher, Ayush Chaurasia ve Jing Qiu
Kuruluş: Ultralytics
Tarih: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Belgeler: https://docs.ultralytics.com/models/yolov8/

YOLOv8 hakkında daha fazla bilgi edinin.

Mimari Yenilikler

YOLOv8'den YOLO26'ya geçiş, sinir ağlarının görsel verileri işleme ve kayıp hesaplama biçiminde önemli paradigma değişiklikleri getiriyor.

YOLO26: Kenar Verimliliğinin Zirvesi

YOLO26, dağıtım darboğazlarını ortadan kaldırmak ve kısıtlı donanımlarda çıkarım hızını maksimize etmek için sıfırdan tasarlanmıştır.

  • Uçtan Uca NMS'siz Tasarım: YOLOv10'da ilk kez öncülük edilen konseptler üzerine inşa edilen YOLO26, doğal olarak uçtan uca bir mimari kullanır. Non-Maximum Suppression (NMS) son işlem ihtiyacını tamamen ortadan kaldırarak, gecikme varyansı neredeyse tamamen yok edilmiştir. Bu, katı gerçek zamanlı garantiler gerektiren uygulamalar için dağıtım mantığını basitleştirir.
  • DFL Kaldırılması: Distribution Focal Loss (DFL) kaldırılması, çıktı başlığını önemli ölçüde basitleştirir. Bu mimari seçim, düşük güçlü kenar cihazlarla önemli ölçüde daha iyi uyumluluk ve ONNX ve CoreML gibi formatlara daha basit dışa aktarımlar sağlar.
  • MuSGD Optimize Edici: Moonshot AI'nin Kimi K2 gibi Büyük Dil Modellerinde (LLM'ler) görülen eğitim kararlılığından ilham alan YOLO26, Stokastik Gradyan İnişi ve Muon'un bir melezi olan MuSGD optimize ediciyi kullanır. Bu, LLM ölçeğindeki eğitim yeniliklerini bilgisayar görüşüne taşıyarak daha hızlı yakınsama ve son derece kararlı eğitim süreçleri sağlar.
  • ProgLoss + STAL: Küçük nesneleri tanıma gibi zorlu bir sorunla mücadele etmek için YOLO26, Ölçek Toleranslı Çapa Kaybı (STAL) ile birleştirilmiş Aşamalı Kayıp (ProgLoss) uygular. Bu, küçük nesne algılama için kritik iyileştirmeler sağlayarak, drone uygulamaları için ideal hale getirir.

Göreve Özel İyileştirmeler

YOLO26, birden fazla bilgisayar görüşü alanında hedeflenmiş yükseltmeler de getiriyor. Daha iyi örnek segmentasyonu için Semantik Segmentasyon kaybı ve çok ölçekli proto, yüksek doğrulukta poz tahmini için Artık Log-Olasılık Tahmini (RLE) ve Yönlendirilmiş Sınırlayıcı Kutularda (OBB) sınır sorunlarını çözmek için özel açı kaybı algoritmaları kullanır.

YOLOv8: Son Derece Çok Yönlü İş Atı

2023 yılında piyasaya sürüldüğünde, YOLOv8, değişken veri kümesi en boy oranlarında daha iyi genelleme sağlayan, tamamen anchor-free bir tasarıma geçerek yeni bir referans noktası belirledi.

  • C2f Modülü: Eski C3 modülünü C2f bloğu ile değiştirerek ağ backbone'unda daha iyi gradyan akışı sağladı.
  • Ayrık Başlık (Decoupled Head): YOLOv8, sınıflandırma ve sınırlayıcı kutu regresyonunun bağımsız olarak hesaplandığı ayrık bir başlığa sahiptir ve bu, ortalama hassasiyeti (mAP) önemli ölçüde artırır.
  • Görev Çok Yönlülüğü: Görüntü sınıflandırma, detect, segment ve poz görevleri için kutudan çıktığı gibi gerçekten birleşik bir API sağlayan ilk modellerden biriydi.

Performans Metrikleri ve Kaynak Gereksinimleri

Üretim için modelleri değerlendirirken, doğruluk, çıkarım hızı ve model boyutu arasındaki denge çok önemlidir. YOLO26, tüm boyut varyantlarında açık bir nesilsel avantaj sergilemektedir.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Not: Vurgulanan değerler, YOLO26 mimarisinin selefine göre performans dengesini ve verimlilik kazanımlarını göstermektedir.

Analiz

YOLO26 kayda değer bir başarı elde ediyor %43'e kadar daha hızlı CPU çıkarımı benzer YOLOv8 modellerine kıyasla. Örneğin, YOLO26n ONNX kullanarak bir CPU üzerinde 38.9 ms'ye ulaşırken, YOLOv8n'nin 80.4 ms'sine kıyasla, mAP'yi 37.3'ten 40.9'a çıkarıyor. CPU verimliliğindeki bu büyük sıçrama, DFL'nin kaldırılması ve NMS-free tasarımın doğrudan bir sonucudur, bu da YOLO26'yı özel GPU'lardan yoksun ortamlar için mutlak bir güç merkezi haline getiriyor.

Ayrıca, YOLO26 modelleri, ilgili boyut seviyeleri için daha düşük parametre sayılarına ve FLOP'lara sahiptir, bu da eski transformatör tabanlı mimarilere kıyasla çıkarım ve eğitim sırasında GPU belleği kullanımının önemli ölçüde azalmasına eşdeğerdir.

Ultralytics Ekosisteminin Avantajı

Bir yapay zeka modeli seçerken önemli bir husus, çevreleyen altyapıdır. Hem YOLO26 hem de YOLOv8, birleşik Ultralytics Platformu'ndan büyük ölçüde faydalanarak eşsiz bir geliştirici deneyimi sunar.

  1. Kullanım Kolaylığı: "Sıfırdan kahramana" felsefesi, geliştiricilerin modelleri minimum kodla yüklemesini, eğitmesini ve dışa aktarmasını sağlar. python API'si, model nesilleri arasında tutarlılığını korur.
  2. Eğitim Verimliliği: Ultralytics YOLO modelleri, transformatör modellerine (RT-DETR gibi) kıyasla eğitim süreçlerinde olağanüstü derecede daha düşük CUDA belleği gerektirir. Bu, tüketici donanımında daha büyük toplu iş boyutlarının kullanılmasına izin vererek yapay zeka araştırmalarını demokratikleştirir.
  3. İyi Yönetilen Ekosistem: Sürekli güncellemeler, titiz CI/CD işlem hatları ve Weights & Biases ile TensorRT gibi araçlarla derin entegrasyonlarla desteklenen Ultralytics deposu sağlam ve üretime hazırdır.
  4. Eşsiz Çok Yönlülük: Ultralytics modelleri tek bir işe yaramaz; tek bir içe aktarma, çeşitli veri kümelerini işler, eş zamanlı track, sınıflandırma ve segment gerektiren karmaşık sistemler için iş akışlarını artırır.

Kolaylaştırılmış Yükseltmeler

Ultralytics API'si yüksek düzeyde standartlaştırılmış olduğundan, bir üretim sistemini YOLOv8'den YOLO26'ya yükseltmek, kelimenin tam anlamıyla dizeyi değiştirmek kadar basittir "yolov8n.pt" için "yolo26n.pt" komut dosyanızda.

Gerçek Dünya Uygulamaları

Bu modeller arasında seçim yapmak genellikle dağıtım kısıtlamalarınıza bağlıdır, ancak YOLO26 yeni projeler için evrensel olarak önerilmektedir.

Kenar Bilişim ve IoT Ağları

Kenar ortamları için — Raspberry Pi dağıtımları veya yerelleştirilmiş fabrika katı sensörleri gibi — YOLO26 tartışmasız şampiyondur. Yerel olarak optimize edilmiş CPU hızı ve NMS-free yapısı, akıllı kameraların park yönetimi için yüksek kare hızlı videoları, işlem sonrası darboğazlar nedeniyle kare düşürmeden işleyebileceği anlamına gelir.

Yüksek İrtifa ve Hava Görüntüleri

Tarım izleme veya dronlar aracılığıyla altyapı denetiminde, küçük nesne algılama çok önemlidir. YOLO26'daki ProgLoss + STAL uygulaması, YOLOv8 gibi eski mimarilerin gözden kaçırabileceği boru hatlarındaki küçük zararlıları veya mikro çatlakları tutarlı bir şekilde detect etmesini sağlayarak VisDrone gibi veri kümelerinde üstün geri çağırma ve hassasiyet sunar.

Eski GPU Sistemleri

YOLOv8, belirli sınırlayıcı kutu regresyon çıktılarına sıkıca bağlı sistemler veya uzun doğrulama döngülerine kilitlenmiş ve mimarileri kolayca geçiş yapamayan kurumsal dağıtımlar için geçerliliğini korumaktadır.

Kullanım Durumları ve Öneriler

YOLO26 ve YOLOv8 arasında seçim yapmak, özel proje gereksinimlerinize, dağıtım kısıtlamalarınıza ve ekosistem tercihlerinize bağlıdır.

YOLO26 Ne Zaman Seçilmeli

YOLO26 şunlar için güçlü bir seçenektir:

  • NMS-Free Uç Dağıtım: Non-Maximum Suppression (NMS) son işlem karmaşıklığı olmadan tutarlı, düşük gecikmeli çıkarım gerektiren uygulamalar.
  • Yalnızca CPU Ortamları: Özel GPU hızlandırması olmayan cihazlarda, YOLO26'nın %43'e kadar daha hızlı CPU çıkarımı belirleyici bir avantaj sağlar.
  • Küçük Nesne Algılama: ProgLoss ve STAL'ın küçük nesneler üzerindeki doğruluğu önemli ölçüde artırdığı hava drone görüntüleri veya IoT sensör analizi gibi zorlu senaryolar.

YOLOv8 Ne Zaman Tercih Edilmeli?

YOLOv8 şunlar için önerilir:

  • Çok Yönlü Çok Görevli Dağıtım: Ultralytics ekosistemi içinde detect, segment, sınıflandırma ve poz tahmini için kanıtlanmış bir model gerektiren projeler.
  • Yerleşik Üretim Sistemleri: YOLOv8 mimarisi üzerine kurulu, kararlı ve iyi test edilmiş dağıtım hatlarına sahip mevcut üretim ortamları.
  • Geniş Topluluk ve Ekosistem Desteği: YOLOv8'in kapsamlı eğitimlerinden, üçüncü taraf entegrasyonlarından ve aktif topluluk kaynaklarından faydalanan uygulamalar.

Kod Örneği: Başlarken

En yeni Ultralytics modellerinin gücünden yararlanmak inanılmaz derecede basittir. Aşağıdaki python kodu, özel bir veri kümesi üzerinde bir YOLO26 modelinin eğitimini ve MuSGD optimize edicisinin otomatik olarak hızlı yakınsamayı nasıl sağladığını göstermektedir.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

Dikkate Alınması Gereken Diğer Modeller

YOLO26 mevcut en son teknolojiyi temsil etse de, çeşitli uygulamalar geliştiren geliştiriciler şunları da inceleyebilirler:

  • YOLO11: YOLO26'nın doğrudan selefi olup, YOLOv8'e göre olağanüstü iyileştirmeler sunar ve hala son teknoloji üretim sistemlerinde yoğun olarak kullanılmaktadır.
  • RT-DETR: Baidu'nun Gerçek Zamanlı Tespit Transformatörü. Görsel görevlerde dikkat mekanizmasını araştıran araştırmacılar için mükemmel bir seçimdir, ancak standart Ultralytics YOLO modellerine kıyasla eğitim için önemli ölçüde daha fazla CUDA belleği gerektirir.

Kapsamlı bulut eğitimi, veri kümesi etiketleme ve anında dağıtım çözümleri için Ultralytics Platformu'nu bugün keşfedin.


Yorumlar