İçeriğe geç

YOLO26 ve YOLO11: Görsel Yapay Zekada Nesilsel Bir Sıçrama

Son teknoloji bilgisayar görüşü sistemleri oluştururken, doğru modeli seçmek doğruluk, gecikme süresi ve kaynak verimliliğini dengelemek için kritik öneme sahiptir. Hızla gelişen yapay zeka ortamında, Ultralytics mümkün olanın sınırlarını zorlamaya devam ediyor. Bu ayrıntılı teknik karşılaştırma, son derece başarılı YOLO11'den devrim niteliğindeki yeni YOLO26'ya geçişi inceliyor ve yapay zeka mühendislerine ve araştırmacılarına bilinçli mimari kararlar almaları için gereken bilgileri sağlıyor.

Model Soy Ağacı ve Meta Verileri

Her iki model de Ultralytics tarafından geliştirilmiştir, ancak nesne algılama ve çok görevli görüş modellerinin zaman çizelgesinde farklı paradigmaları temsil etmektedirler.

YOLO26 Detayları:

YOLO26 hakkında daha fazla bilgi edinin

YOLO11 Detayları:

YOLO11 hakkında daha fazla bilgi edinin

Diğer Mimariler

YOLO26 en gelişmiş gerçek zamanlı modelimiz olsa da, yüksek düzeyde uzmanlaşmış donanımlarla veya büyük bellek kapasiteleriyle çalışan kullanıcılar, RT-DETR gibi dönüştürücü tabanlı mimarileri veya çığır açan NMS içermeyen öncü YOLOv10'u da keşfedebilirler.

Mimari Farklılıklar ve Yenilikler

YOLO11'den YOLO26'ya geçiş, hem model mimarisinde hem de temel eğitim rejiminde temel değişiklikleri içerir. YOLO11, object detection ve çok görevli öğrenme için sağlam bir temel oluştururken, YOLO26, kenar bilişim için dağıtım hattını tamamen elden geçirir.

Uçtan Uca NMS'siz Tasarım

YOLO26'daki en önemli yükseltmelerden biri, doğal olarak uçtan uca mimarisidir. Çakışan sınırlayıcı kutuları filtrelemek için Non-Maximum Suppression (NMS) son işlemine dayanan YOLO11'in aksine, YOLO26 bu adımı tamamen ortadan kaldırır. İlk olarak YOLOv10'da öncülük edilen bu konsept, gecikme değişkenliğini önemli ölçüde azaltır ve çeşitli kenar cihazlarda dağıtım mantığını basitleştirir.

Uç Verimliliği için DFL Kaldırma

YOLO11, sınırlayıcı kutu tahminlerini iyileştirmek için Dağıtım Odaklı Kayıp (DFL) kullanır. Ancak DFL, düşük güçlü kenar hızlandırıcılar tarafından genellikle kötü desteklenen karmaşık softmax işlemlerine dayanır. YOLO26, doğruluktan ödün vermeden DFL'yi başarıyla kaldırır. Bu mimari basitleştirme, gömülü sistemlerle uyumluluğu büyük ölçüde artırır ve YOLO26'nın selefine kıyasla %43'e kadar daha hızlı CPU çıkarımı elde etmesini sağlar.

MuSGD Optimize Edicisi

Eğitim kararlılığı ve hızı çok önemlidir. YOLO26, Moonshot AI'nin Kimi K2'den LLM eğitim yeniliklerinden büyük ölçüde ilham alan, Stokastik Gradyan İnişi (SGD) ve Muon'un bir hibriti olan MuSGD Optimizer'ı sunar. Bu optimize edici, dil modeli eğitim kararlılığını bilgisayar görüşüne getirerek, daha hızlı yakınsama sağlar ve ağır dönüştürücü alternatiflerine kıyasla eğitim sırasında bellek ayak izini azaltır.

ProgLoss ve STAL

Hava görüntüleri veya drone uygulamalarıyla çalışan araştırmacılar için, küçük özellikleri detect etmek tarihsel bir zorluktur. YOLO26, ProgLoss'u STAL (Scale-Targeted Attention Loss) ile birleştirerek, küçük nesne tanımada YOLO11'e göre önemli iyileştirmeler sunar.

Performans ve Metrik Karşılaştırması

Modelleri karşılaştırdığımızda, YOLO26, Ultralytics ekosisteminin karakteristik özelliği olan inanılmaz derecede düşük bellek gereksinimlerini korurken, hassasiyet ve kenar cihaz verimliliğinde açık bir üstünlük sergiler.

Modelboyut
(piksel)
mAPval
50-95
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Not: YOLO26 nano (YOLO26n) modeli, YOLO11n'ye kıyasla CPU hızında yaklaşık %31'lik bir iyileşme (38.9ms'ye karşı 56.1ms) göstererek, kenar öncelikli tasarım felsefesini vurgulamaktadır.

Bilgisayar Görüşü Görevlerinde Çok Yönlülük

Her iki model de, birleşik bir Python API aracılığıyla benzersiz kullanım kolaylığı sunan, yüksek düzeyde bakımı yapılan Ultralytics ekosisteminden faydalanır. Bunlar sadece object detectörleri değil; çok görevli güç merkezleridir. Ancak, YOLO26 birkaç göreve özel ilerlemeyi içerir:

  • Instance Segmentation: YOLO26, rafine bir anlamsal segmentation kaybı ve çok ölçekli prototipleme kullanarak, YOLO11'den daha net maske sınırları üretir. segmentation iş akışları hakkında daha fazla bilgi edinin.
  • Pose Estimation: Residual Log-Likelihood Estimation (RLE) entegrasyonuyla, YOLO26 karmaşık insan pozlarında anahtar nokta doğruluğunu önemli ölçüde artırır. Pose estimation yeteneklerini keşfedin.
  • Oriented Bounding Boxes (OBB): Özel bir açı kaybı fonksiyonu, tarihsel sınır süreksizlik sorunlarını çözerek, YOLO26'yı uydu görüntülerindeki dönen nesneleri detect etmek için olağanüstü güvenilir hale getirir. OBB görevleri hakkında okuyun.
  • Image Classification: Her iki model de yüksek hızlı classification'ı verimli bir şekilde ele alır ve YOLO26, ImageNet üzerinde marjinal top-1 doğruluk iyileştirmeleri sunar.

Eğitim ve Çıkarım Kodu Örneği

Ultralytics, geliştirici deneyimiyle tanınır. SOTA bir model eğitmek veya bir çıkarım betiği çalıştırmak sadece birkaç satır kod gerektirir, bu da tekrarlayan kodu en aza indirir ve üretkenliği en üst düzeye çıkarır. Ayrıca, YOLO modellerini eğitmek, büyük dönüştürücü ağlara göre önemli ölçüde daha az CUDA belleği gerektirir.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

İdeal Kullanım Senaryoları ve Dağıtım Stratejileri

YOLO26 ve YOLO11 arasında seçim yapmak, tamamen üretim ortamınızın kısıtlamalarına bağlıdır.

YOLO26 Ne Zaman Dağıtılmalı

YOLO26, modern, sıfırdan projeler için kesin bir seçimdir. Özellikle şunlar için tasarlanmıştır:

  • Kenar Bilişim ve IoT: Şaşırtıcı CPU performansı ve DFL'nin kaldırılması, onu Raspberry Pi, Coral NPUs ve mobil işlemciler gibi cihazların kralı yapar.
  • Drone ve Hava Analizi: ProgLoss + STAL entegrasyonu, geniş manzaralarda küçük, hızlı hareket eden nesneleri track etmek için onu benzersiz bir şekilde yetenekli kılar.
  • Gecikme-Kritik Uygulamalar: Otonom robotikte veya üretim kalite kontrolünde, NMS içermeyen tasarım, beklenmedik son işlem yükselişleri olmadan deterministik gecikme sağlar.

YOLO11 Ne Zaman Korunmalı

YOLO26 üstün olsa da, YOLO11 inanılmaz derecede yetenekli bir model olmaya devam ediyor. Şu durumlarda YOLO11'i tercih edebilirsiniz:

  • Eski İş Akışları: Mevcut C++ dağıtım altyapınız, eski mimarilerin belirli çapa tabanlı çıktılarına ve NMS mantığına sıkıca bağlıdır.
  • Akademik Temeller: Araştırma yayınlıyorsunuz ve yeni algoritmalarınızı karşılaştırmak için yüksek düzeyde tanınan 2024 standardına ihtiyacınız var.

Ultralytics Ekosisteminin Gücü

YOLO11 veya YOLO26'yı dağıtırsanız dağıtın, Ultralytics modellerini kullanmak, sık güncellemeler ve geniş topluluk desteği ile iyi bakımı yapılmış bir ekosisteme erişmek anlamına gelir.

Kurumsal ekipler için Ultralytics Platformu, veri açıklama, model eğitimi ve sorunsuz bulut dağıtımı için uçtan uca bir çözüm sunar. Eğitilmiş ağırlıklarınızı CoreML veya TensorRT'ye aktarmaktan, gelişmiş hiperparametre ayarlamayı yapılandırmaya kadar, sağlanan araçlar yapay zeka yaşam döngünüzün mümkün olduğunca kolaylaştırılmasını sağlar.


Yorumlar