İçeriğe geç

Ultralytics YOLO26

Genel Bakış

Ultralytics YOLO26, uç ve düşük güçlü cihazlar için sıfırdan tasarlanmış, gerçek zamanlı nesne dedektörlerinin YOLO serisindeki en son evrimdir. Daha hızlı, daha hafif ve daha erişilebilir dağıtım sağlamak için hedeflenen yenilikleri entegre ederken gereksiz karmaşıklığı ortadan kaldıran, aerodinamik bir tasarım sunar.

Ultralytics YOLO26 Karşılaştırma Grafikleri

Ultralytics deneyin

YOLO26 modellerini doğrudan Ultralytics keşfedin ve çalıştırın.

YOLO26'nın mimarisine üç temel ilke rehberlik etmektedir:

  • Sadelik: YOLO26, maksimum olmayan bastırmaya (NMS) ihtiyaç duymadan doğrudan tahminler üreten bir yerel uçtan uca modeldir. Bu işlem sonrası adımı ortadan kaldırarak, çıkarım daha hızlı, daha hafif ve gerçek dünya sistemlerinde dağıtılması daha kolay hale gelir. Bu çığır açan yaklaşım ilk olarak Tsinghua Üniversitesi'nden Ao Wang tarafından YOLOv10'da öncülük edilmiş ve YOLO26'da daha da geliştirilmiştir.
  • Dağıtım Verimliliği: Uçtan uca tasarım, ardışık düzenin tüm bir aşamasını ortadan kaldırarak entegrasyonu önemli ölçüde basitleştirir, gecikmeyi azaltır ve çeşitli ortamlarda dağıtımı daha sağlam hale getirir.
  • Eğitimde İnovasyon: YOLO26, SGD ve Muon'un bir melezi olan MuSGD optimize edicisini sunar — Moonshot AI'nın LLM eğitimindeki Kimi K2 atılımlarından ilham almıştır. Bu optimize edici, gelişmiş kararlılık ve daha hızlı yakınsama sağlayarak dil modellerinden elde edilen optimizasyon gelişmelerini bilgisayarlı görüye aktarır.
  • Göreve Özel Optimizasyonlar: YOLO26, segmentation için anlamsal segmentasyon kaybı ve çok ölçekli proto modülleri, yüksek hassasiyetli pose tahmini için Artık Log-Olasılık Tahmini (RLE) ve obb'deki sınır sorunlarını çözmek için açı kaybıyla optimize edilmiş kod çözme dahil olmak üzere özel görevler için hedeflenmiş iyileştirmeler sunar.

Birlikte, bu yenilikler küçük nesnelerde daha yüksek doğruluk sağlayan, kusursuz dağıtım sağlayan ve CPU'larda %43'e kadar daha hızlı çalışan bir model ailesi sunar — bu da YOLO26'yı kaynak kısıtlı ortamlar için bugüne kadarki en pratik ve dağıtılabilir YOLO modellerinden biri yapar.

Temel Özellikler

  • DFL Kaldırma
    Dağıtım Odaklı Kayıp (DFL) modülü, etkili olmasına rağmen, genellikle dışarı aktarmayı karmaşıklaştırdı ve donanım uyumluluğunu sınırladı. YOLO26, DFL'yi tamamen kaldırarak çıkarımı basitleştirir ve kenar ve düşük güçlü cihazlar için desteği genişletir.

  • Uçtan Uca NMS'siz Çıkarım
    NMS'ye ayrı bir işlem sonrası adımı olarak dayanan geleneksel dedektörlerin aksine, YOLO26 doğal olarak uçtan ucadır. Tahminler doğrudan oluşturulur, bu da gecikmeyi azaltır ve üretim sistemlerine entegrasyonu daha hızlı, daha hafif ve daha güvenilir hale getirir.

  • ProgLoss + STAL
    Geliştirilmiş kayıp fonksiyonları, küçük nesne tanımada kayda değer iyileştirmelerle detection doğruluğunu artırır; bu, IoT, robotik, hava görüntüleme ve diğer uç uygulamaları için kritik bir gerekliliktir.

  • MuSGD Optimizatörü
    SGD ile Muon'u birleştiren yeni bir hibrit optimizatör. Moonshot AI'nın Kimi K2'sinden ilham alan MuSGD, LLM eğitiminden gelişmiş optimizasyon yöntemlerini bilgisayarlı görüye getirerek daha kararlı eğitim ve daha hızlı yakınsama sağlar.

  • %43'e Kadar Daha Hızlı CPU Çıkarımı
    Özellikle uç bilişim için optimize edilen YOLO26, önemli ölçüde daha hızlı CPU çıkarımı sağlayarak GPU'suz cihazlarda gerçek zamanlı performans sağlar.

  • Örnek Segmentasyon İyileştirmeleri
    Model yakınsamasını iyileştirmek için anlamsal segmentasyon kaybı ve üstün maske kalitesi için çok ölçekli bilgileri kullanan yükseltilmiş bir proto modülü sunar.

  • Hassas Poz Tahmini
    Daha doğru anahtar nokta lokalizasyonu için Kalıntı Log-Olasılık Tahmini (RLE) entegre eder ve çıkarım hızını artırmak için kod çözme sürecini optimize eder.

  • Gelişmiş OBB Kod Çözme
    Kare şekilli nesneler için detect doğruluğunu artırmak amacıyla özel bir açı kaybı sunar ve sınır süreksizlik sorunlarını çözmek için obb kod çözmeyi optimize eder.

Ultralytics YOLO26 Uçtan Uca Karşılaştırma Grafikleri


Desteklenen Görevler ve Modlar

YOLO26, önceki Ultralytics YOLO sürümleri tarafından oluşturulan çok yönlü model yelpazesini temel alarak çeşitli bilgisayar görüşü görevlerinde gelişmiş destek sunar:

ModelDosya adlarıGörevÇıkarımDoğrulamaEğitimDışa aktar
YOLO26yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.ptAlgılama
YOLO26-segyolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.ptÖrnek Segmentasyonu
YOLO26-poseyolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.ptPoz/Anahtar Noktaları
YOLO26-obbyolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.ptYönlendirilmiş Algılama
YOLO26-clsyolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.ptSınıflandırma

Bu birleşik çerçeve, YOLO26'nın gerçek zamanlı detect, segmentasyon, sınıflandırma, poz tahmini ve yönlendirilmiş nesne algılama genelinde uygulanabilir olmasını sağlar; tümü eğitim, doğrulama, çıkarım ve dışa aktarma desteğiyle.


Performans Metrikleri

Performans

Detection Belgeleri'ne bakınız. Bu modeller COCO üzerinde eğitilmiştir ve 80 önceden eğitilmiş sınıf içerir.

Modelboyut
(piksel)
mAPval
50-95
mAPval
50-95(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n64040.940.138.9 ± 0.71.7 ± 0.02.45.4
YOLO26s64048.647.887.2 ± 0.92.5 ± 0.09.520.7
YOLO26m64053.152.5220.0 ± 1.44.7 ± 0.120.468.2
YOLO26l64055.054.4286.2 ± 2.06.2 ± 0.224.886.4
YOLO26x64057.556.9525.8 ± 4.011.8 ± 0.255.7193.9

Segmentation Belgeleri'ne bakınız. Bu modeller COCO üzerinde eğitilmiştir ve 80 önceden eğitilmiş sınıf içerir.

Modelboyut
(piksel)
mAPbox
50-95(e2e)
mAPmask
50-95(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n-seg64039.633.953.3 ± 0.52.1 ± 0.02.79.1
YOLO26s-seg64047.340.0118.4 ± 0.93.3 ± 0.010.434.2
YOLO26m-seg64052.544.1328.2 ± 2.46.7 ± 0.123.6121.5
YOLO26l-seg64054.445.5387.0 ± 3.78.0 ± 0.128.0139.8
YOLO26x-seg64056.547.0787.0 ± 6.816.4 ± 0.162.8313.5

Classification Belgeleri'ne bakınız. Bu modeller ImageNet üzerinde eğitilmiştir ve 1000 önceden eğitilmiş sınıf içerir.

Modelboyut
(piksel)
acc
top1
acc
top5
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(Milyar) - 224
YOLO26n-cls22471.490.15.0 ± 0.31.1 ± 0.02.80.5
YOLO26s-cls22476.092.97.9 ± 0.21.3 ± 0.06.71.6
YOLO26m-cls22478.194.217.2 ± 0.42.0 ± 0.011.64.9
YOLO26l-cls22479.094.623.2 ± 0.32.8 ± 0.014.16.2
YOLO26x-cls22479.995.041.4 ± 0.93.8 ± 0.029.613.6

Pose Estimation Belgeleri'ne bakınız. Bu modeller COCO üzerinde eğitilmiştir ve 'kişi' olmak üzere 1 önceden eğitilmiş sınıf içerir.

Modelboyut
(piksel)
mAPpose
50-95(e2e)
mAPpose
50(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n-pose64057.283.340.3 ± 0.51.8 ± 0.02.97.5
YOLO26s-pose64063.086.685.3 ± 0.92.7 ± 0.010.423.9
YOLO26m-pose64068.889.6218.0 ± 1.55.0 ± 0.121.573.1
YOLO26l-pose64070.490.5275.4 ± 2.46.5 ± 0.125.991.3
YOLO26x-pose64071.691.6565.4 ± 3.012.2 ± 0.257.6201.7

Oriented Detection Belgeleri'ne bakınız. Bu modeller DOTAv1 üzerinde eğitilmiştir ve 15 önceden eğitilmiş sınıf içerir.

Modelboyut
(piksel)
mAPtest
50-95(e2e)
mAPtest
50(e2e)
Hız
CPU ONNX
(ms)
Hız
T4 TensorRT10
(ms)
parametreler
(M)
FLOP'lar
(B)
YOLO26n-obb102452.478.997.7 ± 0.92.8 ± 0.02.514.0
YOLO26s-obb102454.880.9218.0 ± 1.44.9 ± 0.19.855.1
YOLO26m-obb102455.381.0579.2 ± 3.810.2 ± 0.321.2183.3
YOLO26l-obb102456.281.6735.6 ± 3.113.0 ± 0.225.6230.0
YOLO26x-obb102456.781.71485.7 ± 11.530.5 ± 0.957.6516.5

Kullanım Örnekleri

Bu bölüm, basit YOLO26 eğitim ve çıkarım örnekleri sunar. Bunlar ve diğer modlar hakkında tam dokümantasyon için Predict, Train, Val ve Export doküman sayfalarına bakın.

Aşağıdaki örneğin nesne algılama için YOLO26 detect modelleri için olduğunu unutmayın. Ek desteklenen görevler için segment, classify, obb ve pose dokümanlarına bakın.

Örnek

PyTorch önceden eğitilmiş *.pt modellerin yanı sıra yapılandırma *.yaml dosyaları YOLO() Python'da bir model örneği oluşturmak için sınıf:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Modelleri doğrudan çalıştırmak için CLI komutları mevcuttur:

# Load a COCO-pretrained YOLO26n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo26n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO26n model and run inference on the 'bus.jpg' image
yolo predict model=yolo26n.pt source=path/to/bus.jpg

Çift Başlı Mimari

YOLO26, farklı dağıtım senaryoları için esneklik sağlayan çift başlıklı bir mimariye sahiptir:

  • Bire Bir Başlık (Varsayılan): NMS olmadan uçtan uca tahminler üretir ve çıktı verir. (N, 300, 6) görüntü başına maksimum 300 algılama ile. Bu kafa, hızlı çıkarım ve basitleştirilmiş dağıtım için optimize edilmiştir.
  • Birden Çok Kişiye Yönelik Başlık: NMS gerektiren geleneksel YOLO üretir, çıktı (N, nc + 4, 8400) nerede nc sınıfların sayısıdır. Bu başlık, ek işlem maliyeti karşılığında genellikle biraz daha yüksek doğruluk sağlar.

Dışa aktarma, tahmin veya doğrulama sırasında kafalar arasında geçiş yapabilirsiniz:

from ultralytics import YOLO

model = YOLO("yolo26n.pt")

# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg")  # inference
metrics = model.val(data="coco.yaml")  # validation
model.export(format="onnx")  # export

# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False)  # inference
metrics = model.val(data="coco.yaml", end2end=False)  # validation
model.export(format="onnx", end2end=False)  # export
# Use one-to-one head (default, no NMS required)
yolo predict model=yolo26n.pt source=image.jpg
yolo val model=yolo26n.pt data=coco.yaml
yolo export model=yolo26n.pt format=onnx

# Use one-to-many head (requires NMS)
yolo predict model=yolo26n.pt source=image.jpg end2end=False
yolo val model=yolo26n.pt data=coco.yaml end2end=False
yolo export model=yolo26n.pt format=onnx end2end=False

Seçim, dağıtım gereksinimlerinize bağlıdır: maksimum hız ve basitlik için bire bir başlığı kullanın veya doğruluk en önemli öncelik olduğunda bire çok başlığı kullanın.

YOLOE-26: Açık Kelime Örnek Segmentasyonu

YOLOE-26, yüksek performanslı YOLO26 mimarisini YOLOE serisinin açık kelime dağarcığı yetenekleriyle entegre eder. Sıfır atış çıkarımı için metin istemleri, görsel istemler veya istem gerektirmeyen bir mod kullanarak herhangi bir nesne sınıfının gerçek zamanlı detect ve segmentasyonunu sağlayarak, sabit kategori eğitiminin kısıtlamalarını etkili bir şekilde ortadan kaldırır.

YOLO26'nın NMS içermeyen, uçtan uca tasarımından yararlanarak YOLOE-26, hızlı açık dünya çıkarımı sunar. Bu, ilgi çekici nesnelerin geniş ve gelişen bir kelime dağarcığını temsil ettiği dinamik ortamlardaki uç uygulamalar için güçlü bir çözüm olmasını sağlar.

Performans

Objects365v1, GQA ve Flickr30k veri kümeleri üzerinde eğitilmiş bu modellerle kullanım örnekleri için YOLOE Dokümanlarına bakın.

Modelboyut
(piksel)
İstem TürümAPminival
50-95(e2e)
mAPminival
50-95
mAPrmAPcmAPfparametreler
(M)
FLOP'lar
(B)
YOLOE-26n-seg640Metin/Görsel23.7 / 20.924.7 / 21.920.5 / 17.624.1 / 22.326.1 / 22.44.86.0
YOLOE-26s-seg640Metin/Görsel29.9 / 27.130.8 / 28.623.9 / 25.129.6 / 27.833.0 / 29.913.121.7
YOLOE-26m-seg640Metin/Görsel35.4 / 31.335.4 / 33.931.1 / 33.434.7 / 34.036.9 / 33.827.970.1
YOLOE-26l-seg640Metin/Görsel36.8 / 33.737.8 / 36.335.1 / 37.637.6 / 36.238.5 / 36.132.388.3
YOLOE-26x-seg640Metin/Görsel39.5 / 36.240.6 / 38.537.4 / 35.340.9 / 38.841.0 / 38.869.9196.7

Objects365v1, GQA ve Flickr30k veri kümeleri üzerinde eğitilmiş bu modellerle kullanım örnekleri için YOLOE Dokümanlarına bakın.

Modelboyut
(piksel)
mAPminival
50-95(e2e)
mAPminival
50(e2e)
parametreler
(M)
FLOP'lar
(B)
YOLOE-26n-seg-pf64016.622.76.515.8
YOLOE-26s-seg-pf64021.428.616.235.5
YOLOE-26m-seg-pf64025.733.636.2122.1
YOLOE-26l-seg-pf64027.235.440.6140.4
YOLOE-26x-seg-pf64029.938.786.3314.4

Kullanım Örneği

YOLOE-26 hem metin tabanlı hem de görsel istemleri destekler. İstemleri kullanmak basittir—sadece bunları şuradan geçirin predict metodu aşağıda gösterildiği gibi:

Örnek

Metin istemleri, metinsel açıklamalar aracılığıyla algılamak istediğiniz sınıfları belirtmenize olanak tanır. Aşağıdaki kod, bir görüntüdeki insanları ve otobüsleri algılamak için YOLOE-26'yı nasıl kullanabileceğinizi göstermektedir:

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg.pt")  # or select yoloe-26s/m-seg.pt for different sizes

# Set text prompt to detect person and bus. You only need to do this once after you load the model.
names = ["person", "bus"]
model.set_classes(names, model.get_text_pe(names))

# Run detection on the given image
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

Görsel istekler, hedef sınıfları metinle tanımlamak yerine, görsel örneklerini göstererek modele rehberlik etmenizi sağlar.

import numpy as np

from ultralytics import YOLO
from ultralytics.models.yolo.yoloe import YOLOEVPSegPredictor

# Initialize model
model = YOLO("yoloe-26l-seg.pt")

# Define visual prompts using bounding boxes and their corresponding class IDs.
# Each box highlights an example of the object you want the model to detect.
visual_prompts = dict(
    bboxes=np.array(
        [
            [221.52, 405.8, 344.98, 857.54],  # Box enclosing person
            [120, 425, 160, 445],  # Box enclosing glasses
        ],
    ),
    cls=np.array(
        [
            0,  # ID to be assigned for person
            1,  # ID to be assigned for glasses
        ]
    ),
)

# Run inference on an image, using the provided visual prompts as guidance
results = model.predict(
    "ultralytics/assets/bus.jpg",
    visual_prompts=visual_prompts,
    predictor=YOLOEVPSegPredictor,
)

# Show results
results[0].show()

YOLOE-26, yerleşik bir kelime dağarcığına sahip istem gerektirmeyen varyantlar içerir. Bu modeller herhangi bir istem gerektirmez ve geleneksel YOLO modelleri gibi çalışır. Kullanıcı tarafından sağlanan etiketlere veya görsel örneklere güvenmek yerine, Recognize Anything Model Plus (RAM++) tarafından kullanılan etiket setine dayalı olarak önceden tanımlanmış 4.585 sınıflık bir listeden nesneleri algılarlar.

from ultralytics import YOLO

# Initialize model
model = YOLO("yoloe-26l-seg-pf.pt")

# Run prediction. No prompts required.
results = model.predict("path/to/image.jpg")

# Show results
results[0].show()

İstem teknikleri, sıfırdan eğitim ve tam kullanım örnekleri hakkında derinlemesine bilgi için, YOLOE Dokümantasyonu'nu ziyaret edin.

Alıntılar ve Teşekkürler

Ultralytics YOLO26 Yayını

Ultralytics, modellerin hızla gelişen yapısı nedeniyle YOLO26 için resmi bir araştırma makalesi yayınlamadı. Bunun yerine, en son modelleri sunmaya ve bunların kullanımını kolaylaştırmaya odaklanıyoruz. YOLO özelliklerinin, mimarilerinin ve kullanımının en son güncellemeleri için GitHub depomuzu ve belgelerimizi ziyaret edin.

Çalışmanızda YOLO26 veya diğer Ultralytics yazılımlarını kullanıyorsanız, lütfen şu şekilde atıfta bulunun:

@software{yolo26_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO26},
  version = {26.0.0},
  year = {2026},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

DOI bekleniyor. YOLO26, AGPL-3.0 ve Kurumsal lisansları altında mevcuttur.


SSS

YOLO26'daki YOLO11'e kıyasla temel iyileştirmeler nelerdir?

  • DFL Kaldırma: Dışarı aktarmayı basitleştirir ve kenar uyumluluğunu genişletir
  • Uçtan Uca NMS'siz Çıkarım: Daha hızlı, daha basit dağıtım için NMS'yi ortadan kaldırır
  • ProgLoss + STAL: Özellikle küçük nesnelerde doğruluğu artırır
  • MuSGD Optimizatörü: Daha kararlı, verimli eğitim için SGD ve Muon'u (Moonshot'ın Kimi K2'sinden esinlenerek) birleştirir
  • %43'e Kadar Daha Hızlı CPU Çıkarımı: Yalnızca CPU'lu cihazlar için büyük performans kazanımları

YOLO26 hangi görevleri destekler?

YOLO26, birden fazla bilgisayar görüşü görevi için uçtan uca destek sağlayan birleşik bir model ailesidir:

Her boyut varyantı (n, s, m, l, x) tüm görevleri destekler, ayrıca YOLOE-26 aracılığıyla açık kelime dağarcığı versiyonlarını da.

YOLO26 neden uç nokta dağıtımı için optimize edilmiştir?

YOLO26, şunlarla son teknoloji ürünü uç performans sunar:

  • %43'e kadar daha hızlı CPU çıkarımı
  • Küçültülmüş model boyutu ve bellek ayak izi
  • Uyumluluk için basitleştirilmiş mimari (DFL yok, NMS yok)
  • TensorRT, ONNX, CoreML, TFLite ve OpenVINO dahil olmak üzere esnek dışa aktarım formatları

YOLO26 ile nasıl başlarım?

YOLO26 modelleri 14 Ocak 2026'da yayınlandı ve indirilmeye hazırdır. Şunu yükleyin veya güncelleyin: ultralytics paketini ve bir model yükleyin:

from ultralytics import YOLO

# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")

# Run inference on an image
results = model("image.jpg")

Eğitim, doğrulama ve dışa aktarma talimatları için Kullanım Örnekleri bölümüne bakın.



📅 3 ay önce oluşturuldu ✏️ 0 gün önce güncellendi
glenn-jocherY-T-GLaughing-qraimbekovmfcakyonlmycrosspderrenger

Yorumlar