Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLO11: un salto generazionale nella Vision AI#

Quando costruisci sistemi di computer vision all'avanguardia, scegliere il modello giusto è fondamentale per bilanciare accuratezza, latenza ed efficienza delle risorse. Nel panorama in rapida evoluzione dell'intelligenza artificiale, Ultralytics continua a superare i limiti di ciò che è possibile. Questo confronto tecnico dettagliato esplora il passaggio dal grande successo YOLO11 al rivoluzionario nuovo YOLO26, offrendo agli ingegneri AI e ai ricercatori le intuizioni necessarie per prendere decisioni architetturali informate.

Link to this sectionOrigine del modello e metadati#

Entrambi i modelli sono stati sviluppati da Ultralytics, ma rappresentano paradigmi diversi nella linea temporale dei modelli di rilevamento oggetti e di vision multi-task.

Dettagli YOLO26:

Scopri di più su YOLO26

Dettagli YOLO11:

Scopri di più su YOLO11

Altre architetture

Sebbene YOLO26 sia il nostro modello in tempo reale più avanzato, gli utenti che lavorano con hardware altamente specializzato o enormi capacità di memoria potrebbero anche esplorare architetture basate su Transformer come RT-DETR o il rivoluzionario pioniere senza NMS, YOLOv10.

Link to this sectionDifferenze architetturali e innovazioni#

Il salto da YOLO11 a YOLO26 comporta cambiamenti fondamentali sia nell'architettura del modello che nel regime di addestramento sottostante. Mentre YOLO11 ha stabilito una base solida per il rilevamento oggetti e l'apprendimento multi-task, YOLO26 rivoluziona completamente la pipeline di distribuzione per l'edge computing.

Link to this sectionDesign end-to-end senza NMS#

Uno degli aggiornamenti più significativi in YOLO26 è la sua architettura nativamente end-to-end. A differenza di YOLO11, che si basa sulla post-elaborazione Non-Maximum Suppression (NMS) per filtrare i bounding box sovrapposti, YOLO26 elimina completamente questo passaggio. Questo concetto, introdotto per la prima volta in YOLOv10, riduce drasticamente la variabilità della latenza e semplifica la logica di distribuzione su diversi dispositivi edge.

Link to this sectionRimozione di DFL per l'efficienza edge#

YOLO11 utilizza la Distribution Focal Loss (DFL) per perfezionare le stime dei bounding box. Tuttavia, la DFL si basa su complesse operazioni softmax che sono spesso scarsamente supportate dagli acceleratori edge a basso consumo. YOLO26 rimuove con successo la DFL senza sacrificare l'accuratezza. Questa semplificazione architetturale porta a una compatibilità notevolmente migliorata con i sistemi embedded e consente a YOLO26 di ottenere fino al 43% di velocità di inferenza CPU in più rispetto al suo predecessore.

Link to this sectionL'ottimizzatore MuSGD#

La stabilità e la velocità di addestramento sono fondamentali. YOLO26 introduce l'ottimizzatore MuSGD, un ibrido di Stochastic Gradient Descent (SGD) e Muon, fortemente ispirato alle innovazioni nell'addestramento dei LLM di Kimi K2 di Moonshot AI. Questo ottimizzatore porta la stabilità dell'addestramento dei modelli linguistici alla computer vision, garantendo una convergenza più rapida e riducendo il carico di memoria durante l'addestramento rispetto alle pesanti alternative basate su Transformer.

Link to this sectionProgLoss e STAL#

Per i ricercatori che lavorano con immagini aeree o applicazioni con droni, il rilevamento di caratteristiche minuscole è una sfida storica. YOLO26 introduce ProgLoss combinato con STAL (Scale-Targeted Attention Loss), offrendo notevoli miglioramenti nel riconoscimento di piccoli oggetti rispetto a YOLO11.

Link to this sectionConfronto tra prestazioni e metriche#

Confrontando i modelli testa a testa, YOLO26 dimostra una chiara superiorità in precisione ed efficienza sui dispositivi edge, mantenendo al contempo i requisiti di memoria incredibilmente bassi caratteristici dell'ecosistema Ultralytics.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Nota: Il modello YOLO26 nano (YOLO26n) mostra un miglioramento di circa il 31% nella velocità della CPU rispetto a YOLO11n (38.9ms contro 56.1ms), evidenziando la sua filosofia di design incentrata sull'edge.

Link to this sectionVersatilità nelle attività di computer vision#

Entrambi i modelli beneficiano dell'ecosistema Ultralytics altamente mantenuto, offrendo una facilità d'uso senza pari attraverso una Python API unificata. Non sono solo rilevatori di oggetti; sono potenze multi-task. Tuttavia, YOLO26 incorpora diversi avanzamenti specifici per le attività:

  • Segmentazione di istanze: YOLO26 utilizza una perdita di segmentazione semantica raffinata e prototipazione multi-scala, generando confini della maschera più nitidi rispetto a YOLO11. Scopri di più sui workflow di segmentazione.
  • Stima della posa: Integrando la Residual Log-Likelihood Estimation (RLE), YOLO26 migliora drasticamente l'accuratezza dei punti chiave nelle pose umane complesse. Scopri le capacità di stima della posa.
  • Oriented Bounding Boxes (OBB): Una funzione di perdita dell'angolo specializzata risolve i problemi storici di discontinuità dei confini, rendendo YOLO26 eccezionalmente affidabile per il rilevamento di oggetti ruotati nei feed satellitari. Leggi le attività OBB.
  • Classificazione delle immagini: Entrambi i modelli gestiscono la classificazione ad alta velocità in modo efficiente, con YOLO26 che offre miglioramenti marginali nell'accuratezza top-1 su ImageNet.

Link to this sectionEsempio di codice per addestramento e inferenza#

Ultralytics è celebrato per la sua esperienza per gli sviluppatori. Addestrare un modello SOTA o eseguire uno script di inferenza richiede solo poche righe di codice, riducendo al minimo il boilerplate e massimizzando la produttività. Inoltre, l'addestramento dei modelli YOLO richiede molta meno memoria CUDA rispetto alle grandi reti transformer.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Link to this sectionCasi d'uso ideali e strategie di distribuzione#

La scelta tra YOLO26 e YOLO11 dipende interamente dai vincoli del tuo ambiente di produzione.

Link to this sectionQuando distribuire YOLO26#

YOLO26 è la scelta definitiva per progetti moderni e nuovi. È costruito specificamente per:

  • Edge Computing e IoT: Le sue straordinarie prestazioni della CPU e la rimozione della DFL lo rendono il re di dispositivi come Raspberry Pi, Coral NPU e processori mobili.
  • Analisi di droni e aerea: L'integrazione di ProgLoss + STAL lo rende unicamente capace di tracciare oggetti minuscoli in rapido movimento su paesaggi estesi.
  • Applicazioni a latenza critica: Nella robotica autonoma o nel controllo qualità manifatturiero, il design senza NMS garantisce una latenza deterministica senza picchi imprevisti di post-elaborazione.

Link to this sectionQuando mantenere YOLO11#

Sebbene YOLO26 sia superiore, YOLO11 rimane un modello incredibilmente capace. Potresti voler restare con YOLO11 se:

  • Pipeline legacy: La tua infrastruttura di distribuzione C++ esistente è strettamente accoppiata agli output basati su anchor specifici e alla logica NMS delle architetture più vecchie.
  • Baseline accademiche: Stai pubblicando ricerche e hai bisogno di uno standard del 2024 altamente riconosciuto per confrontare i tuoi nuovi algoritmi.

Link to this sectionLa potenza dell'ecosistema Ultralytics#

Indipendentemente dal fatto che tu distribuisca YOLO11 o YOLO26, utilizzare i modelli Ultralytics significa attingere a un ecosistema ben mantenuto con aggiornamenti frequenti e un vasto supporto della comunità.

Per i team aziendali, la Piattaforma Ultralytics fornisce una soluzione end-to-end per l'annotazione dei dati, l'addestramento dei modelli e una distribuzione cloud senza interruzioni. Dall'esportazione dei tuoi pesi addestrati su CoreML o TensorRT, alla configurazione di una ottimizzazione avanzata degli iperparametri, gli strumenti forniti assicurano che il tuo ciclo di vita AI sia il più semplificato possibile.

Collaboratori

Commenti