Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 contro YOLO11#

Quando costruisci sistemi di visione artificiale all'avanguardia, la scelta del modello giusto è fondamentale per bilanciare precisione, latenza ed efficienza delle risorse. Nel panorama in rapida evoluzione dell'intelligenza artificiale, Ultralytics continua a superare i confini di ciò che è possibile. Questo confronto tecnico dettagliato esplora il passaggio dal grande successo YOLO11 al rivoluzionario nuovo YOLO26, fornendo a ingegneri e ricercatori AI le intuizioni necessarie per prendere decisioni architetturali informate.

Link to this sectionOrigine e metadati del modello#

Entrambi i modelli sono stati sviluppati da Ultralytics, ma rappresentano paradigmi diversi nella linea temporale del rilevamento oggetti e dei modelli di visione multi-task.

Dettagli di YOLO26:

Scopri di più su YOLO26

Dettagli YOLO11:

Scopri di più su YOLO11

Altre architetture

Mentre YOLO26 è il nostro modello real-time più avanzato, gli utenti che lavorano con hardware altamente specializzato o capacità di memoria massicce potrebbero esplorare anche architetture basate su Transformer come RT-DETR o il rivoluzionario pioniere senza NMS, YOLOv10.

Link to this sectionDifferenze architetturali e innovazioni#

Il salto da YOLO11 a YOLO26 comporta cambiamenti fondamentali sia nell'architettura del modello che nel regime di addestramento sottostante. Mentre YOLO11 ha stabilito una solida base per il rilevamento oggetti e l'apprendimento multi-task, YOLO26 rivoluziona completamente la pipeline di distribuzione per l'edge computing.

Link to this sectionDesign end-to-end senza NMS#

Uno degli aggiornamenti più significativi in YOLO26 è la sua architettura nativamente end-to-end. A differenza di YOLO11, che si affida al post-processing Non-Maximum Suppression (NMS) per filtrare i bounding box sovrapposti, YOLO26 elimina completamente questo passaggio. Questo concetto, introdotto per la prima volta in YOLOv10, riduce drasticamente la variabilità della latenza e semplifica la logica di distribuzione su diversi dispositivi edge.

Link to this sectionRimozione di DFL per l'efficienza edge#

YOLO11 utilizza la Distribution Focal Loss (DFL) per perfezionare le stime dei bounding box. Tuttavia, la DFL si basa su complesse operazioni softmax spesso poco supportate dagli acceleratori edge a basso consumo. YOLO26 rimuove con successo la DFL senza sacrificare la precisione. Questa semplificazione architetturale si traduce in una compatibilità notevolmente migliorata con i sistemi embedded e consente a YOLO26 di raggiungere fino al 43% di velocità di inferenza CPU in più rispetto al suo predecessore.

Link to this sectionL'ottimizzatore MuSGD#

La stabilità e la velocità dell'addestramento sono fondamentali. YOLO26 introduce l'ottimizzatore MuSGD, un ibrido tra Stochastic Gradient Descent (SGD) e Muon, fortemente ispirato alle innovazioni nell'addestramento dei LLM di Kimi K2 di Moonshot AI. Questo ottimizzatore porta la stabilità dell'addestramento dei modelli linguistici alla visione artificiale, garantendo una convergenza più rapida e riducendo l'impronta di memoria durante l'addestramento rispetto alle pesanti alternative transformer.

Link to this sectionProgLoss e STAL#

Per i ricercatori che lavorano con immagini aeree o applicazioni con droni, il rilevamento di caratteristiche minuscole è una sfida storica. YOLO26 introduce ProgLoss combinato con STAL (Scale-Targeted Attention Loss), offrendo miglioramenti notevoli nel riconoscimento di piccoli oggetti rispetto a YOLO11.

Link to this sectionConfronto tra prestazioni e metriche#

Confrontando i modelli testa a testa, YOLO26 dimostra una netta superiorità in precisione ed efficienza sui dispositivi edge, mantenendo al contempo i requisiti di memoria incredibilmente bassi caratteristici dell'ecosistema Ultralytics.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Nota: Il modello YOLO26 nano (YOLO26n) mostra un miglioramento di circa il 31% nella velocità della CPU rispetto a YOLO11n (38.9ms contro 56.1ms), evidenziando la sua filosofia di design incentrata sull'edge.

Link to this sectionVersatilità attraverso le attività di visione artificiale#

Entrambi i modelli traggono vantaggio dall'ecosistema Ultralytics, altamente manutenuto, offrendo una facilità d'uso senza pari attraverso una API Python unificata. Non sono solo rilevatori di oggetti; sono potenze multi-task. Tuttavia, YOLO26 incorpora diversi progressi specifici per ogni attività:

  • Segmentazione di istanze: YOLO26 utilizza una perdita di segmentazione semantica raffinata e la prototipazione multi-scala, generando confini di maschera più nitidi rispetto a YOLO11. Scopri di più sui flussi di lavoro di segmentazione.
  • Stima della posa: Integrando la Residual Log-Likelihood Estimation (RLE), YOLO26 migliora drasticamente la precisione dei punti chiave nelle pose umane complesse. Scopri le funzionalità di stima della posa.
  • Bounding Box orientati (OBB): Una funzione di perdita angolare specializzata risolve i problemi storici di discontinuità dei bordi, rendendo YOLO26 eccezionalmente affidabile per il rilevamento di oggetti ruotati nei feed satellitari. Leggi le attività OBB.
  • Classificazione delle immagini: Entrambi i modelli gestiscono la classificazione ad alta velocità in modo efficiente, con YOLO26 che offre miglioramenti marginali nella precisione top-1 su ImageNet.

Link to this sectionEsempio di codice per addestramento e inferenza#

Ultralytics is celebrated for its developer experience. Training a SOTA model or running an inference script takes only a few lines of code, minimizing boilerplate and maximizing productivity. Furthermore, training YOLO models requires significantly less CUDA memory than large transformer networks.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Link to this sectionCasi d'uso ideali e strategie di distribuzione#

Scegliere tra YOLO26 e YOLO11 dipende interamente dai vincoli del tuo ambiente di produzione.

Link to this sectionQuando distribuire YOLO26#

YOLO26 è la scelta definitiva per progetti moderni e da zero. È costruito specificamente per:

  • Edge Computing e IoT: Le sue straordinarie prestazioni CPU e la rimozione di DFL lo rendono il re di dispositivi come Raspberry Pi, NPU Coral e processori mobili.
  • Analisi di droni e aeree: L'integrazione di ProgLoss + STAL lo rende unicamente capace di tracciare oggetti minuscoli e in rapido movimento su paesaggi estesi.
  • Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.

Link to this sectionQuando mantenere YOLO11#

Sebbene YOLO26 sia superiore, YOLO11 rimane un modello incredibilmente capace. Potresti voler restare con YOLO11 se:

  • Pipeline legacy: La tua infrastruttura di distribuzione C++ esistente è strettamente accoppiata alle specifiche uscite basate su anchor e alla logica NMS delle architetture più vecchie.
  • Baselines accademiche: Stai pubblicando una ricerca e hai bisogno di uno standard del 2024 altamente riconosciuto per confrontare i tuoi nuovi algoritmi.

Link to this sectionIl potere dell'ecosistema Ultralytics#

Indipendentemente dal fatto che tu distribuisca YOLO11 o YOLO26, utilizzare i modelli Ultralytics significa attingere a un ecosistema ben manutenuto con aggiornamenti frequenti e un vasto supporto della community.

Per i team aziendali, la piattaforma Ultralytics fornisce una soluzione end-to-end per l'annotazione dei dati, l'addestramento del modello e la distribuzione cloud senza interruzioni. Dall'esportazione dei tuoi pesi addestrati su CoreML o TensorRT, alla configurazione dell'ottimizzazione avanzata degli iperparametri, gli strumenti forniti assicurano che il ciclo di vita della tua AI sia il più snello possibile.

Collaboratori

Commenti