Vai al contenuto

YOLO26 vs. YOLO11: una nuova era per l'intelligenza artificiale visiva end-to-end

L'evoluzione del rilevamento degli oggetti è stata caratterizzata da una ricerca incessante di velocità, precisione ed efficienza. Due delle tappe più significative di questo percorso sono YOLO26 e YOLO11. Entrambi i modelli derivano dalla ricerca innovativa condotta da Ultralytics, rappresentano generazioni diverse di filosofia architettonica. Questo confronto approfondisce le sfumature tecniche di queste architetture, aiutando sviluppatori e ricercatori a scegliere lo strumento giusto per le loro specifiche applicazioni di visione artificiale.

Confronto delle metriche di performance

La tabella seguente evidenzia le differenze di prestazioni tra le due famiglie di modelli sul COCO . Si noti il significativo aumento della velocità CPU per YOLO26, risultato diretto delle ottimizzazioni architetturali.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Evoluzione Architetturale

YOLO26: La rivoluzione NMS

Rilasciato nel gennaio 2026, YOLO26 rappresenta un cambiamento paradigmatico verso il rilevamento nativo end-to-end degli oggetti. A differenza dei rilevatori tradizionali che si basano su fasi di post-elaborazione euristica come la soppressione non massima (NMS) per filtrare i riquadri di delimitazione duplicati, YOLO26 incorpora questa logica direttamente nell'architettura di rete. Questo concetto, originariamente sperimentato in ricerche come YOLOv10, è stato perfezionato per garantire la stabilità della produzione in YOLO26.

Le innovazioni architettoniche chiave includono:

  • Progettazione end-to-end NMS: eliminando NMS, YOLO26 semplifica la pipeline di implementazione. Ciò è particolarmente vantaggioso per gli scenari di edge computing in cui la variabilità NMS può causare jitter nelle applicazioni in tempo reale.
  • Rimozione DFL: la rimozione della perdita focale di distribuzione (DFL) semplifica i livelli di output del modello. Questa modifica migliora significativamente la compatibilità con i dispositivi a bassa potenza e semplifica l'esportazione del modello in formati come ONNX CoreML, poiché richiede un numero inferiore di operatori personalizzati.
  • Ottimizzatore MuSGD: ispirato alle innovazioni nella formazione dei modelli linguistici di grandi dimensioni (LLM) come Kimi K2 di Moonshot AI, YOLO26 utilizza un ottimizzatore ibrido che combina SGD Muon. Ciò garantisce una stabilità superiore alle sessioni di formazione, consentendo una convergenza più rapida anche con set di dati complessi.
  • ProgLoss + STAL: l'introduzione delle funzioni Progressive Loss (ProgLoss) e Self-Training Anchor Loss (STAL) offre notevoli miglioramenti nel rilevamento di oggetti di piccole dimensioni. Queste funzioni di perdita regolano dinamicamente la messa a fuoco durante l'addestramento, garantendo che gli esempi difficili, spesso oggetti piccoli o occlusi, vengano appresi in modo più efficace.

Perché CPU è importante

La tabella sopra mostra che YOLO26n raggiunge 38,9 ms sulla CPU ai 56,1 ms di YOLO11n. Questo aumento del 43% nella velocità CPU sblocca l'analisi in tempo reale su hardware di livello consumer, riducendo la necessità di costose GPU dedicate nelle implementazioni retail e IoT.

Scopri di più su YOLO26

YOLO11: Lo standard robusto

YOLO11, rilasciato nel settembre 2024, si basa sull'eredità di YOLOv8 il blocco C3k2 e perfezionamenti al modulo SPPF (Spatial Pyramid Pooling - Fast). Pur rimanendo un modello altamente performante e robusto, si affida al tradizionale rilevatore senza ancoraggio che richiede NMS .

YOLO11 in scenari in cui è richiesto un ampio supporto legacy o in cui si dipende da specifiche peculiarità architetturali delle generazioni precedenti. Tuttavia, rispetto all'architettura semplificata di YOLO26, comporta un carico computazionale leggermente superiore durante la fase di post-elaborazione, che può diventare un collo di bottiglia in ambienti ad alta produttività.

Scopri di più su YOLO11

Casi d'uso ideali

Quando Scegliere YOLO26

YOLO26 è la scelta consigliata per praticamente tutti i nuovi progetti, in particolare quelli che danno priorità all'efficienza e alla facilità di implementazione.

  1. Edge AI e IoT: grazie alla notevole CPU e al design NMS, YOLO26 è perfetto per dispositivi come Raspberry Pi o NVIDIA . La minore varianza di latenza è fondamentale per la robotica, dove è richiesta una temporizzazione costante per i circuiti di controllo.
  2. Compiti di visione complessi: oltre al rilevamento, YOLO26 offre miglioramenti specifici per determinati compiti. Ad esempio, la stima della log-verosimiglianza residua (RLE) aumenta significativamente la precisione nella stima della posa, mentre le funzioni di perdita angolare specializzate migliorano la precisione dell'Oriented Bounding Box (OBB) per le immagini aeree.
  3. Applicazioni a basso consumo energetico: grazie all'eliminazione del DFL e all'architettura ottimizzata, YOLO26 consuma meno energia per ogni inferenza, prolungando la durata della batteria nelle applicazioni mobili.

Quando scegliere YOLO11

YOLO11 un'opzione valida per:

  • Sistemi legacy: se disponete di una pipeline esistente fortemente ottimizzata per il formato di output specifico YOLO11 e non potete permettervi il tempo necessario per aggiornare la logica di post-elaborazione (anche se la transizione a YOLO26 è generalmente trasparente con Ultralytics).
  • Linee guida di riferimento: i ricercatori utilizzano spesso modelli ampiamente adottati come YOLO11 YOLOv8 come linee di riferimento per confrontare le nuove architetture.

Il vantaggio di Ultralytics

Sia che scegliate YOLO26 o YOLO11, sfruttare Ultralytics offre vantaggi distintivi rispetto ai framework concorrenti.

Facilità d'uso e versatilità

Ultralytics sono progettati per un'esperienza "zero-to-hero". Una singola Python supporta il rilevamento, la segmentazione, la classificazione e il tracciamento. Questa versatilità consente ai team di ingegneri di passare da un'attività all'altra senza dover apprendere nuovi codici di base.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")

Efficienza di Addestramento e Memoria

Entrambi i modelli sono ottimizzati per l'efficienza dell'addestramento, ma l'ottimizzatore MuSGD di YOLO26 stabilizza ulteriormente questo processo. A differenza dei modelli basati su trasformatori massivi che richiedono una notevole quantità di VRAM,YOLO Ultralytics possono spesso essere ottimizzati su GPU di livello consumer, democratizzando l'accesso all'intelligenza artificiale all'avanguardia.

Ecosistema ben mantenuto

Ultralytics e la libreria open source garantiscono che i vostri progetti siano a prova di futuro. Grazie ad aggiornamenti frequenti, una documentazione completa e strumenti per la gestione dei set di dati e la formazione sul cloud, potrete contare sul supporto di una solida comunità e di un team di sviluppo attivo.

Metadati del modello

YOLO26

YOLO11

Esplora altri modelli

Per gli utenti interessati a esplorare diverse architetture, Ultralytics supporta Ultralytics RT-DETR per il rilevamento basato su trasformatori e SAM per attività di segmentazione zero-shot.

Conclusione

Mentre YOLO11 rimane un modello robusto e capace, YOLO26 stabilisce un nuovo standard in termini di efficienza e velocità. Il suo design end-to-end NMS, combinato con significative ottimizzazioni CPU e funzioni di perdita avanzate, lo rende la scelta migliore per le moderne applicazioni di visione artificiale. Adottando YOLO26, gli sviluppatori possono ottenere una maggiore precisione e prestazioni più veloci con minore complessità, il tutto rimanendo all'interno Ultralytics di facile utilizzo.


Commenti