YOLOv10 . YOLO26: una nuova era nel rilevamento di oggetti end-to-end

L'evoluzione del rilevamento degli oggetti in tempo reale ha registrato rapidi progressi negli ultimi anni, con una forte attenzione al bilanciamento tra velocità, precisione e facilità di implementazione. Questo confronto esplora due tappe significative di questo percorso: YOLOv10, una svolta accademica che ha reso popolare il rilevamento NMS, e YOLO26, l'ultima potente soluzione pronta per la produzione di Ultralytics perfeziona questi concetti per applicazioni di livello aziendale.

Panoramica del modello

YOLOv10: il pioniere accademico

Rilasciato nel maggio 2024 dai ricercatori dell'Università di Tsinghua, YOLOv10 un cambiamento paradigmatico eliminando la necessità della soppressione non massima (NMS) durante l'inferenza. Questo approccio "end-to-end" ha risolto un annoso collo di bottiglia nelle pipeline di implementazione, dove la latenza di post-elaborazione variava spesso in modo imprevedibile a seconda della densità della scena.

Autori: Ao Wang, Hui Chen, Lihao Liu, et al.
Organizzazione:Tsinghua University
Data: 2024-05-23
Arxiv:arXiv:2405.14458
GitHub:THU-MIG/yolov10

Scopri di più su YOLOv10

YOLO26: lo standard industriale

Basato sulle fondamenta gettate dai suoi predecessori, YOLO26 (rilasciato nel gennaio 2026) è la soluzione all'avanguardia Ultralytics progettata per avere un impatto concreto. Adotta il design end-to-end NMS introdotto da YOLOv10 lo migliora con funzioni di perdita più semplici, un nuovo ottimizzatore e notevoli miglioramenti in termini di velocità sull'hardware edge.

Autori: Glenn Jocher e Jing Qiu
Organizzazione:Ultralytics
Data: 2026-01-14
GitHub:ultralytics/ultralytics

Scopri di più su YOLO26

Confronto Tecnico

Entrambi i modelli mirano a risolvere i problemi di latenza causati NMS, ma seguono percorsi diversi verso l'ottimizzazione. YOLOv10 principalmente sulla ricerca architettonica e sui doppi incarichi per l'addestramento, mentre YOLO26 dà la priorità alla semplicità di implementazione, CPU e alla stabilità dell'addestramento.

Architettura e Design

YOLOv10 ha introdotto gli assegnamenti doppi coerenti per l'addestramento NMS. Questo metodo abbina una testa uno-a-molti (per una supervisione ricca durante l'addestramento) con una testa uno-a-uno (per l'inferenza), assicurando che il modello impari a produrre un unico riquadro ottimale per ogni oggetto. Ha inoltre utilizzato un design del modello olistico basato sull'efficienza e l'accuratezza, che include teste di classificazione leggere e downsampling con disaccoppiamento dei canali spaziali.

YOLO26 perfeziona questo aspetto rimuovendo completamente la Distribution Focal Loss (DFL). Sebbene la DFL abbia contribuito alla precisione dei riquadri nelle versioni precedenti, la sua rimozione semplifica notevolmente il grafico di esportazione, rendendo i modelli YOLO26 più facili da eseguire su dispositivi edge con risorse limitate e microcontrollori a bassa potenza. Inoltre, YOLO26 incorpora il MuSGD Optimizer, un ibrido tra SGD l'ottimizzatore Muon (ispirato all'addestramento LLM), che fornisce per la prima volta la stabilità dell'addestramento di grandi batch alle attività di visione artificiale.

Metriche di performance

La tabella seguente evidenzia le differenze di prestazioni. YOLO26 dimostra una velocità superiore sulle CPU e una maggiore precisione su tutte le scale del modello, in particolare nelle varianti più grandi.

Modello	dimensione ^(pixel)	mAP^val 50-95	Velocità ^{CPU ONNX (ms)}	Velocità ^{T4 TensorRT10 (ms)}	parametri ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

Innovazione CPU

YOLO26 è ottimizzato specificamente per ambienti senza GPU dedicate. Raggiunge CPU fino al 43% più veloce rispetto alle generazioni precedenti, rendendolo una vera rivoluzione per Raspberry Pi e le implementazioni mobili.

Casi d'Uso e Applicazioni nel Mondo Reale

Quando scegliere YOLOv10

YOLOv10 una scelta eccellente per i ricercatori e per scenari specifici di sola rilevazione.

Ricerca accademica: la sua strategia a doppio incarico è un argomento affascinante per ulteriori studi sulla progettazione delle funzioni di perdita.
Pipeline legacy NMS: se un progetto è già stato realizzato sulla base dellaONNX YOLOv10 , continuerà a fornire un rilevamento affidabile e a bassa latenza.

Perché YOLO26 è la scelta migliore per la produzione

Per la maggior parte degli sviluppatori, YOLO26 offre una soluzione più robusta e versatile.

Edge Computing e IoT: le funzioni di perdita semplificate e la rimozione del DFL rendono YOLO26 ideale per l'implementazione su dispositivi edge in cui la memoria e la potenza di calcolo sono limitate.
Rilevamento di oggetti di piccole dimensioni: grazie a ProgLoss + STAL (Soft-Target Anchor Loss), YOLO26 eccelle nel rilevare oggetti di piccole dimensioni, un requisito fondamentale per le immagini aeree e le ispezioni con droni.
Multitasking complesso: a differenza di YOLOv10, che è principalmente un modello di rilevamento, YOLO26 supporta in modo nativo le attività di segmentazione delle istanze, stima della posa e bounding box orientato (OBB) all'interno dello stesso framework.

Il vantaggio di Ultralytics

La scelta di un Ultralytics come YOLO26 offre vantaggi che vanno ben oltre le semplici metriche. L'ecosistema integrato garantisce il supporto al vostro progetto dalla raccolta dei dati fino alla distribuzione finale.

Esperienza utente semplificata

La facilità d'uso offertaPython Ultralytics non ha eguali. Mentre altri repository potrebbero richiedere script di configurazione complessi, Ultralytics possono essere caricati, addestrati e implementati con un codice minimo.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Run inference without NMS post-processing
results = model("https://ultralytics.com/images/bus.jpg")

Supporto completo dell'ecosistema

YOLO26 è completamente integrato nella Ultralytics , consentendo una gestione ottimale dei set di dati, la formazione remota e l'esportazione con un solo clic in formati quali TensorRT, CoreML e OpenVINO. Questo ecosistema ben gestito garantisce l'accesso a frequenti aggiornamenti, a un vivace forum della comunità e a una documentazione completa per risolvere eventuali problemi.

Efficienza dell'addestramento e memoria

Ultralytics sono rinomati per la loro efficienza di addestramento. L'uso dell'ottimizzatore MuSGD da parte di YOLO26 consente un addestramento stabile con requisiti di memoria inferiori rispetto ai modelli basati su trasformatori come RT-DETR. Ciò significa che è possibile addestrare modelli altamente accurati su GPU di livello consumer senza esaurire la VRAM, democratizzando l'accesso a funzionalità di IA di fascia alta.

Conclusione

Entrambe le architetture rappresentano risultati significativi nel campo della visione artificiale. YOLOv10 merita il merito di aver reso popolare l'approccio NMS, dimostrando che il rilevamento end-to-end è fattibile per le applicazioni in tempo reale.

Tuttavia, YOLO26 riprende questo concetto e lo perfeziona per le esigenze pratiche del 2026. Con CPU sue CPU superiori, il supporto specializzato per oggetti di piccole dimensioni tramite ProgLoss e il supporto Ultralytics , YOLO26 è la scelta consigliata per gli sviluppatori che desiderano creare soluzioni AI scalabili e a prova di futuro. Che tu stia lavorando all'analisi intelligente della vendita al dettaglio, alla robotica autonoma o alla produzione ad alta velocità, YOLO26 offre il bilanciamento delle prestazioni necessario per il successo.

Altri modelli da esplorare

YOLO11: Il robusto predecessore di YOLO26, ancora ampiamente utilizzato nella produzione.
RT-DETR: un'alternativa basata su trasformatori che offre un'elevata precisione per scenari in cui GPU sono abbondanti.
YOLO: ideale per attività di rilevamento con vocabolario aperto in cui le classi sono definite da prompt di testo.