Vai al contenuto

YOLOv5 YOLO11: un ponte tra tradizione e innovazione nel rilevamento degli oggetti

L'evoluzione dell'architettura YOLO You Only Look Once) ha rappresentato un percorso determinante nel campo della visione artificiale. Dall'affidabilità fondamentale di YOLOv5 avanzata di YOLO11, ogni iterazione ha ampliato i confini della velocità e della precisione. Questa guida fornisce un confronto tecnico dettagliato per aiutare sviluppatori, ricercatori e ingegneri a scegliere il modello più adatto alle loro specifiche esigenze di implementazione.

Panoramica del modello

YOLOv5: lo standard del settore

Pubblicato nel 2020 da Glenn Jocher e Ultralytics, YOLOv5 è diventato rapidamente il punto di riferimento per il rilevamento pratico degli oggetti. È stato il primo YOLO implementato in modo nativo in PyTorch, rendendolo eccezionalmente accessibile alla più ampia comunità di IA. Il suo equilibrio tra facilità d'uso, pipeline di formazione robuste e flessibilità di implementazione ha consolidato la sua posizione in migliaia di applicazioni accademiche e industriali.

Scopri di più su YOLOv5

YOLO11: Il raffinato successore

YOLO11, rilasciato nel 2024, rappresenta un significativo passo avanti nella Ultralytics . Basandosi sui progressi architettonici di YOLOv8, introduce una struttura backbone e head perfezionata, progettata per garantire un'estrazione delle caratteristiche e un'efficienza superiori. YOLO11 sulla massimizzazione del rapporto accuratezza-calcolo, offrendo una precisione media (mAP) più elevata con un numero inferiore di parametri rispetto ai suoi predecessori.

Scopri di più su YOLO11

Ultima raccomandazione

Sebbene YOLO11 miglioramenti significativi rispetto a YOLOv5, gli sviluppatori che iniziano nuovi progetti nel 2026 dovrebbero valutare anche YOLO26. È caratterizzato da un design nativamente end-to-end (che elimina NMS), un innovativo ottimizzatore MuSGD e CPU fino al 43% più veloce, che lo rendono la scelta ideale per le moderne implementazioni edge.

Confronto dell'Architettura Tecnica

Backbone ed estrazione delle feature

YOLOv5 utilizza una dorsale CSPDarknet. Questo design di rete Cross-Stage Partial è stato rivoluzionario per ridurre la ridondanza computazionale mantenendo un flusso di gradiente ricco. Bilancia efficacemente profondità e ampiezza, consentendo al modello di apprendere caratteristiche complesse senza aumentare eccessivamente il numero di parametri.

YOLO11 evolve questo concetto con una dorsale CSP potenziata (C3k2) e introduce meccanismi di attenzione spaziale migliorati. L'architettura è specificamente ottimizzata per catturare dettagli molto precisi, il che migliora significativamente le prestazioni nel rilevamento di oggetti di piccole dimensioni. Questo design raffinato consente YOLO11 raggiungere una maggiore precisione con un ingombro del modello ridotto.

Detection Head

La testa di rilevamento in YOLOv5 è basata su anchor, ovvero si affida a riquadri di ancoraggio predefiniti per prevedere la posizione degli oggetti. Sebbene efficace, questo approccio richiede un'attenta regolazione degli iperparametri delle dimensioni degli anchor per i set di dati personalizzati.

YOLO11 adotta una testa di rilevamento senza ancoraggio. Questo approccio moderno semplifica il processo di addestramento prevedendo direttamente i centri e le dimensioni degli oggetti, eliminando la necessità di calcoli dell'ancoraggio. Ciò non solo semplifica la pipeline di addestramento, ma migliora anche la generalizzazione tra diverse forme e proporzioni degli oggetti.

Metriche di performance

La tabella seguente evidenzia le differenze di prestazioni tra YOLOv5 YOLO11. Un'osservazione fondamentale è il compromesso tra velocità e precisione. YOLO11 ottiene YOLO11 mAP più elevati, mantenendo velocità di inferenza competitive o superiori, in particolare su GPU .

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv5n64028.073.61.121.94.5
YOLOv5s64037.4120.71.927.216.5
YOLOv5m64045.4233.94.0321.249.0
YOLOv5l64049.0408.46.6146.5109.1
YOLOv5x64050.7763.211.8986.7205.7
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Analisi:

  • Precisione: YOLO11n (Nano) raggiunge un impressionante mAP del 39,5%, superando significativamente il 28,0% di YOLOv5n. Ciò rende YOLO11 scelta di gran lunga superiore per applicazioni leggere che richiedono un'elevata precisione.
  • Velocità: YOLO11 dimostrano velocità CPU più elevate in ONNX , fondamentale per l'implementazione suGPU .
  • Efficienza: YOLO11 questi risultati con un numero di parametri comparabile o spesso inferiore (ad esempio, YOLO11x rispetto a YOLOv5x), dimostrando l'efficienza delle sue ottimizzazioni architetturali.

Formazione ed ecosistema

Facilità d'uso

Entrambi i modelli beneficiano del rinomato Ultralytics , che dà priorità all'esperienza degli sviluppatori.

  • YOLOv5 ha definito lo standard per "iniziare l'addestramento in 5 minuti" grazie alla sua struttura intuitiva e all'utilizzo di standard PyTorch .
  • YOLO11 si integra perfettamente nell'ambiente unificato ultralytics Python . Questo pacchetto fornisce un'API coerente per tutte le attività, il che significa che il passaggio da Rilevamento a Segmentazione delle istanze oppure Stima della posa richiede la modifica di un solo argomento stringa.

Efficienza dell'addestramento

YOLO11 routine di addestramento ottimizzate che spesso portano a una convergenza più rapida. Funzionalità come l'aumento del mosaico sono state perfezionate e il design senza ancoraggio elimina la fase di pre-elaborazione dell'evoluzione dell'auto-ancoraggio presente in YOLOv5. Inoltre, entrambi i modelli mostrano un utilizzo di memoria significativamente inferiore durante l'addestramento rispetto ai rilevatori basati su trasformatori come RT-DETR, consentendo batch di dimensioni maggiori su GPU consumer.

Formazione con l'Ultralytics

L'addestramento YOLO11 incredibilmente semplice utilizzando Python . La stessa sintassi si applica a YOLOv5 il ultralytics package.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Versatilità

Mentre YOLOv5 il supporto per la segmentazione e la classificazione in una fase successiva del suo ciclo di vita, YOLO11 progettato fin dall'inizio come un sistema di apprendimento multi-task. Supporta nativamente:

  • Rilevamento di oggetti
  • Segmentazione delle istanze
  • Classificazione delle immagini
  • Stima della posa
  • Oriented Bounding Box (OBB)

Questo rende YOLO11 più versatile, simile a un "coltellino svizzero", per pipeline di visione artificiale complesse in cui sono necessari più tipi di analisi contemporaneamente.

Casi d'uso ideali

Quando scegliere YOLOv5

  • Sistemi legacy: Se disponi già di una pipeline di produzione basata sullo specifico formato YOLOv5 o requirements.txt, continuare con YOLOv5 stabilità.
  • Limitazioni hardware specifiche: su hardware estremamente obsoleto o implementazioni FPGA specifiche, l'architettura più semplice di YOLOv5 disporre di bitstream ottimizzati esistenti.
  • Replica della ricerca: per riprodurre articoli accademici dal 2020 al 2023 che hanno utilizzato YOLOv5 base di riferimento.

Quando scegliere YOLO11

  • Implementazione dell'Edge AI: l'eccellente rapporto velocità-precisione rende YOLO11 per dispositivi come NVIDIA o Raspberry Pi, in particolare per l'elaborazione video in tempo reale.
  • Requisiti di elevata precisione: applicazioni nell'imaging medico o nel rilevamento di difetti in cui ogni punto percentuale di mAP .
  • Applicazioni multi-task: i progetti che richiedono la stima della posa (ad esempio, analisi sportive) o riquadri di delimitazione ruotati (ad esempio, rilevamento aereo) traggono vantaggio dal supporto nativo YOLO11.
  • Formazione sul cloud: utilizzo della Ultralytics per la gestione semplificata dei set di dati e l'addestramento dei modelli.

Conclusione

Sia YOLOv5 YOLO11 l'impegno Ultralytics verso l'eccellenza open source. YOLOv5 rimane uno strumento affidabile e collaudato. Tuttavia, YOLO11 offre un percorso di aggiornamento interessante grazie alle sue raffinatezze architetturali, alla precisione superiore e al supporto più ampio delle attività.

Per gli sviluppatori che guardano al futuro, la scelta è chiara: YOLO11 il vantaggio prestazionale necessario per le applicazioni moderne. Per chi è alla ricerca della tecnologia più all'avanguardia, consigliamo vivamente di provare anche YOLO26, che introduce il rilevamento end-to-end NMS per un'implementazione ancora più semplice.

Esplora la documentazione di YOLO26

Altri modelli che potrebbero interessarti includono YOLOv10 per la ricerca sulle prestazioni in tempo reale o YOLO per il rilevamento a vocabolario aperto.


Commenti