YOLOv8 vs YOLO11: Un Confronto Tecnico Dettagliato
Quando si seleziona un modello di computer vision, in particolare per il rilevamento di oggetti, è essenziale comprendere i punti di forza e di debolezza delle diverse architetture. Questa pagina offre un confronto tecnico dettagliato tra Ultralytics YOLOv8 e Ultralytics YOLO11, due modelli all'avanguardia di Ultralytics progettati per il rilevamento di oggetti e altre attività di visione. Analizzeremo le loro sfumature architetturali, i benchmark di prestazione e le applicazioni adatte per guidarti nel prendere una decisione informata per il tuo progetto.
Ultralytics YOLOv8
Autori: Glenn Jocher, Ayush Chaurasia e Jing Qiu
Organizzazione: Ultralytics
Data: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Documenti: https://docs.ultralytics.com/models/yolov8/
Rilasciato all'inizio del 2023, YOLOv8 è diventato rapidamente un punto di riferimento per l'object detection in tempo reale, offrendo un significativo passo avanti in termini di prestazioni rispetto alle versioni precedenti. Ha introdotto un meccanismo di detection senza ancore e un nuovo backbone basato su CSPDarknet53, che ha migliorato sia la precisione che la velocità. YOLOv8 è un modello estremamente versatile, che supporta una gamma completa di attività di visione artificiale, tra cui detection, instance segmentation, pose estimation e image classification.
Architettura e caratteristiche principali
L'architettura di YOLOv8 è progettata per efficienza e flessibilità. La sua testa anchor-free riduce il numero di predizioni di riquadri, semplificando la pipeline di post-elaborazione e velocizzando l'inferenza. Il modello è stato progettato come un framework completo, non solo come un singolo modello, fornendo una piattaforma unificata per l'addestramento di modelli per vari compiti. Questa integrazione nell'ecosistema Ultralytics significa che gli utenti beneficiano di un flusso di lavoro semplificato, dall'addestramento all'implementazione, supportato da un'ampia documentazione e da un solido set di strumenti.
Punti di forza
- Prestazioni comprovate: Un modello altamente affidabile e ampiamente adottato che ha stabilito standard di settore per prestazioni e velocità.
- Versatilità del task: Un singolo framework unificato in grado di gestire rilevamento, segmentazione, classificazione e stima della posa.
- Ecosistema Maturo: Beneficia di un vasto numero di tutorial della comunità, integrazioni di terze parti e una diffusa implementazione in ambienti di produzione.
- Facilità d'uso: Dispone di una semplice API Python e CLI, che lo rende accessibile sia ai principianti che agli esperti.
Punti deboli
- Pur rimanendo un modello dalle prestazioni elevate, la sua accuratezza e velocità sono state superate dal suo successore, YOLO11, specialmente in scenari vincolati dalla CPU.
- I modelli più grandi (YOLOv8l, YOLOv8x) possono essere intensivi dal punto di vista computazionale, richiedendo notevoli risorse GPU per prestazioni in tempo reale.
Casi d'uso
YOLOv8 rimane una scelta eccellente per una vasta gamma di applicazioni, specialmente dove la stabilità e un ecosistema maturo sono apprezzati. Eccelle in:
- Automazione industriale: Per il controllo qualità e il rilevamento dei difetti nel settore manifatturiero.
- Sistemi di sicurezza: Alimentazione di sistemi di sicurezza avanzati per il monitoraggio in tempo reale e il rilevamento delle intrusioni.
- Analisi Dati nel Retail: Miglioramento della gestione dell'inventario e analisi del comportamento dei clienti.
Ultralytics YOLO11
Autori: Glenn Jocher e Jing Qiu
Organizzazione: Ultralytics
Data: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Documenti: https://docs.ultralytics.com/models/yolo11/
YOLO11 è l'ultima evoluzione della serie Ultralytics YOLO, progettata per un'accuratezza ed efficienza superiori. Basandosi sulla solida base di YOLOv8, YOLO11 introduce perfezionamenti architetturali che ottimizzano l'estrazione e l'elaborazione delle caratteristiche. Ciò si traduce in una maggiore precisione di rilevamento con meno parametri e velocità di inferenza più elevate, in particolare sulle CPU. Come il suo predecessore, YOLO11 è un modello multi-task che supporta il rilevamento, la segmentazione, la classificazione, la stima della posa e i bounding box orientati (OBB) all'interno dello stesso framework semplificato.
Architettura e caratteristiche principali
YOLO11 perfeziona la struttura della rete per ottenere un migliore equilibrio tra costo computazionale e prestazioni. Ottiene una maggiore accuratezza con un numero inferiore di parametri e meno FLOP rispetto a YOLOv8, come mostrato nella tabella delle prestazioni di seguito. Questa efficienza lo rende altamente adatto per l'implementazione su una vasta gamma di hardware, dai dispositivi edge con risorse limitate ai potenti server cloud. Un vantaggio chiave di YOLO11 è la sua perfetta integrazione nell'ecosistema Ultralytics ben mantenuto, che garantisce un'eccellente esperienza utente, processi di training efficienti con pesi pre-addestrati prontamente disponibili e un minore utilizzo di memoria durante il training e l'inferenza.
Punti di forza
- Accuratezza all'avanguardia: Offre punteggi mAP più elevati rispetto a YOLOv8 in tutte le dimensioni del modello, stabilendo un nuovo standard per il rilevamento di oggetti.
- Efficienza Migliorata: Offre velocità di inferenza significativamente più elevate, specialmente su CPU, richiedendo al contempo meno parametri e FLOP.
- Bilanciamento delle prestazioni: Fornisce un compromesso eccezionale tra velocità e precisione, rendendolo ideale per diverse applicazioni reali.
- Scalabilità e versatilità: Offre prestazioni elevate su vari hardware e supporta molteplici attività di computer vision all'interno di un framework singolo e facile da usare.
- Ecosistema ben manutenuto: Benefici derivanti da sviluppo attivo, forte supporto della comunità tramite GitHub e Discord, e aggiornamenti frequenti.
Punti deboli
- Essendo un modello più recente, inizialmente potrebbe avere meno integrazioni di terze parti rispetto al più consolidato YOLOv8.
- I modelli più grandi (ad esempio, YOLO11x) richiedono ancora una notevole potenza di calcolo per l'addestramento e il deployment, una caratteristica comune dei rilevatori ad alta precisione.
Casi d'uso
YOLO11 è la scelta consigliata per i nuovi progetti che richiedono i massimi livelli di accuratezza e prestazioni in tempo reale. La sua efficienza lo rende ideale per:
- Robotica: Consente una navigazione precisa e l'interazione con gli oggetti nei sistemi autonomi.
- Sanità: Supporto nell'analisi di immagini medicali per applicazioni come il rilevamento di tumori.
- Smart City: Potenzia sistemi intelligenti di gestione del traffico e sicurezza pubblica.
Confronto diretto delle prestazioni: YOLOv8 contro YOLO11
La differenza principale tra YOLOv8 e YOLO11 risiede nelle prestazioni. YOLO11 supera costantemente YOLOv8 offrendo una maggiore accuratezza (mAP) con una maggiore efficienza (meno parametri e velocità più elevate). Ad esempio, YOLO11l raggiunge una mAP più alta (53.4) rispetto a YOLOv8l (52.9) con quasi il 42% in meno di parametri ed è significativamente più veloce sulla CPU. Questa tendenza vale per tutte le varianti del modello, rendendo YOLO11 un successore più potente ed efficiente.
Modello | dimensione (pixel) |
mAPval 50-95 |
Velocità CPU ONNX (ms) |
Velocità T4 TensorRT10 (ms) |
parametri (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusione e raccomandazioni
Sia YOLOv8 che YOLO11 sono modelli eccezionali, ma soddisfano esigenze leggermente diverse.
-
YOLOv8 è un modello robusto e maturo, il che lo rende una scommessa sicura per progetti già costruiti su di esso o che si affidano fortemente al suo vasto ecosistema di strumenti e tutorial di terze parti esistenti. Rimane una scelta formidabile per una vasta gamma di attività di computer vision.
-
YOLO11 è il chiaro vincitore in termini di prestazioni ed efficienza. Rappresenta l'avanguardia del rilevamento di oggetti in tempo reale. Per qualsiasi nuovo progetto, YOLO11 è il punto di partenza consigliato. La sua accuratezza superiore, le velocità di inferenza più elevate (specialmente su CPU) e l'architettura più efficiente offrono un vantaggio significativo e rendono la tua applicazione a prova di futuro. Il supporto continuo e lo sviluppo all'interno dell'ecosistema Ultralytics rafforzano ulteriormente la sua posizione come la scelta principale per sviluppatori e ricercatori.
Per chi fosse interessato a esplorare altri modelli, Ultralytics supporta anche una vasta gamma di architetture, tra cui il modello base YOLOv5, il recente YOLOv9 e modelli basati su transformer come RT-DETR. Ulteriori confronti sono disponibili nella nostra pagina di confronto dei modelli.