YOLOv8 vs YOLO: confronto tecnico dettagliato
La scelta del giusto modello di rilevamento degli oggetti è fondamentale per i progetti di computer vision. Questa pagina offre un confronto tecnico tra Ultralytics YOLOv8 e YOLO, due modelli all'avanguardia, analizzandone le architetture, le prestazioni e le applicazioni.
Ultralytics YOLOv8
Ultralytics YOLOv8 è l'ultima iterazione della serie YOLO , nota per il suo equilibrio tra velocità e precisione nel rilevamento degli oggetti e in altre attività di visione come la segmentazione delle istanze e la stima della posa. Sviluppato da Glenn Jocher, Ayush Chaurasia e Jing Qiu di Ultralytics e rilasciato il 2023-01-10, YOLOv8 si basa sulle versioni precedenti di YOLO con miglioramenti architetturali e un'attenzione particolare alla facilità d'uso. La documentazione sottolinea la facilità d'uso e la versatilità, rendendolo adatto a un'ampia gamma di applicazioni e utenti, dai principianti agli esperti.
Punti di forza:
- Prestazioni: YOLOv8 raggiunge lo stato dell'arte della mAP mantenendo un'impressionante velocità di inferenza. Offre modelli di varie dimensioni (n, s, m, l, x) per soddisfare le diverse esigenze di calcolo.
- Versatilità: Oltre al rilevamento degli oggetti, YOLOv8 supporta diverse attività di visione, tra cui la segmentazione, la classificazione e la stima della posa, fornendo una soluzione unificata per le diverse esigenze di computer vision.
- Facilità d'uso: Ultralytics fornisce una documentazione e strumenti completi, che semplificano la formazione, l'implementazione e l'integrazione con piattaforme come Ultralytics HUB.
- Supporto della comunità: Una comunità open-source ampia e attiva garantisce un miglioramento continuo e un ampio supporto.
Punti deboli:
- Intenso di risorse: I modelli YOLOv8 più grandi richiedono risorse computazionali significative per l'addestramento e l'inferenza.
- Esigenze di ottimizzazione: Per i dispositivi con risorse estremamente limitate, potrebbe essere necessaria un'ulteriore ottimizzazione, come il pruning del modello.
Casi d'uso:
La versatilità di YOLOv8 lo rende ideale per un ampio spettro di applicazioni, dall'analisi video in tempo reale nei sistemi di sicurezza e nelle città intelligenti alle attività complesse nel settore sanitario e manifatturiero. La sua facilità d'uso lo rende inoltre eccellente per la prototipazione e lo sviluppo rapidi.
DAMO-YOLO
YOLO è un modello di rilevamento degli oggetti sviluppato da Alibaba Group e presentato in un documento pubblicato su ArXiv il 2022-11-23. Scritto da Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun, YOLO si concentra sulla creazione di un rilevatore veloce e preciso utilizzando tecniche innovative. Queste includono backbone basati su NAS, un efficiente RepGFPN e uno ZeroHead, oltre a strategie di formazione avanzate come AlignedOTA e il miglioramento della distillazione. La documentazione ufficiale e il repository GitHub forniscono dettagli sulla sua architettura e implementazione.
Punti di forza:
- Alta precisione: YOLO è stato progettato per garantire un'elevata precisione, ottenendo punteggi mAP competitivi, eccellendo in particolare negli scenari che richiedono un rilevamento preciso degli oggetti.
- Design efficiente: Le innovazioni architettoniche, come lo ZeroHead, contribuiscono a creare un modello semplificato, bilanciando l'accuratezza con l'efficienza computazionale.
- Tecniche avanzate: Incorpora tecniche all'avanguardia come Neural Architecture Search (NAS) per la progettazione della struttura portante e AlignedOTA per l'ottimizzazione dell'addestramento.
Punti deboli:
- Versatilità limitata: Si concentra principalmente sul rilevamento di oggetti e manca delle capacità multi-task di YOLOv8.
- Documentazione e comunità: Rispetto a YOLOv8, YOLO potrebbe avere una comunità più ristretta e una documentazione meno estesa, il che potrebbe rappresentare una sfida per i nuovi utenti o per coloro che cercano un ampio supporto.
- Velocità di inferenza: sebbene efficiente, i confronti diretti con YOLOv8 su benchmark standard sono meno disponibili e la velocità può variare in base a implementazioni e hardware specifici.
Casi d'uso:
YOLO è adatto ad applicazioni in cui l'accuratezza del rilevamento è fondamentale, come nella guida autonoma, nell'ispezione industriale di alta precisione e nei sistemi di videosorveglianza avanzati. La sua attenzione all'accuratezza e all'efficienza lo rende un forte concorrente per gli scenari in cui il rilevamento dettagliato e affidabile degli oggetti è fondamentale.
Tabella di confronto delle prestazioni
Modello | dimensione (pixel) |
mAPval 50-95 |
Velocità CPU ONNX (ms) |
Velocità T4TensorRT10 (ms) |
params (M) |
FLOP (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLO | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Conclusione
Sia YOLOv8 che YOLO sono potenti modelli di rilevamento degli oggetti. YOLOv8 si distingue per la sua versatilità, la facilità d'uso e la forte comunità, che lo rendono adatto a un'ampia gamma di attività e scenari di sviluppo. YOLO eccelle per la precisione e l'efficienza del design e rappresenta una scelta importante per le applicazioni che richiedono un rilevamento preciso degli oggetti. Gli utenti interessati ad altri modelli potrebbero prendere in considerazione anche YOLOv7, YOLOv9 o YOLOX, a seconda delle loro specifiche esigenze e priorità.