YOLOv10 vs YOLOv7: un confronto dettagliato
La scelta del giusto modello di rilevamento degli oggetti è fondamentale per i progetti di computer vision. Ultralytics YOLO offre una gamma di modelli adatti a diverse esigenze. Questa pagina fornisce un confronto tecnico tra YOLOv10 e YOLOv7, due scelte popolari per le attività di rilevamento degli oggetti. Analizzeremo le loro architetture, le metriche delle prestazioni e le applicazioni ideali per aiutarvi a prendere una decisione consapevole.
Modello | dimensione (pixel) |
mAPval 50-95 |
Velocità CPU ONNX (ms) |
Velocità T4TensorRT10 (ms) |
params (M) |
FLOP (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOv10
YOLOv10, presentato nel maggio 2024 dai ricercatori della Tsinghua University, rappresenta l'avanguardia del rilevamento di oggetti in tempo reale. Nel documento pubblicato su Arxiv,"YOLOv10: Real-Time End-to-End Object Detection", Ao Wang, Hui Chen, Lihao Liu e altri presentano YOLOv10 come un significativo progresso che si concentra sia sull'efficienza che sulla precisione. L'implementazione ufficiale è disponibile su GitHub. YOLOv10 è stato progettato per l'implementazione end-to-end, risolvendo il problema della dipendenza delle precedenti versioni di YOLO dalla soppressione non massima (NMS).
Architettura e caratteristiche principali:
YOLOv10 vanta diverse innovazioni architettoniche volte a migliorare la velocità e a ridurre la ridondanza computazionale. Le caratteristiche principali includono un approccio privo di ancore e un design privo di NMS, che snellisce la post-elaborazione e accelera l'inferenza. Il modello adotta una strategia di progettazione olistica orientata all'efficienza e alla precisione, ottimizzando i vari componenti per ottenere il minimo overhead e la massima capacità. Il risultato è un modello che non solo è più veloce, ma mantiene anche un'accuratezza competitiva, rendendolo adatto ai dispositivi edge e alle applicazioni in tempo reale.
Metriche di prestazione e parametri di riferimento:
Come mostrato nella tabella di confronto, i modelli YOLOv10, in particolare le varianti YOLOv10n e YOLOv10s, offrono velocità di inferenza impressionanti su TensorRT, raggiungendo rispettivamente 1,56ms e 2,66ms. YOLOv10n raggiunge un mAPval50-95 di 39,5 con solo 2,3M parametri e 6,7B FLOP, mentre YOLOv10x raggiunge 54,4 mAPval50-95. Queste metriche evidenziano la capacità di YOLOv10 di fornire prestazioni all'avanguardia con risorse computazionali ottimizzate. Per una comprensione più approfondita delle metriche delle prestazioni YOLO , consultare la documentazione Ultralytics sulle metriche delle prestazioniYOLO .
Casi d'uso:
L'enfasi di YOLOv10 sulle prestazioni e sull'efficienza in tempo reale lo rende ideale per le applicazioni che richiedono il rilevamento rapido di oggetti con risorse computazionali limitate. I casi d'uso adatti includono:
- Applicazioni Edge AI: Distribuzione su dispositivi edge per l'elaborazione in tempo reale in scenari quali telecamere intelligenti e dispositivi IoT.
- Robotica: Consentire un riconoscimento degli oggetti più rapido ed efficiente per la navigazione e l'interazione nei sistemi robotici, come discusso in Il ruolo dell'IA nella robotica.
- Sistemi autonomi: Applicazioni nei veicoli autonomi e nei droni, dove la bassa latenza è fondamentale per un funzionamento sicuro ed efficace.
- Sistemi mobili ed embedded: Rilevamento di oggetti in applicazioni mobili e sistemi embedded con potenza di calcolo limitata.
Punti di forza:
- Alta efficienza: Design senza NMS e architettura ottimizzata per un'inferenza più rapida e una latenza ridotta.
- Precisione competitiva: Mantiene una forte precisione migliorando notevolmente la velocità.
- Distribuzione end-to-end: Progettato per un rilevamento degli oggetti in tempo reale, end-to-end e senza soluzione di continuità.
- Dimensioni ridotte dei modelli: L'architettura efficiente porta a modelli di dimensioni più ridotte e a un minor numero di parametri rispetto ad alcuni predecessori.
Punti deboli:
- Relativamente nuovo: Essendo un modello più recente, YOLOv10 potrebbe avere una comunità più ristretta e meno esempi di implementazione rispetto a modelli più consolidati come YOLOv7.
- Messa a punto delle prestazioni: Il raggiungimento di prestazioni ottimali può richiedere una messa a punto e una sperimentazione con diverse dimensioni e configurazioni del modello, come illustrato nei suggerimenti per l'addestramento del modello.
YOLOv7
YOLOv7, introdotto nel luglio 2022 da Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao, è un modello di rilevamento di oggetti molto apprezzato e noto per la sua efficienza e precisione. Il modello è descritto in dettaglio nel documento Arxiv"YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors" e il repository ufficiale GitHub fornisce i dettagli dell'implementazione. YOLOv7 si basa sulle versioni precedenti di YOLO , incorporando miglioramenti architettonici per massimizzare le prestazioni senza aumentare sostanzialmente il costo computazionale.
Architettura e caratteristiche principali:
YOLOv7 incorpora diverse innovazioni architettoniche per migliorare le sue prestazioni e la sua efficienza. Le caratteristiche principali includono:
- Extended Efficient Layer Aggregation Networks (E-ELAN): Migliora le capacità di apprendimento e il flusso di gradienti della rete.
- Scala del modello per i modelli basati sulla concatenazione: Fornisce linee guida per un'efficace scalatura della profondità e della larghezza.
- Testina ausiliaria e testina di guida da grossolana a fine: migliora l'efficienza della formazione e l'accuratezza del rilevamento.
Queste caratteristiche contribuiscono alla capacità di YOLOv7 di ottenere risultati all'avanguardia in termini di velocità e accuratezza, rendendolo una scelta solida per vari compiti di rilevamento di oggetti.
Metriche di prestazione e parametri di riferimento:
YOLOv7 dimostra un forte equilibrio tra velocità e precisione. Come illustrato nella tabella, YOLOv7l raggiunge un mAPval50-95 di 51,4, mentre YOLOv7x raggiunge 53,1 mAPval50-95. Sebbene siano leggermente più lenti di YOLOv10n e YOLOv10s in termini di velocità di inferenza TensorRT , i modelli YOLOv7 offrono comunque prestazioni competitive, in particolare se si considerano le dimensioni maggiori dei modelli YOLOv7. Per le metriche dettagliate, consultare la documentazione di YOLOv7.
Casi d'uso:
L'equilibrio tra precisione ed efficienza di YOLOv7 lo rende adatto alle applicazioni che richiedono un rilevamento affidabile degli oggetti in scenari in tempo reale. I casi d'uso ideali includono:
- Veicoli autonomi: Rilevamento robusto degli oggetti in ambienti di guida complessi, fondamentale per l'intelligenza artificiale delle auto a guida autonoma.
- Sistemi di sorveglianza avanzati: Elevata precisione per l'identificazione di potenziali minacce alla sicurezza nei sistemi di sicurezza.
- Robotica: Riconoscimento preciso degli oggetti per la manipolazione e la navigazione nella robotica, simile a YOLOv10, ma potenzialmente in grado di favorire la precisione in determinati scenari.
- Automazione industriale: Controllo della qualità e rilevamento dei difetti nei processi di produzione in cui la precisione è fondamentale.
Punti di forza:
- Alta mAP: Raggiunge un'elevata precisione media, indicando un'eccellente accuratezza nel rilevamento degli oggetti.
- Inferenza efficiente: Progettata per un'inferenza veloce, adatta alle applicazioni in tempo reale.
- Ben consolidato e maturo: YOLOv7 beneficia di una comunità più ampia e di un utilizzo più esteso, che fornisce maggiori risorse e supporto.
- Dimensioni gestibili dei modelli: Offre un buon equilibrio tra dimensioni del modello e prestazioni.
Punti deboli:
- Complessità: L'architettura è più complessa rispetto ad alcuni modelli più semplici e richiede potenzialmente maggiori competenze per la messa a punto e l'ottimizzazione.
- Intenso di risorse rispetto ai modelli nano: Pur essendo efficiente, è più impegnativo dal punto di vista computazionale rispetto a modelli più piccoli come YOLOv10n, soprattutto in ambienti con risorse estremamente limitate.
Altri modelli YOLO
Oltre a YOLOv10 e YOLOv7, Ultralytics offre una serie di modelli YOLO , ciascuno con punti di forza unici. Considerate di esplorare YOLOv8 per un'opzione versatile e facile da usare, YOLOv9 per i progressi nell'architettura di rete e YOLO11 per le prestazioni più recenti e all'avanguardia. È inoltre possibile confrontare YOLOv7 con altri modelli come YOLOv5 e YOLOX per capire i loro specifici compromessi.