Vai al contenuto

YOLOv10 vs YOLOv7: un confronto dettagliato

La scelta del giusto modello di rilevamento degli oggetti è fondamentale per i progetti di computer vision. Ultralytics YOLO offre una gamma di modelli adatti a diverse esigenze. Questa pagina fornisce un confronto tecnico tra YOLOv10 e YOLOv7, due scelte popolari per le attività di rilevamento degli oggetti. Analizzeremo le loro architetture, le metriche delle prestazioni e le applicazioni ideali per aiutarvi a prendere una decisione consapevole.

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4TensorRT10
(ms)
params
(M)
FLOP
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

YOLOv10

YOLOv10, presentato nel maggio 2024 dai ricercatori della Tsinghua University, rappresenta l'avanguardia del rilevamento di oggetti in tempo reale. Nel documento pubblicato su Arxiv,"YOLOv10: Real-Time End-to-End Object Detection", Ao Wang, Hui Chen, Lihao Liu e altri presentano YOLOv10 come un significativo progresso che si concentra sia sull'efficienza che sulla precisione. L'implementazione ufficiale è disponibile su GitHub. YOLOv10 è stato progettato per l'implementazione end-to-end, risolvendo il problema della dipendenza delle precedenti versioni di YOLO dalla soppressione non massima (NMS).

Architettura e caratteristiche principali:

YOLOv10 vanta diverse innovazioni architettoniche volte a migliorare la velocità e a ridurre la ridondanza computazionale. Le caratteristiche principali includono un approccio privo di ancore e un design privo di NMS, che snellisce la post-elaborazione e accelera l'inferenza. Il modello adotta una strategia di progettazione olistica orientata all'efficienza e alla precisione, ottimizzando i vari componenti per ottenere il minimo overhead e la massima capacità. Il risultato è un modello che non solo è più veloce, ma mantiene anche un'accuratezza competitiva, rendendolo adatto ai dispositivi edge e alle applicazioni in tempo reale.

Metriche di prestazione e parametri di riferimento:

Come mostrato nella tabella di confronto, i modelli YOLOv10, in particolare le varianti YOLOv10n e YOLOv10s, offrono velocità di inferenza impressionanti su TensorRT, raggiungendo rispettivamente 1,56ms e 2,66ms. YOLOv10n raggiunge un mAPval50-95 di 39,5 con solo 2,3M parametri e 6,7B FLOP, mentre YOLOv10x raggiunge 54,4 mAPval50-95. Queste metriche evidenziano la capacità di YOLOv10 di fornire prestazioni all'avanguardia con risorse computazionali ottimizzate. Per una comprensione più approfondita delle metriche delle prestazioni YOLO , consultare la documentazione Ultralytics sulle metriche delle prestazioniYOLO .

Casi d'uso:

L'enfasi di YOLOv10 sulle prestazioni e sull'efficienza in tempo reale lo rende ideale per le applicazioni che richiedono il rilevamento rapido di oggetti con risorse computazionali limitate. I casi d'uso adatti includono:

  • Applicazioni Edge AI: Distribuzione su dispositivi edge per l'elaborazione in tempo reale in scenari quali telecamere intelligenti e dispositivi IoT.
  • Robotica: Consentire un riconoscimento degli oggetti più rapido ed efficiente per la navigazione e l'interazione nei sistemi robotici, come discusso in Il ruolo dell'IA nella robotica.
  • Sistemi autonomi: Applicazioni nei veicoli autonomi e nei droni, dove la bassa latenza è fondamentale per un funzionamento sicuro ed efficace.
  • Sistemi mobili ed embedded: Rilevamento di oggetti in applicazioni mobili e sistemi embedded con potenza di calcolo limitata.

Punti di forza:

  • Alta efficienza: Design senza NMS e architettura ottimizzata per un'inferenza più rapida e una latenza ridotta.
  • Precisione competitiva: Mantiene una forte precisione migliorando notevolmente la velocità.
  • Distribuzione end-to-end: Progettato per un rilevamento degli oggetti in tempo reale, end-to-end e senza soluzione di continuità.
  • Dimensioni ridotte dei modelli: L'architettura efficiente porta a modelli di dimensioni più ridotte e a un minor numero di parametri rispetto ad alcuni predecessori.

Punti deboli:

  • Relativamente nuovo: Essendo un modello più recente, YOLOv10 potrebbe avere una comunità più ristretta e meno esempi di implementazione rispetto a modelli più consolidati come YOLOv7.
  • Messa a punto delle prestazioni: Il raggiungimento di prestazioni ottimali può richiedere una messa a punto e una sperimentazione con diverse dimensioni e configurazioni del modello, come illustrato nei suggerimenti per l'addestramento del modello.

Per saperne di più su YOLOv10

YOLOv7

YOLOv7, introdotto nel luglio 2022 da Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao, è un modello di rilevamento di oggetti molto apprezzato e noto per la sua efficienza e precisione. Il modello è descritto in dettaglio nel documento Arxiv"YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors" e il repository ufficiale GitHub fornisce i dettagli dell'implementazione. YOLOv7 si basa sulle versioni precedenti di YOLO , incorporando miglioramenti architettonici per massimizzare le prestazioni senza aumentare sostanzialmente il costo computazionale.

Architettura e caratteristiche principali:

YOLOv7 incorpora diverse innovazioni architettoniche per migliorare le sue prestazioni e la sua efficienza. Le caratteristiche principali includono:

  • Extended Efficient Layer Aggregation Networks (E-ELAN): Migliora le capacità di apprendimento e il flusso di gradienti della rete.
  • Scala del modello per i modelli basati sulla concatenazione: Fornisce linee guida per un'efficace scalatura della profondità e della larghezza.
  • Testina ausiliaria e testina di guida da grossolana a fine: migliora l'efficienza della formazione e l'accuratezza del rilevamento.

Queste caratteristiche contribuiscono alla capacità di YOLOv7 di ottenere risultati all'avanguardia in termini di velocità e accuratezza, rendendolo una scelta solida per vari compiti di rilevamento di oggetti.

Metriche di prestazione e parametri di riferimento:

YOLOv7 dimostra un forte equilibrio tra velocità e precisione. Come illustrato nella tabella, YOLOv7l raggiunge un mAPval50-95 di 51,4, mentre YOLOv7x raggiunge 53,1 mAPval50-95. Sebbene siano leggermente più lenti di YOLOv10n e YOLOv10s in termini di velocità di inferenza TensorRT , i modelli YOLOv7 offrono comunque prestazioni competitive, in particolare se si considerano le dimensioni maggiori dei modelli YOLOv7. Per le metriche dettagliate, consultare la documentazione di YOLOv7.

Casi d'uso:

L'equilibrio tra precisione ed efficienza di YOLOv7 lo rende adatto alle applicazioni che richiedono un rilevamento affidabile degli oggetti in scenari in tempo reale. I casi d'uso ideali includono:

  • Veicoli autonomi: Rilevamento robusto degli oggetti in ambienti di guida complessi, fondamentale per l'intelligenza artificiale delle auto a guida autonoma.
  • Sistemi di sorveglianza avanzati: Elevata precisione per l'identificazione di potenziali minacce alla sicurezza nei sistemi di sicurezza.
  • Robotica: Riconoscimento preciso degli oggetti per la manipolazione e la navigazione nella robotica, simile a YOLOv10, ma potenzialmente in grado di favorire la precisione in determinati scenari.
  • Automazione industriale: Controllo della qualità e rilevamento dei difetti nei processi di produzione in cui la precisione è fondamentale.

Punti di forza:

  • Alta mAP: Raggiunge un'elevata precisione media, indicando un'eccellente accuratezza nel rilevamento degli oggetti.
  • Inferenza efficiente: Progettata per un'inferenza veloce, adatta alle applicazioni in tempo reale.
  • Ben consolidato e maturo: YOLOv7 beneficia di una comunità più ampia e di un utilizzo più esteso, che fornisce maggiori risorse e supporto.
  • Dimensioni gestibili dei modelli: Offre un buon equilibrio tra dimensioni del modello e prestazioni.

Punti deboli:

  • Complessità: L'architettura è più complessa rispetto ad alcuni modelli più semplici e richiede potenzialmente maggiori competenze per la messa a punto e l'ottimizzazione.
  • Intenso di risorse rispetto ai modelli nano: Pur essendo efficiente, è più impegnativo dal punto di vista computazionale rispetto a modelli più piccoli come YOLOv10n, soprattutto in ambienti con risorse estremamente limitate.

Per saperne di più su YOLOv7

Altri modelli YOLO

Oltre a YOLOv10 e YOLOv7, Ultralytics offre una serie di modelli YOLO , ciascuno con punti di forza unici. Considerate di esplorare YOLOv8 per un'opzione versatile e facile da usare, YOLOv9 per i progressi nell'architettura di rete e YOLO11 per le prestazioni più recenti e all'avanguardia. È inoltre possibile confrontare YOLOv7 con altri modelli come YOLOv5 e YOLOX per capire i loro specifici compromessi.

📅C reato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti