Vai al contenuto

YOLOv7 vs YOLO11: Un confronto tecnico dettagliato

La selezione del modello di object detection ottimale richiede una profonda comprensione delle capacità specifiche e dei compromessi delle diverse architetture. Questa pagina fornisce un confronto tecnico completo tra YOLOv7 e Ultralytics YOLO11, due modelli potenti nella linea YOLO. Approfondiremo le loro differenze architetturali, i benchmark di performance e i casi d'uso ideali per aiutarti a scegliere la soluzione migliore per i tuoi progetti di computer vision.

YOLOv7: Object Detection efficiente e accurato

YOLOv7 è stato introdotto come un progresso significativo nel rilevamento di oggetti in tempo reale, concentrandosi sull'ottimizzazione dell'efficienza e dell'accuratezza dell'addestramento senza aumentare i costi di inferenza. Ha stabilito un nuovo stato dell'arte per i rilevatori in tempo reale al momento del suo rilascio.

Autori: Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao
Organizzazione: Institute of Information Science, Academia Sinica, Taiwan
Data: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Documentazione: https://docs.ultralytics.com/models/yolov7/

Architettura e caratteristiche principali

YOLOv7 si basa sulle precedenti architetture YOLO introducendo diverse innovazioni chiave. Impiega tecniche come le Extended Efficient Layer Aggregation Networks (E-ELAN) nel backbone per migliorare l'estrazione e l'apprendimento delle caratteristiche. Un contributo importante è il concetto di "trainable bag-of-freebies", che include strategie di ottimizzazione applicate durante l'addestramento, come l'utilizzo di un detection head ausiliario e la guida coarse-to-fine, per aumentare l'accuratezza del modello finale senza aggiungere overhead computazionale durante l'inferenza. Pur essendo focalizzato principalmente sul rilevamento di oggetti, il repository ufficiale mostra estensioni della community per attività come la stima della posa e la segmentazione di istanze.

Prestazioni e casi d'uso

YOLOv7 ha dimostrato prestazioni all'avanguardia al momento del rilascio, offrendo un equilibrio convincente tra velocità e accuratezza. Ad esempio, il modello YOLOv7x raggiunge il 53,1% di mAPtest sul dataset MS COCO con una dimensione dell'immagine di 640. La sua efficienza lo rende adatto per applicazioni in tempo reale come i sistemi di sicurezza avanzati e i sistemi autonomi che richiedono un rilevamento rapido e accurato.

Punti di forza

  • Bilanciamento tra alta precisione e velocità: Offre una forte combinazione di mAP e velocità di inferenza per task in tempo reale su GPU.
  • Addestramento efficiente: Utilizza tecniche di addestramento avanzate ("bag-of-freebies") per migliorare l'accuratezza senza aumentare il costo dell'inferenza.
  • Prestazioni consolidate: Risultati comprovati su benchmark standard come MS COCO.

Punti deboli

  • Complessità: L'architettura e le tecniche di training possono essere complesse da comprendere appieno e ottimizzare.
  • Utilizzo intensivo di risorse: I modelli YOLOv7 più grandi richiedono notevoli risorse GPU per l'addestramento.
  • Versatilità limitata nei task: Principalmente focalizzato sul rilevamento di oggetti, richiedendo implementazioni separate per altri task come la segmentazione o la classificazione, a differenza di modelli integrati come YOLO11.
  • Meno supportato: Il framework non è sviluppato o supportato attivamente come l'ecosistema Ultralytics, il che comporta meno aggiornamenti e un minore supporto della community.

Scopri di più su YOLOv7

Ultralytics YOLO11: Efficienza e versatilità all'avanguardia

Ultralytics YOLO11 rappresenta l'ultima evoluzione della serie YOLO di Ultralytics, progettata per una precisione superiore, una maggiore efficienza e una più ampia versatilità delle attività all'interno di un framework intuitivo. Si basa sui successi dei suoi predecessori come YOLOv8 per offrire un'esperienza all'avanguardia.

Autori: Glenn Jocher e Jing Qiu
Organizzazione: Ultralytics
Data: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Documenti: https://docs.ultralytics.com/models/yolo11/

Architettura e caratteristiche principali

L'architettura di YOLO11 integra tecniche avanzate di estrazione delle caratteristiche e un design di rete ottimizzato, ottenendo una maggiore precisione, spesso con un numero di parametri ridotto rispetto ai predecessori. Questa ottimizzazione porta a velocità di inferenza più elevate e minori esigenze computazionali, il che è fondamentale per l'implementazione su diverse piattaforme, dai dispositivi edge all'infrastruttura cloud.

Un vantaggio chiave di YOLO11 è la sua versatilità. Supporta nativamente molteplici task di computer vision, tra cui il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, la stima della posa e i bounding box orientati (OBB). Si integra perfettamente nell'ecosistema Ultralytics, offrendo una user experience semplificata tramite semplici interfacce Python e CLI, un'ampia documentazione e pesi pre-addestrati facilmente disponibili per un addestramento efficiente.

Prestazioni e casi d'uso

YOLO11 dimostra impressionanti punteggi di precisione media media (mAP) in diverse dimensioni di modelli, raggiungendo un compromesso favorevole tra velocità e accuratezza. Ad esempio, YOLO11m raggiunge un mAPval di 51.5 con una dimensione dell'immagine di 640 con un numero di parametri significativamente inferiore rispetto a YOLOv7l. Varianti più piccole come YOLO11n offrono un'inferenza eccezionalmente veloce, mentre modelli più grandi come YOLO11x massimizzano l'accuratezza. In particolare, i modelli YOLO11 spesso mostrano un minore utilizzo di memoria durante l'addestramento e l'inferenza rispetto ad altre architetture.

La maggiore precisione ed efficienza di YOLO11 lo rendono ideale per applicazioni che richiedono un'elaborazione accurata in tempo reale:

Punti di forza

  • Prestazioni all'avanguardia: Punteggi mAP elevati con un'architettura ottimizzata e senza anchor.
  • Inferenza efficiente: Ottima velocità, specialmente su CPU, adatta per esigenze in tempo reale.
  • Supporto versatile per diverse attività: Gestisce nativamente il rilevamento, la segmentazione, la classificazione, la posa e l'OBB in un singolo framework.
  • Facilità d'uso: API semplice, documentazione completa e supporto integrato per Ultralytics HUB per l'addestramento e la distribuzione senza codice.
  • Ecosistema ben mantenuto: Sviluppo attivo, forte comunità, aggiornamenti frequenti e processi di addestramento efficienti.
  • Scalabilità: Funziona efficacemente su diversi hardware, dall'edge al cloud, con requisiti di memoria inferiori.

Punti deboli

  • Essendo un modello più recente, alcune specifiche integrazioni di strumenti di terze parti potrebbero essere ancora in fase di evoluzione rispetto a modelli più vecchi e consolidati.
  • I modelli più grandi possono richiedere notevoli risorse computazionali per l'addestramento, sebbene rimangano altamente efficienti per la loro classe di prestazioni.

Scopri di più su YOLO11

Confronto delle prestazioni: YOLOv7 vs. YOLO11

La tabella seguente fornisce un confronto dettagliato delle performance tra i modelli YOLOv7 e YOLO11 sul dataset COCO. I modelli YOLO11 dimostrano un equilibrio superiore tra accuratezza, velocità ed efficienza. Ad esempio, YOLO11l raggiunge un mAP più elevato rispetto a YOLOv7x con meno della metà dei parametri e dei FLOP e risulta significativamente più veloce su GPU. Allo stesso modo, YOLO11m corrisponde all'accuratezza di YOLOv7l con circa la metà dei parametri e dei costi computazionali. Il modello più piccolo, YOLO11n, offre una velocità notevole sia su CPU che su GPU con un utilizzo minimo delle risorse, rendendolo ideale per le applicazioni edge.

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusione: Quale modello dovresti scegliere?

Sebbene YOLOv7 fosse un modello potente per il suo tempo e offra ancora prestazioni elevate per il rilevamento di oggetti in tempo reale, Ultralytics YOLO11 rappresenta un significativo passo avanti. YOLO11 non solo supera YOLOv7 nelle principali metriche di performance, ma offre anche un framework molto più versatile, intuitivo e ben supportato.

Per sviluppatori e ricercatori alla ricerca di una soluzione moderna e all-in-one, YOLO11 è la scelta ideale. I suoi vantaggi includono:

  • Equilibrio Superiore delle Prestazioni: YOLO11 offre un miglior compromesso tra precisione, velocità e costo computazionale.
  • Versatilità Multi-Task: Il supporto nativo per detection, segmentation, classification, pose e OBB elimina la necessità di modelli multipli e semplifica i flussi di lavoro di sviluppo.
  • Facilità d'uso: L'API semplificata, la documentazione completa e le semplici procedure di addestramento lo rendono accessibile sia ai principianti che agli esperti.
  • Sviluppo attivo: Come parte dell'ecosistema Ultralytics, YOLO11 beneficia di aggiornamenti continui, una solida community open-source e integrazione con strumenti come Ultralytics HUB per un MLOps senza interruzioni.

In sintesi, se la tua priorità è sfruttare gli ultimi progressi dell'IA per un'ampia gamma di applicazioni con particolare attenzione alla facilità di deployment e alla protezione per il futuro, Ultralytics YOLO11 è il modello consigliato.

Esplora altri modelli

Per ulteriori approfondimenti, considera questi confronti che coinvolgono YOLOv7, YOLO11 e altri modelli rilevanti nella documentazione di Ultralytics:



📅 Creato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti