YOLOv7 YOLOv5: equilibrio tra precisione di alto livello e versatilità di produzione
La scelta dell'architettura giusta per il rilevamento degli oggetti spesso comporta un compromesso tra le prestazioni accademiche grezze e la facilità pratica di implementazione. Questo confronto dettagliato esplora due pietre miliari significative nella YOLO : YOLOv7, noto per le sue ottimizzazioni architetturali "bag-of-freebies", e YOLOv5, il leggendario Ultralytics celebre per la sua usabilità, velocità e massiccia adozione in ambienti di produzione.
Riepilogo
Mentre YOLOv7 raggiunge una precisione di picco (mAP) più elevata sul COCO attraverso scelte architetturali complesse come E-ELAN, YOLOv5 rimane lo standard del settore in termini di usabilità, offrendo un'esperienza di formazione più snella, un consumo di risorse inferiore e un supporto di implementazione più ampio. Per gli sviluppatori che iniziano nuovi progetti nel 2026, la discussione si è naturalmente evoluta verso Ultralytics , che combina i vantaggi di precisione della v7 con l'usabilità della v5, oltre all'inferenza nativa end-to-end NMS.
Confronto delle metriche di performance
La tabella seguente evidenzia le differenze di prestazioni tra le varianti principali. YOLOv7 GPU di fascia alta, mentre YOLOv5 una gamma granulare di modelli adatti a tutto, dai dispositivi mobili ai server cloud.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | parametri (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv7: Il motore architettonico
Pubblicato nel luglio 2022 dagli autori di YOLOv4, YOLOv7 ha introdotto diversi concetti avanzati volti a superare i limiti dell'accuratezza del rilevamento di oggetti in tempo reale.
- Autori: Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao
- Organizzazione: Institute of Information Science, Academia Sinica, Taiwan
- Data: 2022-07-06
- Documento:YOLOv7: il bag-of-freebies addestrabile stabilisce un nuovo standard all'avanguardia
- Repo:GitHub
Caratteristiche architettoniche chiave
- E-ELAN (Extended Efficient Layer Aggregation Network): questa struttura consente alla rete di apprendere caratteristiche più diversificate controllando i percorsi di gradiente più brevi e più lunghi. Migliora la capacità di apprendimento della rete senza distruggere il percorso di gradiente originale, garantendo una maggiore precisione in scene complesse.
- Ridimensionamento del modello: a differenza del ridimensionamento composto standard, YOLOv7 contemporaneamente la profondità e la larghezza del blocco, garantendo un'architettura ottimale per diversi vincoli di risorse (ad esempio, YOLOv7 rispetto a YOLOv7).
- Trainable Bag-of-Freebies: il modello incorpora tecniche di riparametrizzazione pianificate, che ottimizzano la struttura del modello durante l'addestramento ma la semplificano durante l'inferenza, aumentando efficacemente la velocità senza perdita di accuratezza.
Casi d'uso ideali per YOLOv7
YOLOv7 nella ricerca accademica e nelle applicazioni industriali di fascia alta in cui ogni punto percentuale di mAP , come i sistemi di sicurezza per la guida autonoma o il rilevamento di piccoli difetti nelle immagini di produzione ad alta risoluzione.
YOLOv5: Lo standard di produzione
YOLOv5, sviluppato da Ultralytics, ha rivoluzionato il settore non solo grazie alla sua architettura, ma anche dando priorità all'esperienza degli sviluppatori. È stato il primo YOLO implementato in modo nativo in PyTorch, rendendolo accessibile a una vasta comunità di Python .
- Autore: Glenn Jocher
- Organizzazione:Ultralytics
- Data: 2020-06-26
- Repo:GitHub
Perché gli sviluppatori scelgono YOLOv5
- Versatilità senza pari: mentre YOLOv7 principalmente sul rilevamento, YOLOv5 la segmentazione delle istanze e la classificazione delle immagini fin da subito.
- Basso impatto sulla memoria: YOLOv5 altamente efficiente con CUDA , consentendo dimensioni di batch più grandi su hardware consumer rispetto ai modelli basati su trasformatori o architetture più pesanti.
- Ecosistema di implementazione: offre un'esportazione senza soluzione di continuità in ONNX, CoreML, TFLite e TensorRT, rendendolo la scelta ideale per app mobili e dispositivi edge come NVIDIA .
Il vantaggio di Ultralytics: ecosistema e usabilità
Quando si confrontano questi modelli, l'ecosistema circostante è spesso importante quanto l'architettura stessa. Ultralytics (YOLOv5 il più recente YOLO26) traggono vantaggio da una piattaforma unificata e ben mantenuta.
Facilità d'uso ed efficienza di training
Per addestrare un modello non è necessario avere un dottorato in informatica. Ultralytics una semplice Python che standardizza il flusso di lavoro. È possibile passare dall'addestramento di un YOLOv5 a un YOLO11 o YOLO26 modificando un singolo argomento stringa.
from ultralytics import YOLO
# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolo26n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
La piattaforma integrata
Gli utenti dei Ultralytics hanno accesso alla Ultralytics , un hub basato sul web per la gestione dei set di dati, l'annotazione automatizzata e l'implementazione dei modelli con un solo clic. Questa integrazione dell'ecosistema riduce significativamente il time-to-market dei prodotti di visione artificiale rispetto alla gestione dei repository grezzi.
A prova di futuro con YOLO26
Sebbene YOLOv7 YOLOv5 validi, il campo della visione artificiale è in rapida evoluzione. Per i nuovi progetti, Ultralytics offre vantaggi significativi rispetto ai due predecessori.
Rilasciato nel gennaio 2026, YOLO26 affronta le limitazioni specifiche delle generazioni precedenti:
- End-to-End NMS: a differenza di YOLOv5 v7, che richiedono una post-elaborazione Non-Maximum Suppression (NMS), YOLO26 è nativamente end-to-end. Ciò si traduce in un codice più pulito e in un'inferenza più veloce, in particolare sui dispositivi edge dove NMS un collo di bottiglia.
- Ottimizzatore MuSGD: ispirato alla stabilità dell'addestramento LLM, questo nuovo ottimizzatore garantisce una convergenza più rapida rispetto allo SGD standard SGD nella versione 5/7.
- Ottimizzazione dei bordi: eliminando la perdita focale di distribuzione (DFL), YOLO26 è fino al 43% più veloce sulla CPU, rendendolo superiore per le implementazioni mobili.
- Rilevamento avanzato di oggetti di piccole dimensioni: grazie a ProgLoss e STAL (Self-Training with Anchor Learning), supera YOLOv7 oggetti di piccole dimensioni, un fattore critico per le attività di imaging aereo e con droni.
Conclusione
YOLOv7 è un potente risultato architettonico, che offre un'elevata precisione per i ricercatori e GPU specifici ad alte prestazioni. Tuttavia, la sua attenzione alla complessità "bag-of-freebies" può renderlo più difficile da modificare e implementare rispetto ai Ultralytics .
YOLOv5 rimane una leggenda nel settore per il suo equilibrio prestazionale, la facilità d'uso e l'incredibile versatilità in attività quali rilevamento, segmentazione e classificazione. È la scelta sicura e affidabile per molti sistemi di produzione legacy.
Per chi cerca il meglio di entrambi i mondi, ovvero elevata precisione e facilità d'uso, consigliamo YOLO26. Questo prodotto combina Ultralytics , facile da usare, con innovazioni all'avanguardia come l'inferenza NMS e l'ottimizzazione MuSGD, garantendo applicazioni veloci, accurate e a prova di futuro.
Letture aggiuntive
- Esplora altri modelli nell Ultralytics Hub.
- Scopri come addestrare modelli personalizzati sui tuoi dati.
- Comprendere la differenza tra rilevamento degli oggetti e segmentazione.