Vai al contenuto

YOLOv7 YOLO11: un confronto tecnico tra rilevatori in tempo reale

L'evoluzione delle architetture di rilevamento degli oggetti è stata caratterizzata da rapidi progressi in termini di velocità, precisione e facilità di implementazione. Questa guida fornisce un confronto tecnico approfondito tra YOLOv7, un modello all'avanguardia del 2022, e YOLO11, una versione all'avanguardia di Ultralytics 2024. Analizziamo le loro differenze architetturali, le metriche di prestazione e l'idoneità per le moderne applicazioni di visione artificiale.

Riepilogo

Mentre YOLOv7 miglioramenti architettonici significativi come E-ELAN, YOLO11 rappresenta un salto generazionale in termini di usabilità, supporto dell'ecosistema ed efficienza. YOLO11 prestazioni superiori su hardware moderni, flussi di lavoro di addestramento notevolmente più semplici e supporto nativo per una gamma più ampia di attività che vanno oltre il semplice rilevamento.

FunzionalitàYOLOv7YOLO11
ArchitetturaE-ELAN, basato sulla concatenazioneC3k2, SPPF, ottimizzato per GPU
AttivitàRilevamento, posa, segmentazione (limitata)Detect, Segment, Classify, Pose, OBB, Track
Facilità d'usoElevata complessità (script multipli)Ottimizzato ( Python unificata)
EcosistemaDisperso (Focus di ricerca)Integrato (Ultralytics )
DistribuzioneRichiede script di esportazione manualiEsportazione in un'unica riga in oltre 10 formati

Analisi dettagliata

YOLOv7: l'architettura "Bag-of-Freebies"

Rilasciato nel luglio 2022, YOLOv7 progettato per superare i limiti del rilevamento di oggetti in tempo reale ottimizzando il processo di addestramento senza aumentare i costi di inferenza, un concetto noto come "bag-of-freebies".

Caratteristiche tecniche principali:

  • E-ELAN (Extended Efficient Layer Aggregation Network): questa architettura consente alla rete di apprendere caratteristiche più diversificate controllando i percorsi di gradiente più brevi e più lunghi, migliorando la convergenza.
  • Ridimensionamento del modello: YOLOv7 metodi di ridimensionamento composti che modificano contemporaneamente profondità e larghezza per diversi vincoli di risorse.
  • Testa ausiliaria: utilizza un assegnatore di etichette guidato da un lead "da grossolano a fine", in cui una testa ausiliaria aiuta a supervisionare il processo di apprendimento negli strati più profondi.

Dettagli YOLOv7:

Scopri di più su YOLOv7

YOLO11: Efficienza e Versatilità Raffinate

YOLO11 Ultralytics di Ultralytics , che privilegia l'esperienza degli sviluppatori insieme alle prestazioni grezze. Introduce perfezionamenti architetturali che riducono il sovraccarico computazionale mantenendo un'elevata precisione, rendendolo eccezionalmente veloce sia sui dispositivi edge che sulle GPU cloud.

Caratteristiche tecniche principali:

  • Blocco C3k2: un'evoluzione del collo di bottiglia CSP (Cross Stage Partial) utilizzato nelle versioni precedenti, che offre una migliore estrazione delle caratteristiche con un numero inferiore di parametri.
  • SPPF potenziato: il livello Spatial Pyramid Pooling - Fast è ottimizzato per acquisire il contesto multiscala in modo più efficiente.
  • Versatilità delle attività: a differenza di YOLOv7, che è principalmente un modello di rilevamento con alcune funzionalità di posa, YOLO11 progettato da zero per gestire in modo nativo la segmentazione delle istanze, la stima della posa, i riquadri di delimitazione orientati (OBB) e la classificazione.
  • Formazione ottimizzata: YOLO11 strategie avanzate di aumento dei dati e funzioni di perdita migliorate che stabilizzano la formazione, richiedendo una minore regolazione degli iperparametri da parte dell'utente.

YOLO11 :

Scopri di più su YOLO11

Confronto delle prestazioni

Quando si confrontano questi modelli, è fondamentale valutare il compromesso tra velocità (latenza) e precisione (mAP). YOLO11 offre YOLO11 un equilibrio migliore, garantendo un'elevata precisione con requisiti computazionali (FLOP) significativamente inferiori e velocità di inferenza più elevate su GPU moderne come NVIDIA .

L'efficienza è importante

YOLO11 una precisione paragonabile o superiore rispetto ai modelli precedenti con un numero inferiore di parametri. Questa "efficienza dei parametri" si traduce direttamente in un minore utilizzo di memoria durante l'addestramento e in un'esecuzione più rapida su dispositivi edge come NVIDIA Orin Nano.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Come mostrato nella tabella, YOLO11x supera YOLOv7 in termini di precisione (54,7% contro 53,1%) mantenendo velocità GPU comparabili. Ancora più importante, le varianti più piccole di YOLO11 n/s/m) offrono incredibili vantaggi in termini di velocità per le applicazioni in cui l'elaborazione in tempo reale è fondamentale, come l'analisi video.

Ecosistema e facilità d'uso

Il fattore di differenziazione più significativo per gli sviluppatori è l'ecosistema che circonda il modello. È qui che Ultralytics eccellono.

Il vantaggio di Ultralytics

YOLO11 integrato nel ultralytics Python che fornisce un'interfaccia unificata per l'intero ciclo di vita dell'apprendimento automatico.

  • API semplice: è possibile caricare, addestrare e convalidare un modello con poche righe di Python .
  • Ecosistema ben curato: la Ultralytics offre supporto attivo, aggiornamenti frequenti e integrazione perfetta con strumenti come Ultralytics per la gestione dei dati.
  • Flessibilità di implementazione: l'esportazione YOLO11 ONNX, TensorRT, CoreML o TFLite un solo comando. Al contrario, YOLOv7 richiede YOLOv7 complessi repository di terze parti o regolazioni manuali degli script per i diversi formati di esportazione.

Confronto tra codici:

Formazione YOLO11:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")

# Train on COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Formazione YOLOv7: In genere richiede la clonazione del repository, l'installazione di dipendenze specifiche e l'esecuzione di lunghi argomenti della riga di comando:

python train.py --workers 8 --device 0 --batch-size 32 --data data/coco.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights 'yolov7_training.pt'

Casi d'uso reali

Quando scegliere YOLOv7

  • Benchmarking legacy: se stai conducendo una ricerca accademica e hai bisogno di confrontare nuove architetture con gli standard all'avanguardia del 2022.
  • Implementazioni personalizzate specifiche: se disponi di una pipeline esistente fortemente personalizzata in base alle specifiche tensor YOLOv7 e non puoi permetterti di rifattorizzarla.

Quando scegliere YOLO11

  • Implementazione nella produzione: per applicazioni commerciali nel settore della vendita al dettaglio, della sicurezza o della produzione, dove l'affidabilità e la facilità di manutenzione sono fondamentali.
  • Edge Computing: l'efficienza di YOLO11n e YOLO11s li rende ideali per l'esecuzione su Raspberry Pi o dispositivi mobili con potenza limitata.
  • Applicazioni multi-task: se il tuo progetto richiede il rilevamento di oggetti, la loro segmentazione e la stima simultanea della loro posizione, YOLO11 tutto questo in modo nativo.

All'avanguardia: YOLO26

Sebbene YOLO11 una scelta eccellente per la maggior parte delle applicazioni, Ultralytics a innovare. Il recente rilascio di YOLO26 (gennaio 2026) spinge ulteriormente i confini.

  • End-to-End NMS: YOLO26 elimina la soppressione non massima (NMS), con conseguente semplificazione delle pipeline di implementazione e riduzione della latenza.
  • Ottimizzazione edge: eliminando la perdita focale di distribuzione (DFL), YOLO26 raggiunge CPU fino al 43% più veloce, rendendolo la scelta migliore per l'AI edge.
  • Ottimizzatore MuSGD: Ispirato all'addestramento degli LLM, questo ottimizzatore ibrido garantisce una convergenza stabile.

Per gli sviluppatori che oggi intraprendono un nuovo progetto ad alte prestazioni, è altamente consigliabile esplorare YOLO26.

Scopri di più su YOLO26

Conclusione

Sia YOLOv7 YOLO11 pietre miliari nella storia della visione artificiale. YOLOv7 potenti concetti architettonici che hanno fatto progredire il settore. Tuttavia, YOLO11 affina queste idee in un pacchetto più pratico, veloce e facile da usare.

Per la stragrande maggioranza degli utenti, dai ricercatori agli ingegneri aziendali,YOLO11 o il più recente YOLO26) offre la migliore combinazione di precisione, velocità ed esperienza di sviluppo, supportata dalla solida Ultralytics .

Altri modelli da esplorare

  • YOLO26: l'ultimo modello NMS per la massima velocità e precisione.
  • YOLOv10: Il pioniere dell'addestramento NMS per il rilevamento in tempo reale.
  • RT-DETR: un rilevatore basato su trasformatore per scenari che richiedono un'elevata precisione.
  • SAM : Modello Segment Anything di Meta per la segmentazione zero-shot.

Commenti