Vai al contenuto

YOLO11 . YOLOv5: Evoluzione del rilevamento di oggetti in tempo reale

L'evoluzione della famiglia YOLO You Only Look Once) rappresenta una cronologia della rapida innovazione nel campo della visione artificiale. YOLOv5, rilasciato nel 2020 da Ultralytics, ha rivoluzionato il settore rendendo accessibile il rilevamento di oggetti ad alte prestazioni attraverso un'API incredibilmente intuitiva e PyTorch solida PyTorch . Passiamo rapidamente alla fine del 2024, e YOLO11 è emersa come una potenza raffinata, basandosi su anni di feedback e progressi architettonici per offrire efficienza e precisione superiori.

Questo confronto esplora i progressi tecnici compiuti tra questi due modelli iconici, aiutando gli sviluppatori a capire quando mantenere i sistemi legacy e quando passare all'architettura più recente.

Analisi delle metriche di performance

Il salto da YOLOv5 YOLO11 meglio visualizzabile attraverso le loro prestazioni su benchmark standard. YOLO11 ottimizzazioni significative che consentono di ottenere una precisione media (mAP) più elevata, mantenendo o riducendo il carico computazionale.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Punti chiave

  • Miglioramenti in termini di accuratezza: YOLO11n raggiunge un notevole mAP del 39,5%, superando notevolmente YOLOv5n (28,0% mAP). Ciò rende il YOLO11 più piccolo utilizzabile per compiti complessi che in precedenza richiedevano modelli più grandi e più lenti.
  • Efficienza di calcolo: nonostante la maggiore precisione, YOLO11 richiedono generalmente meno FLOP. Ad esempio, YOLO11x utilizza circa il 20% in meno di FLOP rispetto a YOLOv5x, fornendo al contempo risultati di rilevamento superiori.
  • CPU :ONNX CPU ONNX per YOLO11 notevolmente più elevate, un fattore critico per le implementazioni su dispositivi edge come il Raspberry Pi.

YOLO11: Efficienza e Versatilità Raffinate

Rilasciato nel settembre 2024, YOLO11 il culmine dei miglioramenti iterativi nellaYOLO Ultralytics YOLO . È stato progettato non solo per il rilevamento grezzo, ma anche per supportare una pipeline di visione unificata che include segmentazione, stima della posa e bounding box orientati (OBB).

Specifiche tecniche:

Punti salienti dell'architettura

YOLO11 il blocco C3k2, una versione perfezionata del collo di bottiglia Cross Stage Partial (CSP) che ottimizza il flusso del gradiente. Inoltre, utilizza C2PSA (Cross-Stage Partial with Spatial Attention) nella sua testa di rilevamento, migliorando la capacità del modello di concentrarsi sulle caratteristiche critiche in scene disordinate. A differenza di YOLOv5, YOLO11 un'architettura senza ancoraggi, che semplifica il processo di addestramento eliminando la necessità di calcolare i riquadri di ancoraggio per set di dati specifici, con conseguente migliore generalizzazione.

Perché scegliere YOLO11?

YOLO11 la scelta consigliata per la maggior parte delle nuove applicazioni commerciali. Il suo equilibrio tra elevata precisione (mAP) e basso consumo di risorse lo rende ideale per l'analisi in tempo reale nel settore della vendita al dettaglio, delle città intelligenti e della sanità.

Scopri di più su YOLO11

YOLOv5: lo standard del settore

YOLOv5, rilasciato a metà del 2020, ha definito lo standard di facilità d'uso nel settore dell'intelligenza artificiale. È stato il primo modello a rendere "train, val, deploy" un'esperienza senza soluzione di continuità all'interno di un unico repository, stabilendo la filosofia incentrata sull'utente per cui Ultralytics nota oggi.

Specifiche tecniche:

Punti salienti dell'architettura

YOLOv5 una dorsale CSPDarknet ed è un rilevatore basato su anchor. Sebbene altamente efficaci, gli approcci basati su anchor possono essere sensibili alla regolazione degli iperparametri relativi alle dimensioni dei riquadri. Nonostante la sua età, YOLOv5 uno strumento affidabile, in particolare in scenari in cui hardware legacy o certificazioni software specifiche vincolano i progetti a versioni precedenti del framework.

Scopri di più su YOLOv5

Differenze architettoniche e formazione

Ecosistema e facilità d'uso

Uno dei principali vantaggi di entrambi i modelli è la loro integrazione Ultralytics . Sia che utilizziate YOLOv5 YOLO11, potrete beneficiare di un'API unificata, di una documentazione completa e del supporto per l'esportazione senza soluzione di continuità dei modelli in formati quali TensorRT, CoreML e OpenVINO.

Tuttavia, YOLO11 degli ultimi aggiornamenti nel ultralytics Python , che offre una maggiore integrazione con strumenti come il Ultralytics Platform per la formazione sul cloud e la gestione dei set di dati.

Efficienza dell'addestramento

YOLO11 converge YOLO11 più rapidamente durante l'addestramento grazie alla sua architettura migliorata e alle funzioni di perdita. Anche i suoi requisiti di memoria sono altamente ottimizzati. A differenza dei modelli di trasformatori massivi che richiedono una notevole quantità di VRAM, YOLO11 e YOLOv5) possono essere addestrati in modo efficiente su GPU di livello consumer.

Ecco come è possibile addestrare un YOLO11 utilizzando ilPython Ultralytics :

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
# fast, efficient, and low-memory usage
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Versatilità

Mentre YOLOv5 aggiornato più avanti nel suo ciclo di vita per supportare la segmentazione e la classificazione, YOLO11 è stato progettato fin dall'inizio tenendo conto di queste attività. Se il vostro progetto richiede il passaggio tra rilevamento di oggetti, segmentazione di istanze, stima della posa o bounding box orientate (OBB), YOLO11 un'esperienza più coerente e con prestazioni migliori in tutte queste modalità.

Conclusione: quale modello utilizzare?

Per la stragrande maggioranza degli utenti che oggi intraprendono un progetto, YOLO11 è il chiaro vincitore. Offre un miglioramento "gratuito": maggiore precisione e velocità simile o superiore senza aumentare la complessità. YOLOv5 un eccellente punto di riferimento per la ricerca e la manutenzione legacy, ma resta indietro nei confronti diretti con le architetture moderne.

All'avanguardia: YOLO26

Se siete alla ricerca delle ultime novità in fatto di tecnologia di visione artificiale (a gennaio 2026), dovreste dare un'occhiata a YOLO26.

YOLO26 si basa sulle fondamenta di YOLO11 introduce un design End-to-End NMS, eliminando la necessità della post-elaborazione Non-Maximum Suppression. Ciò si traduce in una distribuzione più semplice e velocità di inferenza più elevate, in particolare sui dispositivi edge CPU. Grazie a innovazioni come l'ottimizzatore MuSGD e ProgLoss, YOLO26 offre CPU fino al 43% più veloce rispetto alle generazioni precedenti.

Scopri di più su YOLO26

Altri modelli da esplorare

  • RT-DETR: un rilevatore basato su trasformatore che eccelle in termini di precisione quando la velocità in tempo reale è meno critica.
  • YOLO: ideale per il rilevamento a vocabolario aperto, dove è necessario detect non presenti nel set di dati di addestramento.

Commenti