Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX contro YOLOv7#

L'evoluzione del rilevamento oggetti in tempo reale è stata guidata da continui progressi architetturali. Due traguardi significativi in questo percorso sono YOLOX e YOLOv7. Rilasciati a un anno di distanza l'uno dall'altro, entrambi i modelli hanno introdotto approcci innovativi al paradigma standard del rilevamento oggetti, migliorando significativamente il compromesso tra velocità e accuratezza.

Questa pagina fornisce un'analisi tecnica approfondita di YOLOX e YOLOv7, confrontando le loro architetture, le metriche di prestazione e i casi d'uso ideali per aiutarti a scegliere lo strumento giusto per le tue implementazioni di computer vision.

Link to this sectionYOLOX: Pioniere del rilevamento senza anchor#

Introdotto dai ricercatori di Megvii nel luglio 2021, YOLOX ha rappresentato un cambiamento importante allontanandosi dai tradizionali design basati su anchor. Colmando il divario tra la ricerca accademica e l'applicazione industriale, YOLOX ha semplificato la head di rilevamento e migliorato le prestazioni complessive.

Dettagli chiave del modello:

Link to this sectionInnovazioni architettoniche#

YOLOX ha introdotto un approccio anchor-free, che ha ridotto drasticamente il numero di parametri di progettazione e la regolazione euristica richiesta per i dataset personalizzati. Ha implementato una head disaccoppiata, separando i compiti di classificazione e regressione, migliorando la velocità di convergenza e l'accuratezza. Inoltre, YOLOX ha utilizzato strategie avanzate di data augmentation come MixUp e Mosaic per migliorare la robustezza del modello.

Scopri di più su YOLOX

Il vantaggio del design anchor-free

Eliminando le anchor box, YOLOX riduce il sovraccarico computazionale del calcolo della Intersection over Union (IoU) tra le predizioni e le ground truth durante l'addestramento, portando a minori requisiti di memoria CUDA e tempi di addestramento più rapidi.

Link to this sectionYOLOv7: Trainable Bag-of-Freebies#

Rilasciato nel luglio 2022 dai ricercatori dell'Institute of Information Science, Academia Sinica, Taiwan, YOLOv7 ha spinto ulteriormente i confini del rilevamento oggetti in tempo reale. Ha introdotto il concetto di "trainable bag-of-freebies", stabilendo nuovi benchmark all'avanguardia sul dataset MS COCO al momento del rilascio.

Dettagli chiave del modello:

Link to this sectionInnovazioni architettoniche#

L'architettura di YOLOv7 è costruita attorno alla E-ELAN (Extended Efficient Layer Aggregation Network), che consente al modello di apprendere continuamente caratteristiche più diversificate senza degradare il percorso del gradiente. Inoltre, YOLOv7 ha utilizzato tecniche di ri-parametrizzazione del modello, consentendo di semplificare complesse reti di addestramento multi-ramo in reti più veloci a percorso singolo durante l'inferenza.

Scopri di più su YOLOv7

Link to this sectionConfronto delle Prestazioni#

Quando valuti questi modelli per applicazioni del mondo reale, è fondamentale comprendere le loro prestazioni su diverse scale. La tabella sottostante confronta le metriche standard per varie dimensioni di YOLOX e YOLOv7.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Link to this sectionAnalisi#

  • Accuratezza: YOLOv7 ottiene generalmente una mAP più elevata rispetto ai modelli YOLOX equivalenti. Ad esempio, YOLOv7x raggiunge 53.1 mAP rispetto ai 51.1 di YOLOXx.
  • Velocità: Sebbene entrambi i modelli siano altamente ottimizzati per l'esecuzione su GPU utilizzando TensorRT, l'architettura E-ELAN di YOLOv7 offre un throughput leggermente migliore per applicazioni di fascia alta, sebbene YOLOX mantenga un'eccellente latenza su dispositivi edge più piccoli.
  • Versatilità: YOLOv7 ha ampliato il suo repertorio oltre le bounding box fornendo nativamente pesi per la segmentazione di istanze e la stima della posa, rendendolo più versatile del repository YOLOX di base.

Link to this sectionApplicazioni nel mondo reale#

La scelta tra questi modelli spesso dipende dal tuo specifico ambiente di distribuzione.

Link to this sectionEdge Computing e IoT#

Per dispositivi edge vincolati come Raspberry Pi o processori mobili più vecchi, YOLOX-Nano e YOLOX-Tiny sono molto interessanti. Il loro numero minimo di parametri e la natura anchor-free li rendono più facili da distribuire in ambienti a basso consumo per compiti come il rilevamento di movimento di base o applicazioni di campanelli intelligenti.

Link to this sectionAnalisi video ad alta fedeltà#

Per l'elaborazione di feed ad alta risoluzione nel rilevamento di difetti industriali o nel monitoraggio del traffico denso, YOLOv7 è superiore. La sua robusta aggregazione delle caratteristiche gli consente di mantenere un'elevata accuratezza anche quando gli oggetti sono parzialmente occlusi o variano notevolmente in scala.

Link to this sectionCasi d'uso e raccomandazioni#

Scegliere tra YOLOX e YOLOv7 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOX#

YOLOX è una scelta solida per:

  • Ricerca sul rilevamento senza anchor: Ricerca accademica che utilizza l'architettura pulita e senza anchor di YOLOX come base per sperimentare nuove head di rilevamento o funzioni di perdita.
  • Dispositivi edge ultraleggeri: Implementazione su microcontrollori o hardware mobile legacy dove l'impronta estremamente ridotta della variante YOLOX-Nano (0.91M di parametri) è critica.
  • Studi sull'assegnazione delle label SimOTA: Progetti di ricerca che studiano le strategie di assegnazione delle label basate sul trasporto ottimale e il loro impatto sulla convergenza dell'addestramento.

Link to this sectionQuando scegliere YOLOv7#

YOLOv7 è consigliato per:

  • Benchmarking accademico: Riprodurre risultati allo stato dell'arte dell'era 2022 o studiare gli effetti delle tecniche E-ELAN e trainable bag-of-freebies.
  • Ricerca sulla riparametrizzazione: Investigare convoluzioni riparametrizzate pianificate e strategie di scaling composto del modello.
  • Pipeline personalizzate esistenti: Progetti con pipeline pesantemente personalizzate costruite attorno all'architettura specifica di YOLOv7 che non possono essere facilmente rifattorizzate.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl vantaggio di Ultralytics#

Sebbene sia YOLOX che YOLOv7 siano potenti implementazioni di ricerca, passare da un repository di ricerca a un ambiente di produzione scalabile può essere scoraggiante. È qui che la Piattaforma Ultralytics brilla.

I modelli Ultralytics forniscono una API Python unificata, trattando l'addestramento, la validazione e la distribuzione del modello come attività semplificate e standardizzate. Eviti il mal di testa di gestire complesse dipendenze di terze parti o operatori C++ personalizzati comuni nelle architetture più vecchie.

Inoltre, i modelli YOLO di Ultralytics richiedono significativamente meno memoria CUDA durante l'addestramento rispetto ai rilevatori basati su transformer come RT-DETR. Ciò consente ai professionisti di utilizzare batch size più grandi, stabilizzando l'addestramento e accelerando la convergenza su dataset personalizzati.

Integrazioni supportate

Ultralytics supporta nativamente l'esportazione di modelli in formati standard del settore come ONNX, OpenVINO e CoreML con un semplice flag booleano, semplificando enormemente il processo di distribuzione del modello.

Link to this sectionEsempio di codice: Addestramento con Ultralytics#

L'ecosistema Ultralytics ti consente di caricare, addestrare ed eseguire facilmente l'inferenza utilizzando YOLOv7 o architetture più recenti con poche righe di codice.

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()

Link to this sectionIl futuro: Ultralytics YOLO26#

Sebbene YOLOv7 e YOLOX rappresentino importanti passi storici, lo stato dell'arte si muove rapidamente. Rilasciato nel gennaio 2026, Ultralytics YOLO26 introduce paradigmi rivoluzionari che superano i modelli precedenti.

Scopri di più su YOLO26

  • End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This drastically reduces latency bottlenecks and guarantees deterministic execution times across varied hardware setups.
  • Inferenza CPU fino al 43% più veloce: Rimuovendo la Distribution Focal Loss (DFL) e ottimizzando la profondità della rete, YOLO26 è fortemente adattato per dispositivi edge privi di hardware GPU dedicato.
  • Ottimizzatore MuSGD: Ispirato alle tecniche avanzate di addestramento LLM, l'ottimizzatore MuSGD (un ibrido di SGD e Muon) offre un'eccezionale stabilità di addestramento e una convergenza più rapida.
  • Rilevamento di oggetti piccoli migliorato: L'integrazione delle funzioni di perdita ProgLoss + STAL fornisce miglioramenti significativi nel riconoscimento di oggetti piccoli e distanti, critici per la mappatura tramite droni e la sorveglianza di sicurezza.
  • Supporto nativo per i task: YOLO26 supporta in modo completo le Oriented Bounding Boxes (OBB), la segmentazione di istanze e la stima della posa nativamente all'interno della stessa API semplificata.

Per qualsiasi sviluppatore moderno che inizia oggi un nuovo progetto di computer vision, valutare Ultralytics YOLO26 sulla Piattaforma è il percorso consigliato per ottenere il miglior equilibrio in assoluto tra velocità, accuratezza e semplicità di distribuzione. Per chi effettua l'aggiornamento da generazioni precedenti come YOLO11 o YOLOv8, la transizione richiede di cambiare solo la stringa del modello, sbloccando istantaneamente capacità superiori.

Contributori

Commenti