Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX vs YOLOv7: Un confronto tecnico completo#

L'evoluzione del rilevamento oggetti in tempo reale è stata guidata da continui progressi architettonici. Due pietre miliari significative in questo percorso sono YOLOX e YOLOv7. Rilasciati a distanza di un anno l'uno dall'altro, entrambi i modelli hanno introdotto approcci innovativi al paradigma standard del rilevamento oggetti, migliorando significativamente il compromesso tra velocità e accuratezza.

Questa pagina fornisce un'analisi tecnica approfondita di YOLOX e YOLOv7, confrontando le loro architetture, le metriche di prestazione e i casi d'uso ideali per aiutarti a scegliere lo strumento giusto per le tue implementazioni di computer vision.

Link to this sectionYOLOX: Pioniere del rilevamento anchor-free#

Introdotto dai ricercatori di Megvii nel luglio 2021, YOLOX ha rappresentato un cambiamento importante allontanandosi dai tradizionali design basati su anchor. Colmando il divario tra la ricerca accademica e l'applicazione industriale, YOLOX ha semplificato la testa di rilevamento e migliorato le prestazioni complessive.

Dettagli chiave del modello:

Link to this sectionInnovazioni architettoniche#

YOLOX ha introdotto un approccio anchor-free, che ha ridotto drasticamente il numero di parametri di progettazione e le modifiche euristiche necessarie per i dataset personalizzati. Ha implementato una testa disaccoppiata, separando le attività di classificazione e regressione, migliorando la velocità di convergenza e l'accuratezza. Inoltre, YOLOX ha utilizzato strategie avanzate di data augmentation come MixUp e Mosaic per migliorare la robustezza del modello.

Scopri di più su YOLOX

Vantaggio anchor-free

Eliminando le anchor box, YOLOX riduce il sovraccarico computazionale dovuto al calcolo della Intersection over Union (IoU) tra le previsioni e le ground truth durante l'addestramento, con conseguenti minori requisiti di memoria CUDA e tempi di addestramento più rapidi.

Link to this sectionYOLOv7: Trainable Bag-of-Freebies#

Rilasciato nel luglio 2022 dai ricercatori dell'Institute of Information Science, Academia Sinica, Taiwan, YOLOv7 ha spinto ulteriormente i confini del rilevamento oggetti in tempo reale. Ha introdotto il concetto di "bag-of-freebies addestrabile", stabilendo nuovi benchmark allo stato dell'arte sul dataset MS COCO al momento del suo rilascio.

Dettagli chiave del modello:

Link to this sectionInnovazioni architettoniche#

L'architettura di YOLOv7 è costruita attorno alla E-ELAN (Extended Efficient Layer Aggregation Network), che consente al modello di apprendere continuamente caratteristiche più diversificate senza degradare il percorso del gradiente. Inoltre, YOLOv7 ha utilizzato tecniche di ri-parametrizzazione del modello, consentendo di semplificare complesse reti di addestramento multi-ramo in reti a percorso singolo più veloci durante l'inferenza.

Scopri di più su YOLOv7

Link to this sectionConfronto delle prestazioni#

Quando valuti questi modelli per applicazioni nel mondo reale, è fondamentale comprendere le loro prestazioni su diverse scale. La tabella seguente confronta le metriche standard per varie dimensioni di YOLOX e YOLOv7.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Link to this sectionAnalisi#

  • Accuratezza: YOLOv7 raggiunge generalmente una mAP più elevata rispetto ai modelli YOLOX equivalenti. Ad esempio, YOLOv7x raggiunge 53.1 mAP rispetto ai 51.1 di YOLOXx.
  • Velocità: Sebbene entrambi i modelli siano altamente ottimizzati per l'esecuzione su GPU tramite TensorRT, l'architettura E-ELAN di YOLOv7 fornisce un throughput leggermente migliore per le applicazioni di fascia alta, sebbene YOLOX mantenga un'eccellente latenza su dispositivi edge più piccoli.
  • Versatilità: YOLOv7 ha ampliato il suo repertorio oltre le bounding box fornendo nativamente pesi per l'instance segmentation e la pose estimation, rendendolo più versatile rispetto al repository YOLOX di base.

Link to this sectionApplicazioni nel mondo reale#

La scelta tra questi modelli dipende spesso dal tuo specifico ambiente di implementazione.

Link to this sectionEdge Computing e IoT#

Per i dispositivi edge limitati come Raspberry Pi o processori mobili meno recenti, YOLOX-Nano e YOLOX-Tiny sono altamente interessanti. Il loro numero minimo di parametri e la natura anchor-free li rendono più facili da implementare in ambienti a basso consumo per attività come il tracciamento di base del movimento o applicazioni per campanelli intelligenti.

Link to this sectionAnalisi video ad alta fedeltà#

Per l'elaborazione di feed ad alta risoluzione nel rilevamento industriale dei difetti o nel monitoraggio del traffico denso, YOLOv7 è superiore. La sua robusta aggregazione delle caratteristiche gli consente di mantenere un'elevata accuratezza anche quando gli oggetti sono parzialmente occlusi o variano notevolmente in scala.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOX e YOLOv7 dipende dai requisiti specifici del tuo progetto, dai vincoli di implementazione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOX#

YOLOX è una scelta solida per:

  • Ricerca sul rilevamento anchor-free: Ricerca accademica che utilizza l'architettura pulita e anchor-free di YOLOX come base per sperimentare nuove teste di rilevamento o funzioni di perdita.
  • Dispositivi edge ultraleggeri: Distribuzione su microcontrollori o hardware mobile legacy dove l'impronta estremamente piccola della variante YOLOX-Nano (0.91M parametri) è critica.
  • Studi sull'assegnazione delle etichette SimOTA: Progetti di ricerca che studiano strategie di assegnazione delle etichette basate sul trasporto ottimale e il loro impatto sulla convergenza dell'addestramento.

Link to this sectionQuando scegliere YOLOv7#

YOLOv7 è consigliato per:

  • Benchmarking accademico: riprodurre risultati allo stato dell'arte dell'era 2022 o studiare gli effetti delle tecniche E-ELAN e trainable bag-of-freebies.
  • Ricerca sulla riparametrizzazione: indagare le convoluzioni riparametrizzate pianificate e le strategie di scalabilità dei modelli composti.
  • Pipeline personalizzate esistenti: progetti con pipeline fortemente personalizzate costruite attorno all'architettura specifica di YOLOv7 che non possono essere facilmente rifattorizzate.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza di sviluppo:

  • Deployment Edge senza NMS: Applicazioni che richiedono un'inferenza coerente e a bassa latenza senza la complessità della post-elaborazione con Non-Maximum Suppression.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza su CPU di YOLO26, fino al 43% più veloce, offre un vantaggio decisivo.
  • Rilevamento di piccoli oggetti: Scenari complessi come immagini di droni aerei o analisi tramite sensori IoT dove ProgLoss e STAL migliorano significativamente l'accuratezza su oggetti minuscoli.

Link to this sectionIl vantaggio di Ultralytics#

Sebbene sia YOLOX che YOLOv7 siano potenti implementazioni di ricerca, passare da un repository di ricerca a un ambiente di produzione scalabile può essere scoraggiante. È qui che la Piattaforma Ultralytics eccelle.

I modelli Ultralytics forniscono una API Python unificata, trattando l'addestramento, la validazione e l'implementazione del modello come attività semplificate e standardizzate. Eviti il mal di testa di gestire complesse dipendenze di terze parti o operatori C++ personalizzati comuni nelle architetture più vecchie.

Inoltre, i modelli YOLO di Ultralytics richiedono significativamente meno memoria CUDA durante l'addestramento rispetto ai rilevatori basati su Transformer come RT-DETR. Ciò consente agli sviluppatori di utilizzare batch size più grandi, stabilizzando l'addestramento e accelerando la convergenza su dataset personalizzati.

Integrazioni supportate

Ultralytics supporta nativamente l'esportazione di modelli verso formati standard del settore come ONNX, OpenVINO e CoreML con un semplice flag booleano, semplificando enormemente il processo di implementazione del modello.

Link to this sectionEsempio di codice: Addestramento con Ultralytics#

L'ecosistema Ultralytics ti consente di caricare, addestrare ed eseguire facilmente l'inferenza utilizzando YOLOv7 o architetture più recenti con poche righe di codice.

from ultralytics import YOLO

# Load a pre-trained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on a custom dataset (e.g., COCO8)
# The API handles data loading, augmentation, and memory management automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image
predictions = model("path/to/image.jpg")
predictions[0].show()

Link to this sectionIl futuro: Ultralytics YOLO26#

Mentre YOLOv7 e YOLOX rappresentano importanti passi storici, lo stato dell'arte si muove rapidamente. Rilasciato nel gennaio 2026, Ultralytics YOLO26 introduce paradigmi innovativi che superano i modelli precedenti.

Scopri di più su YOLO26

  • End-to-End NMS-Free Design: YOLO26 natively eliminates Non-Maximum Suppression (NMS) post-processing. This drastically reduces latency bottlenecks and guarantees deterministic execution times across varied hardware setups.
  • Inferenza CPU fino al 43% più veloce: Rimuovendo la Distribution Focal Loss (DFL) e ottimizzando la profondità della rete, YOLO26 è fortemente adattato per i dispositivi edge che non dispongono di hardware GPU dedicato.
  • Ottimizzatore MuSGD: Ispirato dalle tecniche avanzate di addestramento LLM, l'ottimizzatore MuSGD (un ibrido di SGD e Muon) offre un'eccezionale stabilità di addestramento e una convergenza più rapida.
  • Rilevamento migliorato di piccoli oggetti: L'integrazione delle funzioni di perdita ProgLoss + STAL fornisce miglioramenti significativi nel riconoscimento di oggetti piccoli e distanti, fondamentale per la mappatura con droni e la sorveglianza di sicurezza.
  • Supporto nativo per le attività: YOLO26 supporta in modo completo le Oriented Bounding Boxes (OBB), l'instance segmentation e la pose estimation nativamente all'interno della stessa API semplificata.

Per qualsiasi sviluppatore moderno che inizi oggi un nuovo progetto di computer vision, valutare Ultralytics YOLO26 sulla Piattaforma è il percorso consigliato per ottenere il miglior equilibrio possibile tra velocità, accuratezza e semplicità di implementazione. Per coloro che eseguono l'aggiornamento da generazioni precedenti come YOLO11 o YOLOv8, la transizione richiede solo la modifica della stringa del modello, sbloccando istantaneamente capacità superiori.

Collaboratori

Commenti