Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 contro YOLOX#

L'evoluzione della visione artificiale in tempo reale ha visto numerose pietre miliari, con diverse architetture che hanno spinto i limiti di velocità e precisione. Due modelli altamente influenti in questo ambito sono YOLOv5 e YOLOX. Sebbene entrambi siano rinomati per le loro elevate prestazioni nel rilevamento di oggetti, adottano approcci architetturali fondamentalmente diversi.

Questa guida fornisce un'analisi tecnica approfondita di questi due modelli, confrontando le loro architetture, le metriche di prestazioni, le metodologie di addestramento e gli scenari di distribuzione ideali per aiutare sviluppatori e ricercatori a scegliere lo strumento giusto per i loro progetti di visione artificiale.

Link to this sectionPanoramica dei modelli e differenze architetturali#

Link to this sectionUltralytics YOLOv5#

Introdotto da Ultralytics, YOLOv5 è diventato rapidamente uno standard industriale grazie al suo eccezionale equilibrio tra prestazioni, facilità d'uso ed efficienza della memoria. Basato nativamente sul framework PyTorch, YOLOv5 utilizza un'architettura basata su anchor. Si affida a forme di bounding box predefinite per prevedere le posizioni degli oggetti, il che lo rende altamente efficace per i compiti standard di rilevamento oggetti.

Uno dei maggiori punti di forza di YOLOv5 è il suo ecosistema ben curato. Vanta una documentazione estesa, un'API Python incredibilmente semplice e un'integrazione nativa con la Piattaforma Ultralytics. Questo consente agli sviluppatori di passare senza problemi dall'etichettatura dei dataset all'addestramento e all'esportazione verso formati come ONNX e TensorRT.

Scopri di più su YOLOv5

Vantaggio dell'ecosistema

I modelli YOLO di Ultralytics richiedono solitamente molta meno memoria GPU durante l'addestramento rispetto alle complesse alternative basate su Transformer. Questo basso consumo di memoria rende YOLOv5 altamente accessibile per i ricercatori che lavorano con hardware di livello consumer.

Link to this sectionMegvii YOLOX#

Sviluppato dai ricercatori di Megvii, YOLOX ha intrapreso una strada diversa introducendo un design privo di anchor nella famiglia YOLO. Eliminando le anchor box, YOLOX semplifica la head di rilevamento e riduce significativamente il numero di parametri euristici che richiedono una regolazione manuale durante l'addestramento.

YOLOX incorpora inoltre una head disaccoppiata (che separa i compiti di classificazione e regressione in diversi rami della rete) e utilizza la strategia di assegnazione delle label SimOTA. Queste innovazioni colmano il divario tra la ricerca accademica e le applicazioni industriali, rendendo YOLOX particolarmente efficace in ambienti con scale di oggetti altamente variabili.

Scopri di più su YOLOX

Link to this sectionPrestazioni e metriche#

Quando si valutano i modelli di visione artificiale, il compromesso tra la precisione media (mAP) e la velocità di inferenza è fondamentale. Entrambi i modelli offrono una gamma di dimensioni (da Nano a Extra-Large) per adattarsi ai diversi vincoli hardware.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Mentre YOLOXx raggiunge una precisione di picco leggermente superiore (51.1 mAP), YOLOv5 offre una pipeline di distribuzione molto più robusta e accuratamente testata su hardware CPU e GPU. Le velocità TensorRT di YOLOv5 evidenziano la sua profonda ottimizzazione per i dispositivi di edge computing, rendendolo una scelta altamente affidabile per l'analisi video in tempo reale.

Link to this sectionMetodologie di addestramento e usabilità#

L'esperienza dello sviluppatore varia in modo significativo tra queste due architetture.

Link to this sectionL'approccio YOLOX#

L'addestramento di YOLOX richiede solitamente la clonazione del repository originale, la gestione di dipendenze specifiche e l'esecuzione di complessi script da riga di comando. Sebbene supporti funzionalità avanzate come l'addestramento a precisione mista e configurazioni multi-nodo tramite MegEngine, la curva di apprendimento può essere ripida per gli sviluppatori che necessitano di una prototipazione rapida.

Link to this sectionIl vantaggio di Ultralytics#

Al contrario, Ultralytics dà priorità a un'esperienza utente eccezionalmente semplificata. Con il pacchetto Python ultralytics, puoi caricare, addestrare e convalidare un modello con un codice boilerplate minimo. Ultralytics gestisce automaticamente complesse aumentazioni dei dati, evoluzione degli iperparametri e pianificazione del tasso di apprendimento.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

Inoltre, la versatilità di YOLOv5 si estende oltre il rilevamento oggetti standard, offrendo un solido supporto per classificazione delle immagini e segmentazione di istanze all'interno della stessa identica API coesa.

Distribuzione semplificata

Una volta completato l'addestramento, esportare un modello YOLOv5 in CoreML, TFLite o OpenVINO è semplice come eseguire model.export(format="onnx"). Questo elimina la necessità di script di conversione di terze parti solitamente richiesti dai repository orientati alla ricerca.

Link to this sectionApplicazioni nel mondo reale#

La scelta tra questi modelli dipende dal tuo ambiente di distribuzione e dai tuoi requisiti tecnici:

  • Vendita al dettaglio e gestione dell'inventario: Per le applicazioni che richiedono il riconoscimento dei prodotti in tempo reale su dispositivi edge come NVIDIA Jetson, YOLOv5 è particolarmente adatto. Il suo ingombro minimo di memoria e le veloci velocità di inferenza TensorRT consentono il monitoraggio multi-camera senza perdere fotogrammi.
  • Ricerca accademica e architetture personalizzate: YOLOX è molto apprezzato nella comunità di ricerca. La sua head disaccoppiata e la natura priva di anchor lo rendono un'ottima base per gli ingegneri che desiderano sperimentare nuove strategie di assegnazione delle label o per chi lavora su dataset in cui le tradizionali anchor box non riescono a generalizzare.
  • Agricoltura AI: Per compiti di agricoltura di precisione come il rilevamento dei frutti o l'identificazione delle erbe infestanti tramite droni, la facilità di addestramento e distribuzione dei modelli YOLOv5 tramite la Piattaforma Ultralytics consente agli esperti del settore di implementare soluzioni AI senza bisogno di competenze approfondite in ingegneria del machine learning.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOv5 e YOLOX dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv5#

YOLOv5 è una scelta solida per:

  • Sistemi di produzione comprovati: Deployment esistenti in cui sono apprezzati la lunga storia di stabilità, l'ampia documentazione e il massiccio supporto della comunità di YOLOv5.
  • Addestramento con risorse limitate: Ambienti con risorse GPU limitate in cui la pipeline di addestramento efficiente e i minori requisiti di memoria di YOLOv5 sono vantaggiosi.
  • Ampio supporto di formati di esportazione: Progetti che richiedono il deployment su molti formati, inclusi ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando scegliere YOLOX#

YOLOX è consigliato per:

  • Ricerca sul rilevamento senza anchor: Ricerca accademica che utilizza l'architettura pulita e senza anchor di YOLOX come base per sperimentare nuove head di rilevamento o funzioni di perdita.
  • Dispositivi edge ultraleggeri: Implementazione su microcontrollori o hardware mobile legacy dove l'impronta estremamente ridotta della variante YOLOX-Nano (0.91M di parametri) è critica.
  • Studi sull'assegnazione delle label SimOTA: Progetti di ricerca che studiano le strategie di assegnazione delle label basate sul trasporto ottimale e il loro impatto sulla convergenza dell'addestramento.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl futuro della Vision AI: arriva YOLO26#

Sebbene sia YOLOv5 che YOLOX abbiano consolidato il loro posto nella storia della visione artificiale, il campo sta avanzando rapidamente. Per gli sviluppatori che iniziano oggi nuovi progetti, Ultralytics consiglia vivamente di esplorare il suo ultimo modello di punta, YOLO26.

Rilasciato a gennaio 2026, YOLO26 rappresenta un enorme salto in avanti sia nelle prestazioni che nell'usabilità. Introduce un rivoluzionario design end-to-end senza NMS, eliminando completamente il post-processing di Non-Maximum Suppression. Questo riduce significativamente la variabilità della latenza e semplifica la logica di distribuzione sui dispositivi a basso consumo.

Inoltre, YOLO26 utilizza il nuovo Ottimizzatore MuSGD — un ibrido di SGD e Muon ispirato alle innovazioni nell'addestramento LLM — per una convergenza incredibilmente stabile e veloce. Con la Rimozione DFL (Distribution Focal Loss rimossa per un'esportazione semplificata e una migliore compatibilità con dispositivi edge/low-power), YOLO26 raggiunge un'inferenza CPU fino al 43% più veloce, consolidando la sua posizione come modello definitivo per le moderne applicazioni di edge computing, robotica e IoT. Inoltre, ProgLoss + STAL offre funzioni di loss migliorate con notevoli miglioramenti nel riconoscimento di piccoli oggetti, critici per IoT, robotica e immagini aeree. Gli utenti interessati alle generazioni precedenti possono anche guardare a YOLO11, sebbene YOLO26 sia l'indiscussa scelta all'avanguardia.

Link to this sectionConclusione#

YOLOv5 e YOLOX offrono entrambi incredibili capacità di rilevamento oggetti. YOLOX ha spinto i confini architetturali dimostrando che i design privi di anchor potevano competere con e superare i metodi tradizionali nel 2021. Tuttavia, YOLOv5 rimane una forza dominante grazie alla sua facilità d'uso senza pari, al vasto ecosistema e ai minori requisiti di memoria durante l'addestramento.

Per la stragrande maggioranza delle applicazioni commerciali, l'ecosistema Ultralytics fornisce il percorso più veloce da un dataset grezzo a un modello pronto per la produzione. Che si utilizzi il collaudato YOLOv5 o che si passi all'avanguardia YOLO26, gli sviluppatori beneficiano di un framework progettato per rendere la visione artificiale accessibile, efficiente e altamente performante.

Commenti