Vai al contenuto

YOLOX vs. YOLOv5: collegare la ricerca senza ancoraggi e il rilevamento di oggetti industriale

L'evoluzione del rilevamento di oggetti in tempo reale è stata guidata da due filosofie distinte: la ricerca accademica della purezza architettonica e la richiesta industriale di un impiego pratico. YOLOX e YOLOv5 rappresentano la convergenza di questi due percorsi. YOLOX ha introdotto un rilevatore ad alte prestazioni senza ancoraggio che ha semplificato la geometria di base del rilevamento, mentre YOLOv5 lo standard globale per l'usabilità, la robustezza e la facilità di implementazione negli ambienti di produzione.

Questo confronto dettagliato esplora come questi due modelli influenti si posizionano in termini di scelte architetturali, velocità di inferenza e applicabilità nel mondo reale, aiutandoti a decidere quale framework si adatta meglio alle tue esigenze di visione artificiale.

Specifiche tecniche principali

La tabella seguente evidenzia le metriche di prestazione di entrambi i modelli. Mentre YOLOX dimostra ottimi risultati teorici, YOLOv5 offre YOLOv5 un profilo più equilibrato per l'implementazione pratica, in particolare se si considera la maturità del suo ecosistema di esportazione.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

YOLOX: l'innovatore senza ancore

YOLOX, rilasciato da Megvii nel 2021, ha segnato un cambiamento significativo nella YOLO abbandonando gli anchor box, un elemento fondamentale delle versioni precedenti come YOLOv2 e YOLOv3. Adottando un meccanismo senza anchor, YOLOX ha semplificato il processo di addestramento ed eliminato la necessità di una regolazione manuale degli iperparametri degli anchor, che spesso richiedeva competenze specifiche del settore.

Punti Salienti Architetturali

  • Meccanismo senza ancoraggio: invece di prevedere gli offset da riquadri predefiniti, YOLOX prevede direttamente le coordinate del riquadro di delimitazione. Questo approccio riduce la complessità dell'architettura della testa e migliora la generalizzazione tra forme di oggetti diverse.
  • Testa disaccoppiata: le attività di classificazione e localizzazione sono separate in diversi rami della rete. Questo disaccoppiamento risolve il conflitto tra affidabilità della classificazione e accuratezza della localizzazione, consentendo una convergenza più rapida durante l'addestramento.
  • Assegnazione di etichette SimOTA: YOLOX ha introdotto SimOTA, una strategia avanzata di assegnazione delle etichette che considera la procedura di assegnazione come un problema di trasporto ottimale. Questa assegnazione dinamica consente al modello di apprendere campioni positivi più efficaci durante l'addestramento.
  • MixUp mosaico e MixUp : fortemente ispirato alle Ultralytics YOLOv4 e Ultralytics , YOLOX utilizza solide strategie di aumento dei dati per aumentare la robustezza senza aumentare i costi di inferenza.

Contesto della ricerca

YOLOX ha svolto un ruolo fondamentale da ponte tra la ricerca accademica e l'applicazione industriale, dimostrando che i rilevatori senza ancoraggio possono eguagliare le prestazioni dei sistemi ottimizzati basati su ancoraggio come YOLOv5.

Dettagli YOLOX:

Scopri di più su YOLOX

YOLOv5: Lo Standard Industriale

YOLOv5, sviluppato da Ultralytics, è senza dubbio il modello di rilevamento oggetti più diffuso al mondo. Ha dato priorità all'usabilità, alla stabilità e a un'esperienza "semplicemente funzionante". Mentre YOLOX si è concentrato sulla novità architettonica, YOLOv5 sull'eccellenza ingegneristica, creando un modello facile da addestrare, implementare e scalare in migliaia di casi d'uso reali.

Perché gli sviluppatori scelgono YOLOv5

  • Facilità d'uso senza pari: Ultralytics elimina la complessità della formazione dei modelli di deep learning. Un utente può passare dal set di dati al modello addestrato con poche righe di Python , riducendo significativamente la barriera all'adozione dell'IA.
  • Ecosistema completo: a differenza degli archivi di ricerca che spesso vengono abbandonati dopo la pubblicazione, YOLOv5 supportato da un ecosistema di grandi dimensioni. Questo include integrazioni perfette con strumenti MLOps come Weights & Biases, Comete ClearML, garantendo un flusso di lavoro di sviluppo professionale.
  • Gestione efficiente della memoria: YOLOv5 progettato per garantire efficienza. In genere richiede meno GPU durante l'addestramento rispetto a molti concorrenti, consentendo agli utenti di addestrare modelli efficaci su hardware di livello consumer o persino su risorse cloud gratuite come Google .
  • Versatilità oltre il rilevamento: mentre YOLOX è principalmente un framework di rilevamento, YOLOv5 supporta YOLOv5 la segmentazione delle istanze e la classificazione delle immagini, rendendolo uno strumento multifunzionale per diverse esigenze di progetto.

YOLOv5 :

Scopri di più su YOLOv5

Analisi delle prestazioni e dell'implementazione

Quando si seleziona un modello per la produzione, raramente mAP grezzo mAP l'unico fattore determinante. Anche i vincoli di implementazione, la compatibilità hardware e la manutenzione sono fattori altrettanto critici.

Velocità ed efficienza dell'inferenza

YOLOv5 negli scenari di implementazione. La sua architettura è fortemente ottimizzata per l'esportazione in formati come ONNX, TensorRT, CoreMLe TFLite. Come si può vedere dalla tabella comparativa, YOLOv5n (Nano) raggiunge velocità di inferenza significativamente più elevate (1,12 ms su T4 TensorRT) rispetto a modelli leggeri simili, rendendolo ideale per dispositivi edge in cui ogni millisecondo è fondamentale.

YOLOX, pur essendo performante, può talvolta incontrare difficoltà di compatibilità con l'esportazione a causa dei suoi specifici componenti architetturali (come la testa disaccoppiata), che possono richiedere una maggiore personalizzazione ingegneristica per l'ottimizzazione di determinati motori di inferenza.

Esperienza formativa

L'efficienza della formazione è una caratteristica distintiva Ultralytics . Il meccanismo di auto-ancoraggio YOLOv5 ricalcola automaticamente gli ancoraggi per adattarli al meglio al vostro set di dati personalizzato, offrendo i vantaggi di ancoraggi su misura senza intervento manuale. Inoltre, la disponibilità di pesi pre-addestrati di alta qualità accelera il trasferimento dell'apprendimento, consentendo ai modelli di raggiungere un'elevata precisione con set di dati più piccoli.

from ultralytics import YOLO

# Load a model (YOLOv5 or the newer YOLO26)
model = YOLO("yolov5su.pt")  # YOLOv5s with newer head

# Train on custom data in one line
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Flusso di lavoro semplificato

Il frammento di codice sopra riportato mostra Ultralytics unificata Ultralytics . Questa stessa semplice interfaccia funziona per YOLOv5, YOLOv8 e l'innovativo YOLO26, consentendo di passare da un modello all'altro istantaneamente senza dover riscrivere il codice.

Raccomandazioni sui casi d'uso

Ideale per YOLOX

  • Ricerca accademica: la sua implementazione pulita e senza ancore lo rende un ottimo punto di riferimento per i ricercatori che studiano strategie di assegnazione delle etichette o architetture delle testine di rilevamento.
  • Scenari specifici ad alta precisione: per attività in cui l'unica priorità mAP massimizzare mAP e la latenza di inferenza è meno critica, le varianti più grandi di YOLOX (come YOLOX-x) offrono una precisione competitiva.

Ideale per YOLOv5

  • Implementazione commerciale: le solide vie di esportazione e la stabilità rendono YOLOv5 ideale per le aziende che implementano migliaia di dispositivi, dai Raspberry Pi ai server cloud.
  • Edge AI: le varianti leggere (Nano/Small) sono eccezionalmente veloci, perfette per l'analisi video in tempo reale su telefoni cellulari o droni.
  • Prototipazione rapida: l'esperienza "da zero a eroe" consente agli sviluppatori di convalidare le idee in poche ore anziché in giorni.

Il futuro: Ultralytics

Sebbene YOLOv5 YOLOX rimangano strumenti potenti, il settore ha fatto passi avanti. Per gli sviluppatori alla ricerca delle prestazioni migliori in assoluto, Ultralytics rappresenta la nuova generazione dell'intelligenza artificiale visiva.

YOLO26 combina il meglio dei due mondi:

  • End-to-End NMS: come i modelli di ricerca più avanzati, YOLO26 è nativamente end-to-end, eliminando la necessità di NMS . Ciò si traduce in un'inferenza più veloce e deterministica, semplificando le pipeline di implementazione.
  • Ottimizzatore MuSGD: ispirato alle innovazioni nella formazione LLM, YOLO26 utilizza l'ottimizzatore MuSGD per garantire maggiore stabilità e velocità di convergenza.
  • Ottimizzazione edge: è progettato specificamente per l'edge computing e offre CPU fino al 43% più veloce rispetto alle generazioni precedenti, rendendolo una scelta eccellente per le applicazioni mobili e IoT.
  • Versatilità: supporta tutte le attività (rilevamento, segmentazione, classificazione, posa e OBB) all'interno di un unico framework unificato.

Scopri di più su YOLO26

Conclusione

La scelta tra YOLOX e YOLOv5 dipende YOLOv5 dai vostri obiettivi. Se siete ricercatori che desiderano sperimentare architetture senza anchor, YOLOX è un ottimo candidato. Tuttavia, per la stragrande maggioranza degli sviluppatori e delle aziende che si concentrano sulla creazione di applicazioni affidabili e in tempo reale, YOLOv5e il suo successore YOLO26offrono un equilibrio superiore tra velocità, precisione e facilità d'uso. Ultralytics garantisce che i vostri progetti siano supportati da una manutenzione attiva, una documentazione completa e una comunità vivace.

Per approfondire ulteriormente l'argomento, potresti anche essere interessato a confrontare YOLOv8 YOLOv5 o a scoprire le funzionalità in tempo reale di YOLOv10.


Commenti