Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 vs YOLOX: Un approfondimento tecnico sul moderno object detection#

Il campo della computer vision ha assistito a una rapida evoluzione nelle architetture di object detection in tempo reale. Questa guida fornisce un confronto completo tra YOLOv9 e YOLOX, analizzando le loro innovazioni architetturali, le metriche di performance e le metodologie di addestramento. Che tu stia creando applicazioni intelligenti per l'AI nel manifatturiero o esplorando la modellazione predittiva, comprendere questi modelli ti aiuterà a prendere decisioni informate per il tuo prossimo deployment.

Link to this sectionInnovazioni architettoniche#

Link to this sectionYOLOv9: Informazioni sul gradiente programmabile#

YOLOv9 ha introdotto un cambio di paradigma affrontando il problema del collo di bottiglia informativo intrinseco alle reti neurali profonde. Le sue innovazioni principali includono la Programmable Gradient Information (PGI) e la Generalized Efficient Layer Aggregation Network (GELAN).

  • Autori: Chien-Yao Wang e Hong-Yuan Mark Liao
  • Organizzazione: Institute of Information Science, Academia Sinica, Taiwan
  • Data: 21 febbraio 2024
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

Mantenendo dati cruciali sulle feature durante il processo di feed-forward, YOLOv9 assicura che i gradienti utilizzati per aggiornare i pesi durante la backpropagation rimangano accurati. Questa architettura eccelle nell'estrazione di feature, rendendola altamente capace di rilevare piccoli oggetti in ambienti complessi, come quelli presenti nell'immaginario aereo e nelle scansioni mediche dettagliate.

Scopri di più su YOLOv9

Link to this sectionYOLOX: Colmare il divario tra ricerca e industria#

Rilasciato a metà 2021, YOLOX ha spostato la serie YOLO verso un design anchor-free. Ha introdotto una decoupled head, che separa i compiti di classificazione e localizzazione, e ha utilizzato la strategia di assegnazione delle etichette SimOTA per migliorare la convergenza dell'addestramento.

Sebbene YOLOX sia stato rivoluzionario per i suoi tempi, raggiungendo un'eccellente mean average precision (mAP) ed eliminando la sintonizzazione degli iperparametri degli anchor box, la sua architettura sottostante è stata da allora superata da reti moderne che bilanciano meglio il numero di parametri e la ritenzione delle feature.

Scopri di più su YOLOX

Evoluzione Anchor-Free

Sia YOLOX che i nuovi modelli Ultralytics adottano design anchor-free, riducendo la complessità della sintonizzazione degli iperparametri e migliorando la generalizzazione su diversi dataset.

Link to this sectionAnalisi delle prestazioni#

Quando si confrontano questi modelli nel benchmark MS COCO, i progressi di YOLOv9 diventano evidenti. YOLOv9 raggiunge costantemente un miglior compromesso tra accuratezza e FLOPs.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Mentre YOLOX offre varianti leggere come YOLOX-Nano per casi edge estremi, le varianti YOLOv9 superano costantemente i modelli YOLOX di dimensioni simili in pura accuratezza. Ad esempio, YOLOv9m raggiunge un mAP del 51,4% rispetto al 49,7% di YOLOXl, nonostante abbia meno della metà dei parametri (20,0M contro 54,2M).

Link to this sectionIl vantaggio di Ultralytics#

Scegliere un modello implica molto più della semplice teoria architetturale; l'ecosistema circostante determina la velocità di sviluppo e il successo del deployment. Utilizzare YOLOv9 all'interno dell'ecosistema Ultralytics offre una facilità d'uso senza pari e un robusto supporto della community.

A differenza dei vecchi repository di ricerca originali, il framework Ultralytics fornisce un'API Python unificata che semplifica pipeline complesse. L'addestramento richiede una memoria GPU drasticamente inferiore rispetto a molte alternative, offrendo un'incredibile efficienza di addestramento.

from ultralytics import YOLO

# Initialize the YOLOv9c model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export the optimized model to TensorRT format
model.export(format="engine")

Con il supporto integrato per molteplici task, tra cui object detection, instance segmentation e pose estimation, puoi rapidamente adattare le tue soluzioni di computer vision senza modificare l'intera codebase.

Export senza interruzioni

Stai effettuando il deploy sull'edge? Ultralytics rende semplice esportare i tuoi modelli addestrati in formati altamente ottimizzati come ONNX, TensorRT e OpenVINO con un solo comando.

Link to this sectionApplicazioni nel mondo reale#

I punti di forza specifici di questi modelli li adattano a distinte applicazioni del mondo reale:

Link to this sectionAnalisi retail ad alta velocità#

Per i moderni ambienti retail che richiedono il riconoscimento dei prodotti in tempo reale, YOLOv9 eccelle. La sua capacità di mantenere dettagli intricati delle feature lo rende perfettamente adatto a deployment di AI nel retail dove è necessario distinguere tra prodotti visivamente simili su uno scaffale affollato.

Link to this sectionDeployment edge legacy#

In scenari governati da rigide limitazioni hardware o NPU specializzate che hanno difficoltà con i nuovi blocchi di aggregazione, YOLOX-Nano può talvolta trovare una nicchia. I suoi pattern di convoluzione puri e ridotti all'essenziale sono talvolta preferiti per microcontrollori estremamente vincolati nelle risorse.

Link to this sectionRobotica autonoma#

Per la navigazione robotica, perdere piccoli oggetti può essere catastrofico. L'architettura GELAN all'interno di YOLOv9 assicura che le feature di ostacoli piccoli e distanti non vadano perse negli strati profondi della rete, superando i modelli più vecchi in ambienti di sicurezza critici come le applicazioni di AI nell'automotive.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOv9 e YOLOX dipende dai requisiti specifici del tuo progetto, dai vincoli di deployment e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv9#

YOLOv9 è un'ottima scelta per:

  • Ricerca sul collo di bottiglia informativo: Progetti accademici che studiano le architetture Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Studi sull'ottimizzazione del flusso del gradiente: Ricerca focalizzata sulla comprensione e sulla mitigazione della perdita di informazioni negli strati profondi della rete durante l'addestramento.
  • Benchmarking del rilevamento ad alta precisione: Scenari in cui le solide prestazioni di YOLOv9 nel benchmark COCO sono necessarie come punto di riferimento per confronti architettonici.

Link to this sectionQuando scegliere YOLOX#

YOLOX è consigliato per:

  • Ricerca sul rilevamento anchor-free: Ricerca accademica che utilizza l'architettura pulita e anchor-free di YOLOX come base per sperimentare nuove teste di rilevamento o funzioni di perdita.
  • Dispositivi edge ultraleggeri: Distribuzione su microcontrollori o hardware mobile legacy dove l'impronta estremamente piccola della variante YOLOX-Nano (0.91M parametri) è critica.
  • Studi sull'assegnazione delle etichette SimOTA: Progetti di ricerca che studiano strategie di assegnazione delle etichette basate sul trasporto ottimale e il loro impatto sulla convergenza dell'addestramento.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza di sviluppo:

  • Deployment Edge senza NMS: Applicazioni che richiedono un'inferenza coerente e a bassa latenza senza la complessità della post-elaborazione con Non-Maximum Suppression.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza su CPU di YOLO26, fino al 43% più veloce, offre un vantaggio decisivo.
  • Rilevamento di piccoli oggetti: Scenari complessi come immagini di droni aerei o analisi tramite sensori IoT dove ProgLoss e STAL migliorano significativamente l'accuratezza su oggetti minuscoli.

Link to this sectionIl futuro: Arriva YOLO26#

Mentre YOLOv9 rappresenta un traguardo impressionante, le richieste degli ambienti di produzione spingono costantemente oltre i limiti. Il nuovo YOLO26 rappresenta lo standard definitivo per la moderna vision AI.

YOLO26 rivitalizza completamente la pipeline di deployment con un design nativo End-to-End NMS-Free. Eliminando la necessità di complessi Non-Maximum Suppression durante il post-processing, offre una latenza di inferenza significativamente inferiore.

Inoltre, YOLO26 incorpora il rivoluzionario ottimizzatore MuSGD, un ibrido tra SGD e Muon che prende in prestito innovazioni dall'addestramento LLM per fornire una convergenza incredibilmente stabile e rapida. Rimuovendo la Distribution Focal Loss (DFL), YOLO26 ottiene un'inferenza CPU fino al 43% più veloce rispetto ai suoi predecessori, rendendolo la scelta assolutamente migliore per dispositivi edge e deployment enterprise. Con notevoli miglioramenti nel riconoscimento di piccoli oggetti tramite ProgLoss e STAL, YOLO26 sostituisce efficacemente sia YOLOX che YOLOv9.

Per gli ingegneri che esplorano architetture moderne, consigliamo anche di dare un'occhiata a YOLO11 e RT-DETR come potenti alternative all'interno della suite Ultralytics. Assicurati che il tuo progetto sia a prova di futuro sfruttando le performance senza pari degli ultimi modelli sulla Ultralytics Platform.

Commenti