Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ contro YOLOX#

Il panorama della computer vision è stato plasmato in modo significativo dalla rapida evoluzione dei modelli di rilevamento oggetti. Tra le tappe fondamentali di questo percorso figurano PP-YOLOE+ e YOLOX, due architetture che hanno spinto i confini delle prestazioni e della precisione in tempo reale. Comprendere le loro sfumature architettoniche, i compromessi prestazionali e gli scenari di distribuzione ideali è fondamentale per ricercatori e sviluppatori che creano la prossima generazione di sistemi di riconoscimento visivo.

Link to this sectionLineage e dettagli del modello#

Prima di immergersi nelle architetture tecniche, è utile contestualizzare le origini di entrambi i modelli. Ciascuno è stato sviluppato per affrontare specifici colli di bottiglia nel rilevamento oggetti, fortemente influenzato dalle organizzazioni che li hanno sostenuti.

Dettagli PP-YOLOE+:

Scopri di più su PP-YOLOE+

Dettagli su YOLOX:

Scopri di più su YOLOX

Link to this sectionInnovazioni architettoniche#

Le differenze fondamentali tra questi due rilevatori risiedono nel loro approccio all'estrazione delle caratteristiche e alla previsione dei bounding box.

YOLOX ha fatto scalpore nel 2021 adattando con successo la famiglia YOLO a un design anchor-free. Rimuovendo gli anchor box, YOLOX ha ridotto significativamente il numero di parametri di progettazione e la messa a punto euristica necessaria per i dataset personalizzati. Inoltre, ha introdotto una testa disaccoppiata (decoupled head), che separa i compiti di classificazione e localizzazione in percorsi neurali distinti. Questa separazione ha risolto il conflitto intrinseco tra la classificazione di un oggetto e la regressione delle sue coordinate spaziali, portando a una convergenza più rapida durante l'addestramento.

PP-YOLOE+, sviluppato da Baidu, è fortemente ottimizzato per l'ecosistema PaddlePaddle. Si basa sul suo predecessore, PP-YOLOv2, introducendo una strategia di assegnazione dinamica delle etichette (TAL) e una nuova backbone chiamata CSPRepResNet. Questa backbone sfrutta la ri-parametrizzazione strutturale, consentendo al modello di beneficiare di complesse architetture multi-ramo durante l'addestramento, pur fondendosi perfettamente in una rete rapida a percorso singolo per l'inferenza.

Ri-parametrizzazione strutturale

La ri-parametrizzazione strutturale consente a un modello di addestrarsi con più rami paralleli (migliorando il flusso del gradiente) per poi collassare matematicamente quei rami in un singolo livello convoluzionale per la distribuzione, aumentando le velocità di inferenza senza sacrificare la precisione.

Link to this sectionConfronto tra prestazioni e metriche#

Quando si confrontano questi modelli testa a testa, diventa evidente che servono estremità leggermente diverse dello spettro delle prestazioni. PP-YOLOE+ raggiunge generalmente una precisione assoluta più elevata, mentre YOLOX eccelle nel fornire varianti estremamente leggere adatte a hardware altamente vincolato.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Nota: i valori con le migliori prestazioni in ogni segmento di colonna rilevante sono evidenziati in grassetto.

Mentre YOLOX offre varianti nano e tiny che occupano pochissimo spazio su disco o memoria CUDA, PP-YOLOE+ scala incredibilmente bene su hardware di classe server, rendendolo una scelta robusta per pesanti applicazioni industriali all'interno dell'ecosistema Baidu.

Link to this sectionApplicazioni nel mondo reale#

La scelta tra questi framework si riduce spesso ai requisiti di integrazione e agli obiettivi hardware.

Link to this sectionDove eccelle YOLOX#

Grazie alla sua natura anchor-free e alla disponibilità di varianti per edge estremo, YOLOX è popolare nella robotica e nell'implementazione su microcontrollori. La sua semplice pipeline di post-elaborazione consente un porting più facile verso formati hardware NPU personalizzati come TensorRT e NCNN.

Link to this sectionDove eccelle PP-YOLOE+#

Per le organizzazioni profondamente integrate nei centri di produzione asiatici che utilizzano lo stack tecnologico di Baidu, PP-YOLOE+ fornisce un percorso pre-ottimizzato per la distribuzione. Eccelle negli scenari di ispezione qualità ad alta precisione in esecuzione su potenti rack di server, dove i rigidi vincoli di tempo reale consentono pesi del modello leggermente superiori.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra PP-YOLOE+ e YOLOX dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze di ecosistema.

Link to this sectionQuando scegliere PP-YOLOE+#

PP-YOLOE+ è una scelta valida per:

  • Integrazione con l'Ecosistema PaddlePaddle: Organizzazioni con infrastrutture esistenti costruite sul framework e sugli strumenti di Baidu PaddlePaddle.
  • Deployment su Edge con Paddle Lite: Deployment su hardware con kernel di inferenza altamente ottimizzati specificamente per il motore Paddle Lite o Paddle.
  • Rilevamento ad alta precisione lato server: Scenari che danno priorità alla massima precisione di rilevamento su potenti server GPU dove la dipendenza dal framework non rappresenta un problema.

Link to this sectionQuando scegliere YOLOX#

YOLOX è consigliato per:

  • Ricerca sul rilevamento senza anchor: Ricerca accademica che utilizza l'architettura pulita e senza anchor di YOLOX come base per sperimentare nuove head di rilevamento o funzioni di perdita.
  • Dispositivi edge ultraleggeri: Implementazione su microcontrollori o hardware mobile legacy dove l'impronta estremamente ridotta della variante YOLOX-Nano (0.91M di parametri) è critica.
  • Studi sull'assegnazione delle label SimOTA: Progetti di ricerca che studiano le strategie di assegnazione delle label basate sul trasporto ottimale e il loro impatto sulla convergenza dell'addestramento.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl vantaggio di Ultralytics: arriva YOLO26#

Mentre PP-YOLOE+ e YOLOX rappresentano eccellenti traguardi di ricerca, il moderno panorama della distribuzione richiede un'esperienza più coesa e adatta agli sviluppatori, con un'efficienza superiore. È qui che Ultralytics YOLO26 ridefinisce completamente lo standard per l'IA visiva moderna.

Per i team che cercano di passare da repository di ricerca isolati a sistemi pronti per la produzione, Ultralytics offre un ecosistema robusto e ben mantenuto. Addestrare un modello non richiede più la configurazione di ambienti complessi; è semplice quanto accedere a un'API Python unificata.

I principali vantaggi di Ultralytics YOLO26 includono:

  • Design End-to-End senza NMS: A differenza sia di PP-YOLOE+ che di YOLOX, che richiedono la soppressione non massima (NMS) per filtrare i bounding box ridondanti, YOLO26 è nativamente end-to-end. Questo elimina i colli di bottiglia della latenza e semplifica drasticamente la logica di distribuzione.
  • Inferenza su CPU fino al 43% più veloce: Rimuovendo strategicamente la Distribution Focal Loss (DFL), YOLO26 raggiunge velocità di inferenza senza pari su hardware CPU, rendendolo di gran lunga superiore per l'edge computing e i dispositivi a basso consumo.
  • Ottimizzatore MuSGD: Ispirato al Kimi K2 di Moonshot AI, questo ottimizzatore ibrido porta la stabilità dell'addestramento degli LLM alla computer vision, garantendo una convergenza molto più rapida e riducendo al minimo i requisiti di memoria durante le fasi di addestramento.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate offrono notevoli miglioramenti nel riconoscimento di oggetti piccoli, una caratteristica critica per le operazioni con droni e immagini aeree altamente dettagliate.
  • Versatilità: Mentre PP-YOLOE+ e YOLOX si concentrano puramente sul rilevamento, YOLO26 gestisce senza problemi segmentazione di istanze, stima della posa e Oriented Bounding Boxes (OBB) utilizzando la stessa identica sintassi intuitiva.

Scopri di più su YOLO26

Link to this sectionAddestramento semplificato con Ultralytics#

L'efficienza della memoria e la velocità di addestramento dei modelli Ultralytics non hanno eguali, superando completamente le alternative basate su Transformer che richiedono un enorme overhead di memoria CUDA. Puoi sfruttare la potenza di YOLO26 in poche righe di codice:

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
Esplora la piattaforma Ultralytics

Per i team che cercano una soluzione no-code, la piattaforma Ultralytics fornisce addestramento basato su cloud, annotazione integrata dei dataset e distribuzione con un clic per tutti i tuoi modelli YOLO.

Link to this sectionConclusione#

Sia PP-YOLOE+ che YOLOX si sono guadagnati il loro posto nella storia della computer vision, offrendo rispettivamente alta precisione e design anchor-free leggeri. Tuttavia, per le organizzazioni che costruiscono il futuro dell'IA in agricoltura, nelle smart city e nel retail, la manutenzione continua, la facilità d'uso e l'architettura nativa senza NMS di Ultralytics YOLO26 la rendono la scelta indiscussa.

Se stai esplorando architetture alternative per benchmark specifici, potresti trovare utile confrontare il precedente YOLO11 o le opzioni basate su Transformer come RT-DETR tramite la documentazione completa di Ultralytics. Migrando verso l'ecosistema unificato di Ultralytics, gli sviluppatori risparmiano tempo e risorse preziosi ottenendo risultati all'avanguardia su qualsiasi distribuzione edge o cloud.

Collaboratori

Commenti