YOLOX vs. YOLO11: collegare la ricerca e l'applicazione nel mondo reale
Nel panorama in rapida evoluzione del rilevamento degli oggetti, la scelta del modello giusto spesso comporta un equilibrio tra ricerca all'avanguardia ed esigenze pratiche di implementazione. Questo confronto esplora due architetture significative: YOLOX, un rilevatore ad alte prestazioni senza ancoraggio rilasciato nel 2021, e YOLO11, un modello versatile e robusto di Ultralytics per le moderne applicazioni aziendali. Sebbene entrambi i modelli condividano la YOLO , divergono in modo significativo nella loro filosofia architettonica, nel supporto dell'ecosistema e nella facilità d'uso.
Confronto delle metriche di performance
Quando si valutano i rilevatori di oggetti, metriche chiave come la precisione media (mAP) e la velocità di inferenza sono fondamentali. La tabella sottostante evidenzia come la nuova architettura di YOLO11 un'efficienza superiore, in particolare in termini di compromesso tra velocità e precisione.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | parametri (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOX: un'evoluzione senza ancore
YOLOX è stato introdotto da Megvii nel 2021 come versione senza anchor della YOLO . Il suo obiettivo era colmare il divario tra ricerca accademica e applicazione industriale semplificando la testa di rilevamento ed eliminando la necessità di anchor box predefiniti.
Caratteristiche principali:
- Design senza ancoraggio: elimina il complesso processo di raggruppamento delle scatole di ancoraggio, semplificando il percorso di formazione.
- Testa disaccoppiata: separa le attività di classificazione e regressione in rami diversi, migliorando la velocità di convergenza e la precisione.
- SimOTA: una strategia avanzata di assegnazione delle etichette che assegna dinamicamente campioni positivi, migliorando la stabilità dell'addestramento.
Sebbene YOLOX abbia rappresentato un significativo passo avanti nel 2021, la sua implementazione richiede spesso una configurazione più complessa e non offre il supporto unificato e multitasking presente nei framework più recenti.
Dettagli YOLOX:
- Autori: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun
- Organizzazione:Megvii
- Data: 2021-07-18
- Arxiv:https://arxiv.org/abs/2107.08430
- GitHub:https://github.com/Megvii-BaseDetection/YOLOX
YOLO11: Versatilità e potenza dell'ecosistema
YOLO11, rilasciato da Ultralytics, si basa sul successo dei suoi predecessori per offrire un modello che non solo è accurato, ma anche incredibilmente facile da usare e implementare. È progettato come soluzione completa per un'ampia gamma di attività di visione artificiale.
Punti di forza principali:
- Facilità d'uso: Ultralytics è rinomata per la sua semplicità. Il caricamento, l'addestramento e la previsione possono essere eseguiti con poche righe di codice, riducendo significativamente le barriere all'ingresso per gli sviluppatori.
- Ecosistema ben mantenuto: YOLO11 supportato da una manutenzione attiva, aggiornamenti frequenti e una comunità vivace. Ciò garantisce la compatibilità con le ultime versioni di PyTorch e una rapida correzione dei bug.
- Versatilità: a differenza di YOLOX, che è principalmente un rilevatore di oggetti, YOLO11 supporta YOLO11 più attività, tra cui la segmentazione delle istanze, la stima della posa, la classificazione e il rilevamento dei riquadri di delimitazione orientati (OBB).
- Efficienza dell'addestramento: YOLO11 ottimizzato per un uso efficiente delle risorse e spesso richiede meno memoria durante l'addestramento rispetto alle alternative basate su trasformatori come RT-DETR.
YOLO11 :
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione:Ultralytics
- Data: 2024-09-27
- Documenti:https://docs.ultralytics.com/models/yolo11/
Lo sapevi?
Per le prestazioni edge più all'avanguardia, dai un'occhiata a YOLO26. Lanciato nel gennaio 2026, presenta un design nativo end-to-end NMS, ottimizzatore MuSGD e CPU fino al 43% più veloce, rendendolo la scelta ideale per l'edge AI.
Confronto Architetturale
Le differenze architetturali tra YOLOX e YOLO11 l'evoluzione delle strategie di rilevamento degli oggetti nel tempo.
Architettura YOLOX
YOLOX utilizza una struttura CSPDarknet simile a YOLOv5 introduce una struttura decoupled head. Nei YOLO tradizionali, la classificazione e la localizzazione venivano eseguite in modo accoppiato. YOLOX le divide in due rami separati, il che aiuta a risolvere il conflitto tra la sicurezza della classificazione e l'accuratezza della localizzazione. Il suo meccanismo senza ancoraggio tratta il rilevamento degli oggetti come un problema di regressione puntuale, il che semplifica la progettazione del modello ma a volte può avere difficoltà con scenari di oggetti estremamente densi rispetto agli approcci basati su ancoraggi.
Architettura YOLO11
YOLO11 un'architettura backbone e neck perfezionata che migliora le capacità di estrazione delle caratteristiche su diverse scale. Integra moduli avanzati per una migliore attenzione spaziale e fusione delle caratteristiche. Un vantaggio fondamentale Ultralytics è la perfetta integrazione dell'esportabilità. L'architettura è progettata da zero per essere facilmente esportabile in formati come ONNX, TensorRTe OpenVINO, garantendo che l'elevata precisione osservata durante l'addestramento si traduca direttamente in un'inferenza efficiente sui dispositivi edge.
Casi d'uso ideali
La scelta tra questi modelli dipende spesso dai requisiti specifici del vostro progetto.
Quando scegliere YOLOX
- Linee guida per la ricerca: YOLOX è un eccellente punto di riferimento per la ricerca accademica incentrata sui metodi di rilevamento senza ancoraggio o sulla modifica delle teste disaccoppiate.
- Sistemi legacy: se disponete già di una pipeline basata sul codice Megvii o avete bisogno specifico della strategia di assegnazione SimOTA per un set di dati di nicchia.
Quando scegliere YOLO11
- Sviluppo rapido: se avete bisogno di passare rapidamente dal set di dati al modello implementato, la Ultralytics semplificata e Python rendono YOLO11 scelta migliore.
- Requisiti multi-task: i progetti che potrebbero espandersi dal semplice rilevamento alla segmentazione o al tracciamento traggono vantaggio dal framework unificato YOLO11.
- Implementazione della produzione: per applicazioni commerciali nel settore della vendita al dettaglio, delle smart city o della sicurezza, il solido supporto all'esportazione e l'affidabilità testata dalla comunità di YOLO11 i rischi di implementazione.
- Edge Computing: grazie alle varianti ottimizzate, YOLO11 prestazioni eccezionali su dispositivi con risorse limitate come Raspberry Pi o NVIDIA .
Confronto del Codice: Facilità d'Uso
La differenza in termini di usabilità è evidente quando si confrontano i flussi di lavoro di formazione.
Formazione con Ultralytics YOLO11: Ultralytics elimina la complessità, consentendoti di concentrarti sui tuoi dati.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
Formazione con YOLOX: YOLOX richiede in genere la clonazione del repository, la configurazione di un ambiente specifico e l'esecuzione della formazione tramite script da riga di comando con numerosi argomenti, il che può risultare meno intuitivo per i flussi di lavoro Python.
Conclusione
Sia YOLOX che YOLO11 modelli efficaci che hanno contribuito in modo significativo al campo della visione artificiale. YOLOX ha sfidato il predominio dei metodi basati su anchor e ha introdotto concetti importanti come i decoupled heads. Tuttavia, per la maggior parte degli sviluppatori e delle aziende odierne, YOLO11 offre un pacchetto più interessante. La sua combinazione di prestazioni elevate, versatilità e un ecosistema senza pari lo rende la scelta pragmatica per la creazione di soluzioni di IA nel mondo reale.
Per coloro che desiderano spingersi oltre i limiti, in particolare per le implementazioni edge, consigliamo vivamente di esplorare YOLO26. Con il suo design end-to-end NMS e l'eliminazione della perdita focale di distribuzione (DFL), YOLO26 rappresenta il prossimo salto in avanti in termini di efficienza e velocità.
Altri modelli da esplorare
- YOLO26: l'ultimo modello all'avanguardia di Ultralytics gennaio 2026), caratterizzato da inferenza NMS e funzioni di perdita specializzate.
- YOLOv8: un classico ampiamente adottato nella YOLO , noto per il suo equilibrio tra velocità e precisione.
- RT-DETR: un rilevatore basato su trasformatore che offre un'elevata precisione, ideale per scenari in cui la velocità in tempo reale è meno critica rispetto alla precisione.
- SAM : Meta's Segment Anything Model, perfetto per attività di segmentazione zero-shot.