Link to this sectionYOLO26 vs YOLOv9: la prossima evoluzione nel rilevamento oggetti in tempo reale#
Il panorama della computer vision avanza rapidamente, con nuove architetture che spingono continuamente i limiti di velocità e precisione. In questo confronto tecnico, esaminiamo le differenze tra YOLO26 e YOLOv9, due modelli molto influenti nel campo del rilevamento oggetti in tempo reale. Sebbene entrambi i modelli offrano innovazioni architettoniche distinte, comprendere i compromessi in termini di prestazioni, capacità di distribuzione e requisiti hardware è fondamentale per scegliere lo strumento giusto per il tuo prossimo progetto di visione.
Link to this sectionYOLO26: il colosso ottimizzato per l'edge#
Rilasciato all'inizio del 2026, Ultralytics YOLO26 rappresenta un salto generazionale nell'efficienza di distribuzione e nella stabilità dell'addestramento dei modelli. Progettato per essere un framework nativamente end-to-end, risolve direttamente i colli di bottiglia di distribuzione che storicamente hanno afflitto le applicazioni edge AI.
Dettagli del modello:
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione: Ultralytics
- Data: 2026-01-14
- GitHub: Repository Ultralytics
- Documentazione: Documentazione YOLO26
Link to this sectionArchitettura e innovazioni#
YOLO26 riprogetta fondamentalmente la pipeline di post-elaborazione introducendo un design End-to-End NMS-Free. Eliminando la necessità di Non-Maximum Suppression (NMS), il modello raggiunge una variabilità della latenza drasticamente inferiore. Ciò rende la distribuzione su piattaforme mobili ed edge significativamente più semplice, specialmente quando si esporta verso framework come ONNX e Apple CoreML.
Inoltre, la rimozione della Distribution Focal Loss (DFL) snellisce il processo di esportazione e aumenta la compatibilità con microcontrollori a basso consumo. Per migliorare la stabilità dell'addestramento, YOLO26 integra il nuovo MuSGD Optimizer, un ibrido tra Stochastic Gradient Descent (SGD) e Muon (ispirato alle innovazioni nell'addestramento di Large Language Model). Ciò si traduce in una convergenza più rapida e in un'estrazione di caratteristiche più robusta su dataset complessi.
Grazie alle semplificazioni architettoniche e alla rimozione della DFL, YOLO26 raggiunge un'inferenza su CPU fino al 43% più veloce, rendendolo la scelta ideale per dispositivi edge con risorse limitate come il Raspberry Pi o NVIDIA Jetson Nano.
Per il rilevamento di oggetti molto impegnativi in scene come immagini aeree da droni, YOLO26 utilizza le funzioni di perdita aggiornate ProgLoss + STAL. Queste forniscono notevoli miglioramenti nel richiamo del riconoscimento di piccoli oggetti. Inoltre, vanta miglioramenti specifici per attività, inclusi multi-scale proto per instance segmentation, Residual Log-Likelihood Estimation (RLE) per pose estimation e una loss angolare specializzata per il rilevamento di Oriented Bounding Boxes (OBB).
Link to this sectionYOLOv9: Programmable Gradient Information#
Introdotto all'inizio del 2024, YOLOv9 ha apportato progressi teorici al modo in cui le reti neurali gestiscono il flusso di gradiente durante la fase di addestramento, concentrandosi sull'efficienza dei parametri e sulla conservazione delle caratteristiche profonde.
Dettagli del modello:
- Autori: Chien-Yao Wang e Hong-Yuan Mark Liao
- Organizzazione: Institute of Information Science, Academia Sinica, Taiwan
- Data: 2024-02-21
- Arxiv: Documento YOLOv9
- GitHub: Repository YOLOv9
- Documentazione: Documentazione YOLOv9
Link to this sectionArchitettura e punti di forza#
YOLOv9 è costruito attorno al concetto di Programmable Gradient Information (PGI) e alla Generalized Efficient Layer Aggregation Network (GELAN). Questi concetti affrontano il problema del collo di bottiglia informativo spesso osservato nelle reti neurali profonde. Preservando le informazioni essenziali attraverso il processo feed-forward, GELAN garantisce che i gradienti utilizzati per gli aggiornamenti dei pesi rimangano affidabili. Questa architettura offre un'elevata precisione e rende YOLOv9 un forte candidato per la ricerca accademica nella teoria delle reti neurali e nell'ottimizzazione del percorso del gradiente utilizzando il framework PyTorch.
Link to this sectionLimitazioni#
Nonostante la sua eccellente efficienza dei parametri, YOLOv9 si affida pesantemente alla NMS tradizionale per la post-elaborazione delle bounding box, il che può creare colli di bottiglia computazionali durante l'inferenza su dispositivi edge. Inoltre, il repository ufficiale si concentra principalmente sul rilevamento di oggetti, richiedendo una significativa ingegneria personalizzata per adattarlo ad attività specializzate come il tracking o la stima della posa.
Link to this sectionConfronto delle Prestazioni#
Quando valuti questi modelli per la distribuzione nel mondo reale, bilanciare precisione (mAP), velocità di inferenza e utilizzo della memoria è fondamentale. I modelli Ultralytics sono rinomati per i loro bassi requisiti di memoria sia durante l'addestramento che durante l'inferenza, richiedendo molta meno memoria CUDA rispetto alle alternative basate su Transformer come RT-DETR.
Di seguito un confronto diretto delle prestazioni di YOLO26 e YOLOv9 sul dataset COCO. I valori migliori in ogni colonna sono evidenziati in grassetto.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Nota: le velocità della CPU per YOLOv9 sono omesse poiché variano notevolmente in base alla configurazione NMS e sono generalmente più lente rispetto all'implementazione nativa senza NMS di YOLO26.
Link to this sectionCasi d'uso e raccomandazioni#
La scelta tra YOLO26 e YOLOv9 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.
Link to this sectionQuando scegliere YOLO26#
YOLO26 è una scelta valida per:
- Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
- Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
- Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.
Link to this sectionQuando scegliere YOLOv9#
YOLOv9 è consigliato per:
- Ricerca sul collo di bottiglia dell'informazione: Progetti accademici che studiano le architetture Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
- Studi sull'ottimizzazione del flusso di gradienti: Ricerca focalizzata sulla comprensione e sulla mitigazione della perdita di informazioni negli strati profondi della rete durante l'addestramento.
- Benchmarking del rilevamento ad alta precisione: Scenari in cui le forti prestazioni del benchmark COCO di YOLOv9 sono necessarie come punto di riferimento per i confronti architettonici.
Link to this sectionIl vantaggio di Ultralytics#
Scegliere un modello implica molto più che leggere un benchmark di precisione; l'ecosistema software circostante determina quanto velocemente puoi passare dalla raccolta dei dati alla produzione.
Link to this sectionFacilità d'uso ed ecosistema#
L'API Python di Ultralytics offre un'esperienza "zero-to-hero" senza interruzioni. Invece di clonare repository complessi o configurare manualmente script di addestramento distribuiti, gli sviluppatori possono installare il pacchetto tramite pip e iniziare subito l'addestramento. L'ecosistema Ultralytics, attivamente mantenuto, garantisce aggiornamenti frequenti, integrazioni automatizzate con piattaforme ML come Weights & Biases e una documentazione estesa.
Link to this sectionVersatilità tra le attività di visione#
Mentre YOLOv9 è principalmente un motore di rilevamento, YOLO26 è uno strumento di visione per scopi generali. Utilizzando una sintassi unificata, puoi facilmente passare dal rilevamento oggetti alla segmentazione delle immagini con precisione pixel o alla classificazione dell'intera immagine. Questa versatilità riduce il debito tecnico derivante dal mantenere più basi di codice disgiunte per diverse funzionalità di computer vision.
Link to this sectionAddestramento e distribuzione efficienti#
L'efficienza dell'addestramento è una pietra miliare della filosofia Ultralytics. YOLO26 utilizza pesi pre-addestrati facilmente disponibili e vanta un utilizzo della memoria significativamente inferiore rispetto ai pesanti vision transformer. Una volta addestrati, le pipeline di esportazione integrate consentono conversioni con un clic in formati ottimizzati come TensorRT o TensorFlow Lite, agevolando il percorso verso la produzione.
Link to this sectionEsempio di codice: iniziare con YOLO26#
Implementare YOLO26 è estremamente semplice. Il seguente snippet Python mostra come caricare un modello pre-addestrato, addestrarlo su dati personalizzati ed eseguire l'inferenza utilizzando l'API Ultralytics.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()Sfruttando la velocità, l'architettura semplificata e il robusto ecosistema di YOLO26, i team possono portare applicazioni AI di visione avanzata sul mercato più velocemente e con meno ostacoli tecnici che mai.