Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 vs YOLO26#

Il panorama della computer vision ha assistito a notevoli progressi negli ultimi anni, passando da architetture complesse e pesantemente basate sul post-processing a modelli semplificati end-to-end. Questo confronto tecnico approfondisce due pietre miliari di questo percorso: la svolta accademica di YOLOv10 e l'avanguardistico YOLO26, pronto per l'ambito aziendale. Esaminando le loro architetture, le metodologie di addestramento e le capacità di deployment nel mondo reale, gli sviluppatori possono prendere decisioni informate quando creano la loro prossima applicazione di vision AI.

Link to this sectionYOLOv10: Pionieristico nel rilevamento oggetti end-to-end#

Autori: Ao Wang, Hui Chen, Lihao Liu, et al. Organizzazione: Tsinghua University Data: 23-05-2024 Link: Documento arXiv | Repository GitHub

Rilasciato a metà 2024, YOLOv10 ha rappresentato un significativo salto in avanti nella ricerca accademica sulla computer vision, affrontando uno dei colli di bottiglia più persistenti nel rilevamento oggetti in tempo reale: la Non-Maximum Suppression (NMS). I rilevatori di oggetti tradizionali facevano molto affidamento sulla NMS per filtrare i bounding box ridondanti, aggiungendo una latenza variabile durante l'inferenza e complicando il deployment sull'edge.

Il team della Tsinghua University ha introdotto una strategia di assegnazione duale coerente per l'addestramento senza NMS. Ciò ha permesso al modello di prevedere i bounding box con precisione senza richiedere una fase di filtraggio in post-processing, migliorando direttamente la latenza di inferenza e abbassando la barriera per il deployment su acceleratori hardware. Sebbene altamente efficiente per le attività di rilevamento standard, il modello si è concentrato principalmente sulla previsione dei bounding box e mancava di supporto nativo per attività più complesse come la segmentazione di istanze o la stima della posa.

Scopri di più su YOLOv10

Link to this sectionYOLO26: Il nuovo standard per la vision AI su cloud ed edge#

Autori: Glenn Jocher e Jing Qiu Organizzazione: Ultralytics Data: 14-01-2026 Link: Repository GitHub | Piattaforma Ultralytics

Basandosi sui concetti privi di NMS introdotti in precedenza, il neonato YOLO26 rappresenta l'apice delle prestazioni e della versatilità. Progettato sia per la ricerca accademica che per il deployment di livello aziendale, incorpora nativamente un design end-to-end senza NMS, eliminando completamente il post-processing NMS per un deployment più veloce e semplice su tutto l'hardware supportato.

YOLO26 introduce diversi miglioramenti architettonici rivoluzionari. La rimozione della Distribution Focal Loss (DFL) semplifica notevolmente il processo di esportazione del modello e migliora la compatibilità con i dispositivi edge a basso consumo. Insieme a questi cambiamenti strutturali, YOLO26 ottiene un'inferenza CPU fino al 43% più veloce, rendendolo una scelta eccezionale per le applicazioni IoT e di robotica dove l'accelerazione GPU potrebbe non essere disponibile.

Inoltre, la stabilità dell'addestramento e la velocità di convergenza sono state rivoluzionate grazie all'uso dell'ottimizzatore MuSGD, un ibrido tra SGD e Muon ispirato alle tecniche di addestramento LLM. Combinato con funzioni di loss avanzate come ProgLoss + STAL, YOLO26 vanta notevoli miglioramenti nel riconoscimento di piccoli oggetti. Introduce anche miglioramenti specifici per attività, tra cui il prototyping multi-scala per la segmentazione, la Residual Log-Likelihood Estimation (RLE) per la stima della posa e una loss angolare specializzata per risolvere problemi di confine nel rilevamento di Oriented Bounding Box (OBB).

Scopri di più su YOLO26

Deployment aziendale

Per i team che desiderano scalare i propri flussi di lavoro di computer vision, la Piattaforma Ultralytics fornisce un'integrazione perfetta con YOLO26, offrendo un'annotazione dati intuitiva, addestramento cloud automatizzato e opzioni di deployment con un solo clic senza richiedere un'infrastruttura MLOps estesa.

Link to this sectionConfronto delle prestazioni tecniche#

Nel valutare questi modelli, l'equilibrio tra accuratezza, dimensione del modello e velocità di inferenza è fondamentale. La tabella sottostante evidenzia le prestazioni di entrambe le famiglie di modelli su varie scale, valutate sul dataset COCO standard.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

I dati dimostrano chiaramente il vantaggio evolutivo della nuova architettura. YOLO26 raggiunge un mAP (mean Average Precision) più elevato in tutti i livelli di dimensione, mantenendo velocità di inferenza altamente competitive. La rimozione della DFL in YOLO26 contribuisce specificamente alle sue eccezionali prestazioni CPU ONNX, una metrica in cui le generazioni precedenti spesso faticavano.

Link to this sectionMetodologie di Addestramento ed Ecosistema#

Un modello è utile tanto quanto l'ecosistema che lo supporta. Mentre YOLOv10 ha fornito un'eccellente implementazione accademica basata su PyTorch, spesso richiede una configurazione manuale per attività che vanno oltre il rilevamento di base.

Al contrario, YOLO26 è completamente integrato nel ben mantenuto ecosistema Ultralytics. Ciò garantisce requisiti di memoria significativamente inferiori durante l'addestramento rispetto ai modelli basati su Transformer come RT-DETR, consentendo ai ricercatori di addestrare reti allo stato dell'arte su hardware di livello consumer. La facilità d'uso non ha eguali, offrendo un'API unificata che gestisce automaticamente l'aumento dei dati, il tuning degli iperparametri e il logging.

Link to this sectionEsempio di codice: Addestramento di YOLO26#

L'addestramento di un modello versatile e altamente accurato richiede solo poche righe di codice Python:

from ultralytics import YOLO

# Load the highly optimized YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with automatic memory management
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
)

# Export natively to TensorRT without NMS complexities
model.export(format="engine")

Link to this sectionApplicazioni reali e casi d'uso#

La scelta dell'architettura giusta dipende interamente dai vincoli di deployment.

Link to this sectionEdge Computing ad alta velocità#

Per le applicazioni che richiedono un rapido deployment su microcontrollori, robotica o dispositivi mobili legacy, l'inferenza CPU di YOLO26, più veloce del 43%, lo rende la scelta definitiva. La sua architettura priva di NMS e DFL si converte perfettamente in formati come OpenVINO e TensorRT, ideali per l'analisi video in tempo reale nelle infrastrutture di smart city.

Link to this sectionVisione multi-attività avanzata#

Sebbene YOLOv10 eccella nel rilevamento puro dei bounding box, i progetti che richiedono una ricca comprensione visiva devono fare affidamento su YOLO26. Dalla segmentazione di istanze nell'imaging medico alla stima della posa di precisione per l'analisi sportiva, YOLO26 fornisce funzioni di loss specifiche per attività che garantiscono un'accuratezza superiore in diversi domini.

Opzioni alternative

Se il tuo progetto richiede un rilevamento robusto a vocabolario aperto, prendi in considerazione l'esplorazione di YOLO-World. Per gli utenti che gestiscono pipeline legacy, YOLO11 rimane un'alternativa potente e completamente supportata all'interno del framework Ultralytics.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOv10 e YOLO26 dipende dai requisiti specifici del tuo progetto, dai vincoli di deployment e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv10#

YOLOv10 è un'ottima scelta per:

  • Rilevamento in tempo reale senza NMS: Applicazioni che traggono vantaggio dal rilevamento end-to-end senza Non-Maximum Suppression, riducendo la complessità di distribuzione.
  • Compromessi bilanciati tra velocità e precisione: Progetti che richiedono un ottimo equilibrio tra velocità di inferenza e precisione di rilevamento su diverse scale di modello.
  • Applicazioni a latenza costante: Scenari di distribuzione in cui tempi di inferenza prevedibili sono fondamentali, come nella robotica o nei sistemi autonomi.

Link to this sectionQuando scegliere YOLO26#

YOLO26 è raccomandato per:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionConclusione#

Il passaggio da YOLOv10 a YOLO26 evidenzia un cambiamento cruciale dal proof-of-concept accademico alle soluzioni aziendali pronte per la produzione. Adottando il pionieristico design senza NMS e migliorandolo con l'ottimizzatore MuSGD, ProgLoss e una compatibilità edge semplificata, YOLO26 stabilisce un nuovo standard per ciò che è possibile fare nella computer vision in tempo reale. Per gli sviluppatori che mirano a raggiungere il miglior equilibrio tra velocità, accuratezza e usabilità, YOLO26 si distingue come la raccomandazione definitiva.

Collaboratori

Commenti