Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLO26#

L'evoluzione della computer vision è stata definita dalla continua spinta verso modelli più veloci, più accurati e più accessibili. Quando confrontiamo Ultralytics YOLOv5 con l'avanguardistico Ultralytics YOLO26, osserviamo un cambio di paradigma che colma il divario tra i robusti sistemi legacy e la frontiera della moderna distribuzione dell'IA.

Questa guida fornisce un'analisi tecnica completa di entrambe le architetture, evidenziandone le metriche di prestazioni, le differenze strutturali e gli scenari di distribuzione ideali.

Link to this sectionPanoramica dei modelli#

Link to this sectionYOLOv5: Il cavallo di battaglia del settore#

Rilasciato nel 2020, YOLOv5 ha rivoluzionato l'accessibilità del rilevamento di oggetti. Migrando l'architettura nativamente nel framework PyTorch, ha offerto agli sviluppatori un'esperienza "da zero a eroe" senza precedenti.

YOLOv5 ha gettato le basi per l'ecosistema Ultralytics, altamente manutenuto. Ha introdotto tecniche di data augmentation aggressive, cicli di addestramento efficienti e percorsi di esportazione altamente ottimizzati verso formati per edge come CoreML e ONNX. La sua facilità d'uso e i bassi requisiti di memoria durante l'addestramento lo hanno reso un punto fermo per startup e ricercatori in tutto il mondo.

Scopri di più su YOLOv5

Link to this sectionYOLO26: Lo standard Vision AI di prossima generazione#

Facendo un salto in avanti fino a gennaio 2026, Ultralytics YOLO26 rappresenta l'apice della vision AI in tempo reale. Integra nativamente le lezioni apprese dalle generazioni intermedie come YOLOv8 e YOLO11, introducendo al contempo enormi innovazioni ispirate all'addestramento dei Large Language Model (LLM).

YOLO26 stabilisce un nuovo punto di riferimento per l'equilibrio delle prestazioni, offrendo un'accuratezza all'avanguardia ed essendo progettato esplicitamente per dominare gli scenari di edge computing.

Scopri di più su YOLO26

Altri modelli Ultralytics

Se stai migrando una codebase più vecchia, potresti anche essere interessato a confrontare YOLOv5 con YOLO11, il modello della generazione precedente che ha introdotto il supporto iniziale per attività diverse come la stima della posa e i bounding box orientati (OBB).

Link to this sectionInnovazioni architetturali in YOLO26#

Mentre YOLOv5 si basa su head di rilevamento basate su anchor e funzioni di perdita standard, YOLO26 revisiona completamente i meccanismi interni per eliminare i colli di bottiglia nella distribuzione.

  1. Design end-to-end senza NMS: La differenza più significativa è l'architettura nativamente end-to-end di YOLO26. A differenza di YOLOv5, che richiede una Non-Maximum Suppression (NMS) manuale per filtrare i bounding box ridondanti, YOLO26 elimina completamente questo passaggio di post-elaborazione. Ciò garantisce una latenza di inferenza deterministica e semplifica drasticamente l'integrazione in C++ o in hardware embedded.
  2. Rimozione della DFL: YOLO26 rimuove la Distribution Focal Loss (DFL). Questa scelta architetturale semplifica drasticamente l'esportazione del modello e migliora la compatibilità con dispositivi edge a basso consumo e microcontrollori che spesso hanno difficoltà con operatori complessi.
  3. Ottimizzatore MuSGD: Prendendo spunto dal Kimi K2 di Moonshot AI, YOLO26 utilizza l'ottimizzatore MuSGD, un ibrido tra SGD e Muon. Ciò porta la stabilità e la rapida convergenza osservate nell'addestramento LLM alla computer vision, con un conseguente minor utilizzo di memoria e cicli di addestramento più rapidi rispetto ai modelli pesanti basati su Transformer.
  4. ProgLoss + STAL: YOLO26 utilizza funzioni ProgLoss e STAL sofisticate, migliorando notevolmente la sua capacità di rilevare oggetti piccoli e densi, una sfida storica per YOLOv5.

Link to this sectionConfronto delle Prestazioni#

Quando si confrontano i modelli sul dataset COCO, YOLO26 mostra enormi miglioramenti nella precisione (mAP) riducendo contemporaneamente il numero di parametri e le velocità di inferenza su CPU.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Nota: Il YOLO26 Nano (YOLO26n) raggiunge uno sbalorditivo mAP di 40.9 rispetto al mAP di 28.0 di YOLOv5n, offrendo al contempo un'inferenza su CPU fino al 43% più veloce grazie alla rimozione della DFL e all'head senza NMS.

Link to this sectionVersatilità e supporto dei task#

YOLOv5 è rinomato principalmente per il rilevamento di oggetti. Sebbene gli aggiornamenti successivi abbiano introdotto una segmentazione di base, YOLO26 è stato costruito da zero per essere un motore multi-task unificato.

YOLO26 supporta nativamente:

  • Segmentazione di istanze: Caratterizzata da protos multi-scala specifici per le attività e perdita di segmentazione semantica.
  • Stima della posa: Utilizzo della Residual Log-Likelihood Estimation (RLE) per il rilevamento di keypoint altamente accurato.
  • Bounding Box orientati (OBB): Include una perdita angolare specializzata per risolvere i problemi di discontinuità dei bordi, fondamentale per l'analisi delle immagini satellitari.
  • Classificazione di immagini: Categorizzazione standard dell'intera immagine.
Integrazione dell'ecosistema

Entrambi i modelli beneficiano della piattaforma Ultralytics, fornendo un'annotazione dei dati senza interruzioni, ottimizzazione automatica degli iperparametri e distribuzione cloud con un clic. Tuttavia, YOLO26 sfrutta appieno le moderne strutture API.

Link to this sectionUtilizzo ed esempi di codice#

L'API Python di Ultralytics rende incredibilmente semplice passare da un modello all'altro. Poiché entrambi i modelli condividono lo stesso ecosistema ben manutenuto, aggiornare una pipeline YOLOv5 legacy a YOLO26 richiede solo la modifica del file dei pesi.

Link to this sectionEsempio Python#

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this sectionEsempio CLI#

Puoi distribuire YOLO26 direttamente tramite la riga di comando utilizzando l'integrazione TensorRT per il massimo throughput della GPU:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Link to this sectionCasi d'uso ideali#

Link to this sectionQuando scegliere YOLO26#

Per qualsiasi progetto moderno di computer vision, YOLO26 è la raccomandazione indiscussa.

  • Edge AI e IoT: La sua inferenza su CPU più veloce del 43% e la rimozione della DFL lo rendono perfetto per la distribuzione su un Raspberry Pi o dispositivi mobili.
  • Pipeline ad alta velocità: L'architettura senza NMS garantisce una latenza stabile e prevedibile, fondamentale per la robotica autonoma e i sistemi di allarme di sicurezza in tempo reale.
  • Scenari complessi: Se la tua applicazione richiede il tracciamento di piccoli oggetti (es. monitoraggio tramite droni) o oggetti rotanti (OBB), le funzioni di perdita avanzate di YOLO26 (ProgLoss + STAL) offrono un enorme vantaggio in termini di accuratezza.

Link to this sectionQuando scegliere YOLOv5#

  • Sistemi legacy: Se il tuo ambiente di produzione ha dipendenze hardcoded sulla generazione specifica di anchor o sulla logica di parsing NMS di YOLOv5, la migrazione potrebbe richiedere un breve periodo di refactoring.
  • Baseline accademiche specifiche: I ricercatori usano spesso YOLOv5 come baseline classica per dimostrare la progressione storica delle architetture di rilevamento oggetti.

Il passaggio da YOLOv5 a YOLO26 non è solo un aggiornamento iterativo; è un salto fondamentale nel modo in cui i modelli di rilevamento oggetti vengono addestrati e distribuiti. Sfruttando l'ottimizzatore MuSGD, eliminando la complessa post-elaborazione tramite un design senza NMS e accelerando enormemente le velocità della CPU, Ultralytics YOLO26 offre un equilibrio senza compromessi tra velocità e precisione.

Mentre YOLOv5 sarà sempre ricordato come il modello che ha democratizzato la vision AI, gli sviluppatori che cercano di costruire applicazioni robuste, pronte per la produzione e a prova di futuro dovrebbero costruire con fiducia su YOLO26.

Contributori

Commenti