Vai al contenuto

YOLOv9 . YOLO26: Evoluzione del rilevamento di oggetti in tempo reale

Nel campo in rapida evoluzione della visione artificiale, la scelta dell'architettura del modello più adeguata è fondamentale per bilanciare prestazioni, efficienza e facilità di implementazione. Questo confronto esplora le differenze tecniche tra YOLOv9, un potente modello introdotto all'inizio del 2024, e YOLO26, l'ultima versione all'avanguardia di Ultralytics nel gennaio 2026. Sebbene entrambi i modelli rappresentino pietre miliari significative nella YOLO , essi soddisfano esigenze diverse in termini di velocità, stabilità di addestramento e complessità di implementazione.

Panoramica del modello e paternità

Comprendere la genealogia di queste architetture fornisce il contesto per le loro filosofie di progettazione.

YOLOv9: Informazioni di gradiente programmabili

Autori: Chien-Yao Wang, Hong-Yuan Mark Liao
Organizzazione:Istituto di Scienze dell'Informazione, Academia Sinica
Data: 21/02/2024
Link:Articolo Arxiv | Repository GitHub

YOLOv9 il concetto di Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN). Queste innovazioni hanno risolto il problema del "colli di bottiglia informativi" nelle reti neurali profonde, dove i dati vengono persi mentre passano attraverso livelli successivi. PGI garantisce che le informazioni critiche sulle caratteristiche vengano conservate in tutta la rete profonda, consentendo rilevamenti altamente accurati, in particolare in scene complesse.

YOLO26: Lo specialista end-to-end dell'edge computing

Autori: Glenn Jocher, Jing Qiu
Organizzazione:Ultralytics
Data: 14/01/2026
Link:Documentazione ufficiale | Repository GitHub

Basandosi sull'eredità di YOLOv8 e YOLO11, YOLO26 rappresenta un cambiamento verso un'implementazione semplificata e ad alta velocità. È nativamente end-to-end NMS, eliminando la necessità di post-elaborazione Non-Maximum Suppression. Questa scelta di progettazione, combinata con la rimozione della Distribution Focal Loss (DFL), rende YOLO26 eccezionalmente veloce su CPU dispositivi edge. È anche pioniere nell'uso dell'ottimizzatore MuSGD, un ibrido di SGD Muon (ispirato all'addestramento LLM), per garantire una convergenza stabile.

Scopri di più su YOLO26

Confronto tra prestazioni e metriche

La tabella seguente mette a confronto le prestazioni dei modelli standard sul set di dati COCO . Da notare il significativo vantaggio in termini di velocità di YOLO26 CPU , risultato dell'ottimizzazione della sua architettura.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Analisi delle prestazioni

YOLO26 dimostra un chiaro vantaggio in termini di latenza ed efficienza di calcolo. Ad esempio, YOLO26n raggiunge un mAP più elevato mAP 40,9%) rispetto a YOLOv9t (38,3%) utilizzando un numero significativamente inferiore di FLOP (5,4 miliardi contro 7,7 miliardi). Questa efficienza è fondamentale per le applicazioni in esecuzione su dispositivi edge alimentati a batteria.

Analisi Approfondita dell'Architettura

Architettura YOLOv9

YOLOv9 sul mantenimento del flusso di informazioni. La sua struttura GELAN combina i punti di forza di CSPNet (pianificazione del percorso del gradiente) ed ELAN (velocità di inferenza) per creare un estrattore di caratteristiche leggero ma potente. Il ramo ausiliario PGI fornisce informazioni affidabili sul gradiente durante l'addestramento ai livelli più profondi, che vengono poi rimosse durante l'inferenza per mantenere il modello leggero.

  • Pro: Precisione eccezionale su benchmark difficili; eccellente conservazione delle informazioni per scene complesse.
  • Contro: Richiede NMS ; l'architettura può essere complessa da modificare per attività non standard; carico computazionale più pesante per un throughput equivalente rispetto alle generazioni più recenti.

Architettura YOLO26

YOLO26 dà priorità alla velocità di inferenza e alla semplicità di implementazione.

  1. ProgettazioneNMS: addestrando il modello a prevedere corrispondenze uno a uno in modo nativo, YOLO26 elimina la NMS euristica NMS . Ciò riduce la variabilità della latenza e semplifica TensorRT , poiché NMS efficienti non sono più una dipendenza.
  2. MuSGD Optimizer: ispirato al Kimi K2 di Moonshot AI, questo ottimizzatore combina lo slancio SGD le proprietà adattive dell'ottimizzatore Muon. Ciò garantisce la stabilità dell'addestramento dei modelli linguistici di grandi dimensioni (LLM) nella visione artificiale.
  3. ProgLoss + STAL: l'introduzione della perdita progressiva (Progressive Loss) e della perdita di assegnazione di obiettivi morbidi (Soft-Target Assignment Loss, STAL) migliora significativamente il rilevamento di oggetti di piccole dimensioni, un punto debole comune nei rilevatori senza ancoraggio.

Formazione ed ecosistema

L'esperienza degli sviluppatori differisce in modo significativo tra i due modelli, principalmente a causa degli ecosistemi software in cui operano.

Facilità d'uso con Ultralytics

Mentre YOLOv9 stato integrato nel Ultralytics , YOLO26 è un componente nativo. Ciò garantisce il supporto immediato di tutte le funzionalità, tra cui:

  • API unificata: Passa da un'attività all'altra come Stima della posa oppure Oriented Bounding Boxes (OBB) semplicemente modificando il file del peso del modello (ad esempio, yolo26n-pose.pt).
  • Ultralytics : carica facilmente i set di dati, aggiungi annotazioni con gli assistenti AI e fai formazione nel cloud usando la Ultralytics .
  • Flessibilità di esportazione: supporto nativo per l'esportazione con un solo clic in formati come CoreML per iOS, TFLite Android e OpenVINO Intel .
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")

Memoria ed efficienza delle risorse

YOLO26 richiede in genere meno GPU durante l'addestramento rispetto all'architettura a doppio ramo (PGI) YOLOv9. Ciò consente ai ricercatori di utilizzare batch di dimensioni maggiori su hardware di livello consumer come NVIDIA 3060 o 4090, accelerando il ciclo di sperimentazione.

Casi d'uso reali

Quando scegliere YOLOv9

YOLOv9 un forte concorrente per gli scenari in cui la massima precisione sui benchmark statici è l'unica priorità e le risorse computazionali sono abbondanti.

  • Ricerca accademica: studio della teoria dei colli di bottiglia informativi e del flusso gradiente nelle CNN.
  • Elaborazione lato server: GPU ad alta potenza che analizzano filmati video archiviati dove la latenza in tempo reale è meno critica.

Quando Scegliere YOLO26

YOLO26 è la scelta consigliata per gli ambienti di produzione e l'edge computing.

  • Sistemi integrati: grazie a CPU fino al 43% più veloce, è ideale per implementazioni Raspberry Pi o NVIDIA nella robotica.
  • Analisi in tempo reale: il design NMS garantisce una latenza deterministica, fondamentale per la guida autonoma e i sistemi di sicurezza.
  • Applicazioni multimodali: grazie al supporto nativo per la segmentazione delle istanze e la posa, funge da versatile backbone per pipeline complesse come l'analisi del comportamento umano nel settore retail o sportivo.

Conclusione

Mentre YOLOv9 concetti teorici rivoluzionari con PGI, YOLO26 perfeziona questi insegnamenti in un pacchetto pragmatico e ad alte prestazioni. La sua architettura end-to-end, l'eliminazione dei colli di bottiglia nella post-elaborazione e l'integrazione con il robusto Ultralytics lo rendono la scelta ideale per gli sviluppatori che realizzano applicazioni AI di nuova generazione.

Esplora altri modelli

Se sei interessato a esplorare altre opzioni, dai un'occhiata a YOLO11, il predecessore di YOLO26, o YOLOv10, che ha aperto la strada all'approccio NMS.


Commenti