Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 vs YOLOv9#

L'evoluzione del rilevamento di oggetti in tempo reale è stata caratterizzata da una spinta costante verso una maggiore precisione, una latenza inferiore e un migliore utilizzo dell'hardware. Due pietre miliari in questo percorso sono Ultralytics YOLOv8 e YOLOv9. Sebbene entrambi i modelli rappresentino capacità allo stato dell'arte nella visione artificiale, soddisfano esigenze di distribuzione, filosofie architettoniche ed ecosistemi di sviluppo differenti.

Questa guida completa analizza le differenze tecniche, le innovazioni architettoniche e le considerazioni pratiche di implementazione per aiutarti a scegliere il modello giusto per il tuo prossimo progetto di intelligenza artificiale.

Link to this sectionLineaggio del modello e filosofie di base#

Prima di immergerti nelle metriche, è fondamentale comprendere le origini e gli obiettivi di progettazione primari di ciascun modello.

Link to this sectionUltralytics YOLOv8: Lo standard dell'ecosistema versatile#

Rilasciato dal team di Ultralytics, YOLOv8 è stato progettato non solo come un rilevatore di oggetti autonomo, ma come un framework unificato e multi-task. Privilegia un'esperienza di sviluppo fluida, requisiti di memoria ridotti e un'ampia compatibilità hardware.

Scopri di più su YOLOv8

Link to this sectionYOLOv9: Programmable Gradient Information#

Sviluppato indipendentemente dai ricercatori dell'Academia Sinica, YOLOv9 si concentra pesantemente sulla teoria architettonica, affrontando specificamente il fenomeno del collo di bottiglia dell'informazione nelle reti neurali profonde.

  • Autori: Chien-Yao Wang e Hong-Yuan Mark Liao
  • Organizzazione: Institute of Information Science, Academia Sinica, Taiwan
  • Data: 2024-02-21
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

Scopri di più su YOLOv9

Deployment aziendale

Se stai pianificando una distribuzione commerciale su larga scala, prendi in considerazione l'esplorazione della piattaforma Ultralytics per l'addestramento semplificato nel cloud, la gestione dei set di dati e gli endpoint API con un solo clic.

Link to this sectionApprofondimento architettonico#

Le scelte architettoniche nel deep learning determinano l'efficienza con cui un modello apprende e la velocità con cui viene eseguito sull'hardware di destinazione come un NVIDIA Jetson o una CPU Intel.

Link to this sectionArchitettura YOLOv8: C2f e teste disaccoppiate#

YOLOv8 ha introdotto il modulo C2f (collo di bottiglia parziale Cross-Stage con due convoluzioni), che ha sostituito il precedente modulo C3. Questo cambiamento migliora il flusso del gradiente e consente alla rete di apprendere rappresentazioni di caratteristiche più ricche senza appesantire eccessivamente la memoria della GPU.

Inoltre, YOLOv8 utilizza un design anchor-free con una testa disaccoppiata. Elaborando l'objectness, la classificazione e la regressione attraverso percorsi separati, il modello converge più rapidamente durante l'addestramento e si generalizza meglio su diversi set di dati personalizzati.

Link to this sectionArchitettura YOLOv9: PGI e GELAN#

YOLOv9 introduce la Programmable Gradient Information (PGI) e la Generalized Efficient Layer Aggregation Network (GELAN). La PGI assicura che i dati cruciali non vadano persi mentre passano attraverso i livelli della rete, fornendo gradienti affidabili per gli aggiornamenti dei pesi. GELAN massimizza l'efficienza dei parametri, consentendo al modello di ottenere un'elevata precisione cercando di mantenere gestibili i FLOP.

Sebbene matematicamente impressionante, la dipendenza di YOLOv9 da specifici rami ausiliari reversibili durante l'addestramento può rendere il codice di addestramento più complesso da personalizzare rispetto alle pipeline standard.

Link to this sectionMetriche di performance e benchmark#

La tabella seguente fornisce un confronto diretto dei modelli su diverse dimensioni. Le prestazioni sono misurate sul set di dati MS COCO, un punto di riferimento standard per il rilevamento di oggetti.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Nota: i valori migliori in ogni colonna sono evidenziati in grassetto.

Link to this sectionAnalisi dei compromessi#

YOLOv9 raggiunge una precisione di picco (mAP) leggermente superiore, in particolare con la sua variante e più grande. Tuttavia, questo ha un costo. Ultralytics YOLOv8 mantiene un vantaggio significativo nella velocità di inferenza, specialmente quando compilato in formati come TensorRT o ONNX. Per le applicazioni che richiedono frame-al-secondo (FPS) elevati su hardware edge limitato (come un Raspberry Pi o chip mobili meno recenti), le varianti n e s di YOLOv8 offrono un equilibrio di prestazioni molto più pratico.

Link to this sectionEfficienza dell'addestramento e integrazione dell'ecosistema#

Scegliere un modello implica molto più che guardare le tabelle di precisione; l'esperienza dello sviluppatore è fondamentale.

Link to this sectionIl vantaggio di Ultralytics: facilità d'uso#

L'addestramento di YOLOv9 richiede spesso la clonazione di complessi repository GitHub, la gestione accurata degli ambienti PyTorch e la configurazione manuale dei pesi di perdita ausiliari.

Al contrario, Ultralytics YOLOv8 è supportato da un'API Python straordinariamente semplificata. Costruita per la facilità d'uso, gestisce in modo nativo l'aumento dei dati, la registrazione (su strumenti come Weights & Biases e Comet ML) e la distribuzione hardware.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

# Export for edge deployment
model.export(format="engine", quantize=16)  # TensorRT export

Questa singola API riduce drasticamente il tempo dal prototipo alla produzione. Inoltre, YOLOv8 richiede generalmente meno memoria CUDA durante l'addestramento, consentendo agli sviluppatori di utilizzare dimensioni di batch più grandi su hardware di livello consumer.

Link to this sectionVersatilità delle attività#

Sebbene YOLOv9 sia un eccellente rilevatore di riquadri di delimitazione (bounding box), l'IA visiva nel mondo reale richiede spesso di più. YOLOv8 è una potenza versatile che supporta nativamente Segmentazione di istanze, Stima della posa, Classificazione di immagini e Oriented Bounding Boxes (OBB). L'utilizzo di un unico framework per molteplici attività riduce drasticamente il bloatware e i costi di manutenzione.

Guardando avanti

Se stai iniziando un nuovo progetto, potresti voler valutare Ultralytics YOLO11 o il rivoluzionario YOLO26, che presentano nativamente design end-to-end senza NMS.

Link to this sectionCasi d'uso nel mondo reale#

Come si comportano questi modelli in produzione?

Link to this sectionDroni autonomi e robotica#

Per la robotica che richiede una rapida prevenzione degli ostacoli, YOLOv8 è la scelta preferita. La bassissima latenza di YOLOv8n garantisce che i sistemi autonomi reagiscano ai loro ambienti in tempo reale, prevenendo collisioni. Le funzionalità di esportazione native verso OpenVINO e CoreML rendono banale la distribuzione sui chip a basso consumo tipici dei droni commerciali.

Link to this sectionRilevamento difetti ad alta risoluzione#

In contesti produttivi specializzati in cui il rilevamento di anomalie microscopiche è critico e l'elaborazione offline è accettabile, YOLOv9 può essere altamente efficace. L'architettura PGI aiuta la rete a mantenere i dettagli visivi a grana fine necessari per identificare crepe sottili o errori di saldatura PCB.

Link to this sectionVendita al dettaglio intelligente e analisi della sicurezza#

Per monitorare i clienti tra le corsie dei negozi o gestire sistemi di pagamento automatizzati, YOLOv8 offre il miglior equilibrio. La sua capacità di eseguire simultaneamente il rilevamento e il tracciamento multi-oggetto utilizzando algoritmi standard come BoT-SORT lo rende una soluzione robusta per implementazioni retail multi-camera.

Link to this sectionCasi d'uso e raccomandazioni#

Scegliere tra YOLOv8 e YOLOv9 dipende dai requisiti specifici del tuo progetto, dai vincoli di implementazione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv8#

YOLOv8 è una scelta solida per:

  • Distribuzione multi-attività versatile: Progetti che richiedono un modello comprovato per rilevamento, segmentazione, classificazione e stima della posa all'interno dell'ecosistema Ultralytics.
  • Sistemi di produzione consolidati: Ambienti di produzione esistenti già costruiti sull'architettura YOLOv8 con pipeline di distribuzione stabili e ben testate.
  • Ampio supporto dalla community ed ecosistema: Applicazioni che beneficiano degli estesi tutorial di YOLOv8, integrazioni di terze parti e risorse attive della community.

Link to this sectionQuando scegliere YOLOv9#

YOLOv9 è consigliato per:

  • Ricerca sul collo di bottiglia dell'informazione: Progetti accademici che studiano le architetture Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Studi sull'ottimizzazione del flusso di gradienti: Ricerca focalizzata sulla comprensione e sulla mitigazione della perdita di informazioni negli strati profondi della rete durante l'addestramento.
  • Benchmarking del rilevamento ad alta precisione: Scenari in cui le forti prestazioni del benchmark COCO di YOLOv9 sono necessarie come punto di riferimento per i confronti architettonici.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionLa prossima evoluzione: YOLO26#

Sebbene YOLOv8 e YOLOv9 siano potenti, il panorama dell'IA si muove rapidamente. Per i team che richiedono le prestazioni migliori in assoluto, il nuovo YOLO26 si basa sui successi di queste generazioni precedenti.

YOLO26 introduce un design end-to-end senza NMS, che elimina completamente i complessi colli di bottiglia della post-elaborazione, rendendo la distribuzione più semplice e la latenza più prevedibile. Guidato dal nuovo ottimizzatore MuSGD e dalle funzioni di perdita avanzate ProgLoss + STAL, e con DFL Removal (Distribution Focal Loss rimosso per un'esportazione semplificata e una migliore compatibilità con dispositivi edge/a basso consumo), raggiunge fino al 43% di inferenza CPU più veloce aumentando al contempo il riconoscimento di oggetti piccoli. Per gli sviluppatori che spingono i limiti dell'edge computing, è altamente raccomandato valutare YOLO26.

In sintesi, mentre YOLOv9 offre un'affascinante ricerca architettonica e un'eccellente precisione di picco, Ultralytics YOLOv8 rimane la scelta più pratica, ben supportata e versatile per la stragrande maggioranza degli ingegneri di visione artificiale che mirano a rilasciare software affidabile rapidamente.

Commenti