Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv8 vs. YOLOv9: Un confronto tecnico completo sui rilevatori di oggetti in tempo reale#

L'evoluzione del rilevamento di oggetti in tempo reale è stata caratterizzata da una costante ricerca di maggiore precisione, minore latenza e un migliore utilizzo dell'hardware. Due pietre miliari in questo percorso sono Ultralytics YOLOv8 e YOLOv9. Sebbene entrambi i modelli rappresentino funzionalità all'avanguardia nella computer vision, rispondono a esigenze di distribuzione, filosofie architetturali ed ecosistemi di sviluppo differenti.

Questa guida completa analizza le differenze tecniche, le innovazioni architetturali e le considerazioni pratiche per la distribuzione, per aiutarti a scegliere il modello giusto per il tuo prossimo progetto di intelligenza artificiale.

Link to this sectionLineage dei modelli e filosofie di base#

Prima di immergersi nelle metriche, è fondamentale comprendere le origini e gli obiettivi di progettazione primari dietro ciascun modello.

Link to this sectionUltralytics YOLOv8: Lo standard ecosistemico versatile#

Rilasciato dal team di Ultralytics, YOLOv8 è stato progettato non solo come un rilevatore di oggetti autonomo, ma come un framework unificato multi-task. Dà priorità a un'esperienza di sviluppo fluida, requisiti di memoria ridotti e un'ampia compatibilità hardware.

Scopri di più su YOLOv8

Link to this sectionYOLOv9: Informazioni sul gradiente programmabile#

Sviluppato indipendentemente dai ricercatori dell'Academia Sinica, YOLOv9 si concentra fortemente sulla teoria architetturale, affrontando in modo specifico il fenomeno del collo di bottiglia dell'informazione nelle reti neurali profonde.

  • Autori: Chien-Yao Wang e Hong-Yuan Mark Liao
  • Organizzazione: Institute of Information Science, Academia Sinica, Taiwan
  • Data: 21-02-2024
  • Arxiv: 2402.13616
  • GitHub: WongKinYiu/yolov9

Scopri di più su YOLOv9

Distribuzione aziendale

Se stai pianificando una distribuzione commerciale su larga scala, valuta l'esplorazione della Ultralytics Platform per la formazione semplificata nel cloud, la gestione dei dataset e gli endpoint API con un clic.

Link to this sectionApprofondimento architetturale#

Le scelte architetturali nel deep learning determinano quanto efficientemente un modello apprende e quanto velocemente viene eseguito sull'hardware di destinazione come un NVIDIA Jetson o una Intel CPU.

Link to this sectionArchitettura di YOLOv8: C2f e teste disaccoppiate#

YOLOv8 ha introdotto il modulo C2f (Cross-Stage Partial bottleneck con due convoluzioni), che ha sostituito il precedente modulo C3. Questo cambiamento migliora il flusso del gradiente e consente alla rete di apprendere rappresentazioni di caratteristiche più ricche senza appesantire eccessivamente la GPU memory.

Inoltre, YOLOv8 utilizza un design anchor-free con una testa disaccoppiata. Elaborando l'objectness, la classificazione e la regressione attraverso percorsi separati, il modello converge più velocemente durante l'addestramento e generalizza meglio su diversi custom datasets.

Link to this sectionArchitettura di YOLOv9: PGI e GELAN#

YOLOv9 introduce la Programmable Gradient Information (PGI) e la Generalized Efficient Layer Aggregation Network (GELAN). PGI assicura che i dati cruciali non vadano persi mentre passano attraverso i livelli della rete, fornendo gradienti affidabili per gli aggiornamenti dei pesi. GELAN massimizza l'efficienza dei parametri, permettendo al modello di raggiungere un'elevata accuracy cercando al contempo di mantenere i FLOPs gestibili.

Sebbene impressionante dal punto di vista matematico, la dipendenza di YOLOv9 da specifici rami ausiliari reversibili durante l'addestramento può rendere il codice di training più complesso da personalizzare rispetto ai pipeline standard.

Link to this sectionMetriche di prestazione e benchmark#

La tabella sottostante fornisce un confronto diretto dei modelli tra diverse dimensioni. Le prestazioni sono misurate sul MS COCO dataset, un benchmark standard per il rilevamento di oggetti.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Nota: I valori migliori in ogni colonna sono evidenziati in grassetto.

Link to this sectionAnalisi dei compromessi#

YOLOv9 raggiunge una precisione di picco leggermente superiore (mAP), in particolare con la sua variante e più grande. Tuttavia, questo comporta un costo. Ultralytics YOLOv8 mantiene un vantaggio significativo nella velocità di inferenza, in particolare quando compilato in formati come TensorRT o ONNX. Per le applicazioni che richiedono un elevato numero di fotogrammi al secondo (FPS) su hardware edge limitato (come un Raspberry Pi o chip mobili meno recenti), le varianti n e s di YOLOv8 offrono un equilibrio di prestazioni decisamente più pratico.

Link to this sectionEfficienza di addestramento e integrazione nell'ecosistema#

Scegliere un modello comporta molto più che guardare le tabelle di precisione; l'esperienza dello sviluppatore è fondamentale.

Link to this sectionIl vantaggio di Ultralytics: facilità d'uso#

L'addestramento di YOLOv9 richiede spesso la clonazione di repository GitHub complesse, la gestione attenta degli ambienti PyTorch e la configurazione manuale dei pesi di perdita ausiliari.

Al contrario, Ultralytics YOLOv8 è supportato da un'API Python straordinariamente semplificata. Costruita per la facilità d'uso, gestisce nativamente l'aumento dei dati, la registrazione (su strumenti come Weights & Biases e Comet ML) e la distribuzione hardware.

from ultralytics import YOLO

# Load a pre-trained YOLOv8 small model
model = YOLO("yolov8s.pt")

# Train the model efficiently on custom data
results = model.train(data="custom_dataset.yaml", epochs=100, imgsz=640)

# Export for edge deployment
model.export(format="engine", half=True)  # TensorRT export

Questa singola API riduce drasticamente i tempi dal prototipo alla produzione. Inoltre, YOLOv8 generalmente richiede meno memoria CUDA durante l'addestramento, consentendo agli sviluppatori di utilizzare batch size maggiori su hardware di livello consumer.

Link to this sectionVersatilità dei task#

Sebbene YOLOv9 sia un eccellente rilevatore di bounding box, la visione artificiale nel mondo reale richiede spesso di più. YOLOv8 è una potenza versatile che supporta nativamente Instance Segmentation, Pose Estimation, Image Classification e Oriented Bounding Boxes (OBB). L'utilizzo di un unico framework per molteplici attività riduce drasticamente il bloat del software e l'overhead di manutenzione.

Guardando al futuro

Se stai iniziando un nuovo progetto, potresti voler valutare anche Ultralytics YOLO11 o il rivoluzionario YOLO26, che presentano nativamente design end-to-end senza NMS.

Link to this sectionCasi d'uso reali#

Come si comportano questi modelli in produzione?

Link to this sectionDroni autonomi e robotica#

Per la robotica che richiede una rapida evitazione degli ostacoli, YOLOv8 è la scelta preferita. La bassissima latenza di YOLOv8n assicura che i sistemi autonomi reagiscano ai loro ambienti in tempo reale, prevenendo le collisioni. Le capacità di esportazione nativa in OpenVINO e CoreML rendono banale la distribuzione sui chip a basso consumo tipici dei droni commerciali.

Link to this sectionRilevamento dei difetti ad alta risoluzione#

In contesti di produzione specializzati in cui il rilevamento di anomalie microscopiche è fondamentale e l'elaborazione offline è accettabile, YOLOv9 può essere altamente efficace. L'architettura PGI aiuta la rete a mantenere i dettagli visivi a grana fine necessari per identificare crepe sottili o errori di saldatura PCB.

Link to this sectionSmart retail e analisi della sicurezza#

Per tracciare i clienti tra le corsie dei negozi o gestire sistemi di pagamento automatizzati, YOLOv8 fornisce il miglior equilibrio. La sua capacità di eseguire simultaneamente il rilevamento e il multi-object tracking utilizzando algoritmi standard come BoT-SORT lo rende una soluzione robusta per implementazioni retail multi-camera.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOv8 e YOLOv9 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv8#

YOLOv8 è una scelta solida per:

  • Deployment multi-attività versatile: Progetti che richiedono un modello comprovato per rilevamento, segmentazione, classificazione e stima della posa all'interno dell'ecosistema Ultralytics.
  • Sistemi di produzione stabiliti: Ambienti di produzione esistenti già costruiti sull'architettura YOLOv8 con pipeline di deployment stabili e ben testate.
  • Ampio supporto comunitario ed ecosistemico: Applicazioni che beneficiano degli ampi tutorial, integrazioni di terze parti e risorse comunitarie attive di YOLOv8.

Link to this sectionQuando scegliere YOLOv9#

YOLOv9 è consigliato per:

  • Ricerca sul collo di bottiglia informativo: Progetti accademici che studiano le architetture Programmable Gradient Information (PGI) e Generalized Efficient Layer Aggregation Network (GELAN).
  • Studi sull'ottimizzazione del flusso del gradiente: Ricerca focalizzata sulla comprensione e sulla mitigazione della perdita di informazioni negli strati profondi della rete durante l'addestramento.
  • Benchmarking del rilevamento ad alta precisione: Scenari in cui le solide prestazioni di YOLOv9 nel benchmark COCO sono necessarie come punto di riferimento per confronti architettonici.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza di sviluppo:

  • Deployment Edge senza NMS: Applicazioni che richiedono un'inferenza coerente e a bassa latenza senza la complessità della post-elaborazione con Non-Maximum Suppression.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza su CPU di YOLO26, fino al 43% più veloce, offre un vantaggio decisivo.
  • Rilevamento di piccoli oggetti: Scenari complessi come immagini di droni aerei o analisi tramite sensori IoT dove ProgLoss e STAL migliorano significativamente l'accuratezza su oggetti minuscoli.

Link to this sectionLa prossima evoluzione: YOLO26#

Mentre YOLOv8 e YOLOv9 sono potenti, il panorama dell'IA si muove rapidamente. Per i team che richiedono le migliori prestazioni in assoluto, il nuovo YOLO26 si basa sui successi di queste generazioni precedenti.

YOLO26 introduce un design end-to-end senza NMS, che elimina completamente i complessi colli di bottiglia della post-elaborazione, rendendo la distribuzione più semplice e la latenza più prevedibile. Guidato dal nuovo ottimizzatore MuSGD Optimizer e dalle funzioni di perdita potenziate ProgLoss + STAL, e con la DFL Removal (Distribution Focal Loss rimossa per un'esportazione semplificata e una migliore compatibilità con dispositivi edge/a basso consumo), raggiunge fino al 43% di velocità di inferenza su CPU in più migliorando al contempo il riconoscimento di piccoli oggetti. Per gli sviluppatori che spingono i limiti dell'edge computing, la valutazione di YOLO26 è vivamente consigliata.

In sintesi, mentre YOLOv9 offre un'affascinante ricerca architetturale e un'eccellente precisione di picco, Ultralytics YOLOv8 rimane la scelta più pratica, ben supportata e versatile per la stragrande maggioranza degli ingegneri di computer vision che mirano a distribuire software affidabile rapidamente.

Commenti