Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO vs YOLOv5#

L'evoluzione della computer vision è stata segnata da una continua innovazione nel rilevamento di oggetti in tempo reale. Oggi, sviluppatori e ricercatori si trovano di fronte a una miriade di scelte architettoniche durante la progettazione di pipeline di visione. Questo confronto tecnico completo esplora le sfumature tra DAMO-YOLO e Ultralytics YOLOv5, evidenziando le rispettive architetture, metodologie di addestramento, metriche di performance e scenari di distribuzione ideali.

Link to this sectionIntroduzione a DAMO-YOLO#

Rilasciato da Alibaba Group, DAMO-YOLO ha introdotto diverse tecniche innovative volte a superare i limiti di velocità e precisione del rilevamento.

Scopri di più su DAMO-YOLO

Link to this sectionInnovazioni architettoniche#

DAMO-YOLO è costruito su una base di Neural Architecture Search (NAS). Gli autori hanno utilizzato MAE-NAS per progettare automaticamente backbone che bilanciano latenza e precisione. Il modello introduce un'efficiente RepGFPN (Reparameterized Generalized Feature Pyramid Network) che migliora la fusione delle caratteristiche su diverse scale. Inoltre, DAMO-YOLO incorpora un design "ZeroHead", eliminando complesse teste di previsione multi-ramo a favore di una struttura più semplice ed efficiente che si affida pesantemente alla riparametrizzazione durante l'inferenza.

Per migliorare l'addestramento, il modello utilizza AlignedOTA per l'assegnazione delle etichette e un pesante processo di potenziamento tramite distillazione, in cui un modello "insegnante" più grande guida il modello "studente" più piccolo per ottenere una maggiore precisione.

Link to this sectionIntroduzione a Ultralytics YOLOv5#

Ultralytics YOLOv5 è una delle architetture di visione più adottate al mondo, rinomata per la sua stabilità, facilità d'uso e vasto ecosistema di distribuzione.

Scopri di più su YOLOv5

Link to this sectionLo standard dell'ecosistema#

YOLOv5 ha ridefinito lo standard industriale per quanto riguarda l'usabilità. Costruito nativamente in PyTorch, utilizza una backbone CSPNet altamente ottimizzata e una neck PANet per una solida aggregazione delle caratteristiche. Sebbene abbia preceduto la tendenza anchor-free vista nei modelli successivi, il suo approccio basato su anchor altamente raffinato, combinato con l'apprendimento automatico delle anchor, garantisce prestazioni eccellenti fin da subito.

La vera forza di YOLOv5 risiede nel suo Ecosistema Ben Mantenuto. Si integra perfettamente con strumenti di tracciamento come Comet e Weights & Biases e supporta l'esportazione con un clic verso formati come ONNX, TensorRT e CoreML.

Iniziare con YOLOv5

YOLOv5 è incredibilmente facile da addestrare su dataset personalizzati. L'API semplificata riduce gli ostacoli dal prototipo alla produzione, rendendolo uno dei preferiti dai team di ingegneria agili.

Link to this sectionConfronto tra prestazioni e metriche#

Quando si confrontano questi modelli, è fondamentale guardare all'equilibrio tra mean Average Precision (mAP), velocità di inferenza e numero di parametri.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionAnalisi dei compromessi#

DAMO-YOLO raggiunge punteggi mAP impressionanti per le sue dimensioni in termini di parametri, beneficiando fortemente dalla sua fase di addestramento per distillazione. Tuttavia, ciò ha un costo in termini di Efficienza di Addestramento. Il processo di distillazione multi-stadio richiede prima l'addestramento di un modello insegnante pesante, il che aumenta significativamente il tempo di calcolo GPU necessario e la VRAM.

Al contrario, YOLOv5 offre eccellenti Requisiti di Memoria. I modelli Ultralytics YOLO sono noti per il minor utilizzo di memoria durante sia l'addestramento che l'inferenza rispetto a complesse pipeline di distillazione o modelli basati su Transformer come RT-DETR. Ciò consente a YOLOv5 di essere addestrato in modo efficiente su hardware di fascia consumer o in ambienti cloud accessibili come Google Colab.

Link to this sectionApplicazioni nel mondo reale e versatilità#

La scelta dell'architettura giusta dipende spesso dall'ambiente di distribuzione.

Link to this sectionDove eccelle DAMO-YOLO#

DAMO-YOLO è strettamente un modello di rilevamento oggetti. È un'ottima scelta per la ricerca accademica, in particolare per i team che studiano la Neural Architecture Search o per coloro che mirano a riprodurre le tecniche di riparametrizzazione descritte nel documento. Se un progetto dispone di ampie risorse computazionali per eseguire la fase di addestramento per distillazione ed è focalizzato esclusivamente sull'estrarre l'ultima frazione di precisione per le bounding box 2D, DAMO-YOLO è un forte contendente.

Link to this sectionIl vantaggio di Ultralytics#

Per la produzione nel mondo reale, la Facilità d'Uso e la Versatilità dei modelli Ultralytics li rendono la scelta preferita. Mentre YOLOv5 rimane un punto fermo per il rilevamento e la classificazione delle immagini, il più ampio ecosistema Ultralytics consente agli sviluppatori di passare facilmente da un compito all'altro.

Ad esempio, le iterazioni più recenti della famiglia Ultralytics supportano nativamente la segmentazione di istanze, la stima della posa e il rilevamento di Oriented Bounding Box (OBB). Questa capacità multi-task assicura che i team possano utilizzare una singola API Python unificata per pipeline complesse, come la combinazione del riconoscimento automatico delle targhe con la segmentazione dei veicoli.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra DAMO-YOLO e YOLOv5 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze sull'ecosistema.

Link to this sectionQuando scegliere DAMO-YOLO#

DAMO-YOLO è una scelta valida per:

  • Video Analytics ad alto throughput: Elaborazione di flussi video ad alto FPS su infrastruttura GPU NVIDIA fissa dove il throughput batch-1 è la metrica principale.
  • Linee di produzione industriale: Scenari con rigorosi vincoli di latenza GPU su hardware dedicato, come l'ispezione di qualità in tempo reale sulle linee di assemblaggio.
  • Ricerca sulla Neural Architecture Search: Studiare gli effetti della ricerca automatizzata dell'architettura (MAE-NAS) e delle efficienti backbone riparametrizzate sulle prestazioni di rilevamento.

Link to this sectionQuando scegliere YOLOv5#

YOLOv5 è consigliato per:

  • Sistemi di produzione comprovati: Deployment esistenti in cui sono apprezzati la lunga storia di stabilità, l'ampia documentazione e il massiccio supporto della comunità di YOLOv5.
  • Addestramento con risorse limitate: Ambienti con risorse GPU limitate in cui la pipeline di addestramento efficiente e i minori requisiti di memoria di YOLOv5 sono vantaggiosi.
  • Ampio supporto di formati di esportazione: Progetti che richiedono il deployment su molti formati, inclusi ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl futuro: passare a YOLO26#

Mentre YOLOv5 è leggendario e DAMO-YOLO fornisce interessanti intuizioni accademiche, lo stato dell'arte si è evoluto. Rilasciato nel gennaio 2026, Ultralytics YOLO26 rappresenta un enorme salto in avanti per la comunità della visione artificiale.

Scopri di più su YOLO26

YOLO26 affronta i colli di bottiglia tradizionali della distribuzione edge e dell'instabilità dell'addestramento:

  • Design End-to-End NMS-Free: YOLO26 elimina nativamente il post-processing Non-Maximum Suppression. Questa svolta semplifica la logica di distribuzione e riduce drasticamente la variabilità della latenza, rendendolo ideale per la robotica ad alta velocità e i sistemi autonomi.
  • Ottimizzatore MuSGD: Ispirato dalle innovazioni nell'addestramento dei LLM (come Kimi K2 di Moonshot AI), YOLO26 utilizza l'ottimizzatore MuSGD (un ibrido tra SGD e Muon). Ciò garantisce cicli di addestramento altamente stabili e una convergenza notevolmente più rapida.
  • Inferenza su CPU fino al 43% più veloce: Rimuovendo strategicamente la Distribution Focal Loss (DFL), YOLO26 raggiunge velocità decisamente superiori su CPU e dispositivi edge rispetto ai suoi predecessori come YOLO11 e YOLOv8.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate offrono miglioramenti notevoli nel riconoscimento di oggetti piccoli, il che è fondamentale per l'analisi di immagini di droni aerei e feed di sensori IoT.

Link to this sectionEsempio di codice: semplicità in azione#

Il pacchetto Ultralytics ti consente di addestrare e distribuire modelli con poche righe di codice. Che tu stia utilizzando YOLOv5 o passando al consigliato YOLO26, l'interfaccia rimane coerente e intuitiva.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Export the model for edge deployment
model.export(format="onnx")

Link to this sectionConclusione#

Sia DAMO-YOLO che YOLOv5 hanno contribuito in modo significativo al panorama della computer vision. DAMO-YOLO mostra il potere della Neural Architecture Search e della distillazione, rendendolo uno studio interessante per i ricercatori. Tuttavia, YOLOv5 rimane una potenza pratica grazie al suo Bilanciamento delle Performance, ai bassi requisiti di memoria e alla facilità d'uso senza pari.

Per gli sviluppatori che iniziano oggi nuovi progetti, la raccomandazione è di sfruttare la Ultralytics Platform e adottare YOLO26. Esso combina l'amato ecosistema user-friendly di YOLOv5 con innovativi avanzamenti architetturali, garantendo una precisione di alto livello e un'inferenza fulminea sia per applicazioni AI cloud che edge. Gli sviluppatori potrebbero anche voler esplorare altri modelli efficienti come YOLOv6 o YOLOX a seconda di specifici vincoli legati all'hardware legacy.

Commenti