Meet YOLO26: next-gen vision AI.

Link to this sectionDAMO-YOLO vs YOLO26#

Il panorama della computer vision è in costante evoluzione, guidato dalla necessità di architetture che bilancino un'elevata precisione con un'inferenza a bassa latenza. Questo confronto approfondisce le complessità tecniche di DAMO-YOLO e Ultralytics YOLO26, esplorandone le innovazioni architetturali, le metodologie di addestramento e i casi d'uso ideali.

Che tu stia distribuendo modelli di visione su dispositivi edge o costruendo pipeline cloud ad alto throughput, comprendere le sfumature tra questi modelli è fondamentale per prendere decisioni architetturali informate nello sviluppo dell'IA moderna.

Link to this sectionDAMO-YOLO: Ricerca dell'architettura neurale su larga scala#

DAMO-YOLO, sviluppato da Alibaba Group, è stato rilasciato il 23 novembre 2022. Progettato da Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun, il modello si concentra fortemente sulla scoperta automatizzata di architetture efficienti utilizzando la Neural Architecture Search (NAS).

Puoi esaminare la ricerca originale nel loro paper su ArXiv o esplorare il codice sorgente sul repository GitHub di DAMO-YOLO.

Link to this sectionCaratteristiche architetturali chiave#

DAMO-YOLO introduce diverse innovazioni tecniche progettate per spingere i limiti del rilevamento di oggetti in tempo reale:

  • Backbone MAE-NAS: DAMO-YOLO utilizza una ricerca evolutiva multi-obiettivo per trovare i backbone ottimali. Questo approccio NAS scopre architetture che bilanciano rigorosamente la precisione di rilevamento rispetto alla velocità di inferenza su hardware specifici.
  • Efficient RepGFPN: Un design "heavy-neck" che migliora significativamente la fusione delle caratteristiche, il che è altamente vantaggioso quando si analizzano scene complesse come quelle presenti nella immagineria aerea.
  • Design ZeroHead: Una head di rilevamento fortemente semplificata che minimizza la complessità computazionale dei livelli di previsione finale.
  • AlignedOTA e Distillazione: DAMO-YOLO impiega l'Aligned Optimal Transport Assignment (AlignedOTA) per risolvere le ambiguità nell'assegnazione delle etichette, abbinata a una solida strategia di potenziamento tramite knowledge distillation per aumentare la precisione dei modelli student più piccoli utilizzando reti teacher più grandi.

Scopri di più su DAMO-YOLO

Link to this sectionIl vantaggio di Ultralytics: YOLO26#

Rilasciato il 14 gennaio 2026 da Glenn Jocher e Jing Qiu presso Ultralytics, YOLO26 rappresenta l'apice dell'IA di visione accessibile e ad alte prestazioni. Basandosi sull'eredità di YOLO11 e YOLOv10, YOLO26 è progettato da zero per la distribuzione edge-first, la versatilità multimodale e una facilità d'uso senza pari.

Link to this sectionInnovazioni di YOLO26#

Ultralytics YOLO26 introduce diverse funzionalità rivoluzionarie che lo rendono la scelta definitiva per le moderne applicazioni di computer vision:

  • Design End-to-End NMS-Free: YOLO26 elimina nativamente la post-elaborazione Non-Maximum Suppression (NMS). Introdotto inizialmente in YOLOv10, questo approccio end-to-end semplifica drasticamente le pipeline di distribuzione e garantisce un'inferenza deterministica a bassa latenza.
  • Fino al 43% più veloce nell'inferenza su CPU: Architetturalmente ottimizzato per l'edge computing, YOLO26 offre una velocità eccezionale su dispositivi edge e CPU standard, rendendolo perfetto per dispositivi IoT alimentati a batteria.
  • Ottimizzatore MuSGD: Ispirato all'addestramento di LLM (come Kimi K2 di Moonshot AI), YOLO26 incorpora un ibrido di SGD e Muon. Ciò porta la stabilità dell'addestramento dei modelli linguistici di grandi dimensioni alla computer vision, risultando in una convergenza più rapida e affidabile.
  • Rimozione della DFL: Rimuovendo la Distribution Focal Loss, il grafo del modello viene semplificato, consentendo un'esportazione fluida verso formati come ONNX e TensorRT.
  • ProgLoss + STAL: Queste avanzate funzioni di perdita forniscono notevoli miglioramenti nel riconoscimento di piccoli oggetti, una caratteristica critica per le operazioni con droni e l'agricoltura.
Miglioramenti specifici per attività

YOLO26 include miglioramenti specializzati attraverso molteplici modalità: un proto multi-scala per la Segmentazione di Istanza, Residual Log-Likelihood Estimation (RLE) per la Pose Estimation e un'avanzata angle loss per mitigare i problemi di confine nel rilevamento Oriented Bounding Box (OBB).

Scopri di più su YOLO26

Link to this sectionConfronto delle Prestazioni#

Quando valuti questi modelli, l'equilibrio tra precisione (mAP) ed efficienza computazionale (Velocità/FLOP) è fondamentale. La tabella sottostante evidenzia come questi modelli si confrontano utilizzando il dataset COCO standard del settore.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Come mostrato sopra, YOLO26 offre costantemente una maggiore precisione con significativamente meno parametri e FLOP, risultando in un'architettura molto più efficiente sia per l'addestramento che per l'inferenza.

Link to this sectionEfficienza di addestramento e usabilità#

Link to this sectionLe complessità di DAMO-YOLO#

Sebbene DAMO-YOLO raggiunga una precisione competitiva, la sua metodologia di addestramento è altamente complessa. L'affidamento alla Neural Architecture Search (NAS) e alla pesante knowledge distillation significa che l'addestramento di un modello personalizzato spesso richiede risorse GPU significative e conoscenze specializzate. Questo processo a più fasi - addestrare un enorme modello teacher per distillarlo in un modello student più piccolo - può creare colli di bottiglia per i team di ingegneria agili che cercano di iterare rapidamente su dataset personalizzati.

Link to this sectionL'esperienza semplificata di Ultralytics#

Al contrario, Ultralytics YOLO26 è progettato per un'usabilità "zero-to-hero". L'intero ciclo di vita di addestramento, validazione e distribuzione è astratto dietro una Python API e CLI pulita e unificata. Inoltre, YOLO26 richiede significativamente meno memoria CUDA durante l'addestramento rispetto ai modelli basati su Transformer come RT-DETR, consentendo ai ricercatori di addestrare modelli all'avanguardia su hardware di livello consumer.

Ecco un esempio di quanto sia semplice addestrare, valutare ed esportare un modello YOLO26 utilizzando l'SDK di Ultralytics:

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Evaluate the model's performance on the validation set
metrics = model.val()

# Run inference on a sample image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export the model to ONNX format for deployment
model.export(format="onnx")

Per i team che preferiscono un ambiente no-code, Ultralytics Platform fornisce un'interfaccia intuitiva per l'annotazione dei dataset, l'addestramento nel cloud e la distribuzione senza interruzioni.

Link to this sectionApplicazioni nel mondo reale#

Scegliere l'architettura giusta dipende fortemente dall'ambiente di distribuzione di destinazione e dai vincoli hardware.

Link to this sectionControllo qualità industriale#

Per l'automazione della produzione ad alta velocità, DAMO-YOLO può funzionare bene su hardware GPU dedicato. Tuttavia, YOLO26 è la scelta preferita per le moderne linee di assemblaggio. Il suo design End-to-End NMS-Free garantisce una latenza deterministica e senza jitter, essenziale quando si sincronizzano dati visivi con attuatori robotici in tempo reale.

Link to this sectionEdge AI e dispositivi mobili#

Distribuire la computer vision su dispositivi alimentati a batteria richiede un'efficienza estrema. Mentre DAMO-YOLO si affida a specifici neck RepGFPN, YOLO26n (Nano) è specificamente ottimizzato per l'edge computing. La sua rimozione della DFL e il 43% di velocità in più nell'inferenza su CPU lo rendono la soluzione definitiva per telecamere intelligenti, applicazioni mobili e sistemi di allarme di sicurezza.

Link to this sectionRequisiti di progetto multimodali#

Se un progetto richiede più del semplice rilevamento di oggetti - come l'analisi delle meccaniche dei giocatori negli sport utilizzando la pose estimation, o l'estrazione di confini esatti dei pixel utilizzando la segmentazione di istanza - YOLO26 fornisce supporto nativo per tutte queste attività all'interno di un unico codebase unificato. DAMO-YOLO è strettamente limitato al rilevamento di bounding box.

Link to this sectionCasi d'uso e raccomandazioni#

Scegliere tra DAMO-YOLO e YOLO26 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere DAMO-YOLO#

DAMO-YOLO è una scelta valida per:

  • Video Analytics ad alto throughput: Elaborazione di flussi video ad alto FPS su infrastruttura GPU NVIDIA fissa dove il throughput batch-1 è la metrica principale.
  • Linee di produzione industriale: Scenari con rigorosi vincoli di latenza GPU su hardware dedicato, come l'ispezione di qualità in tempo reale sulle linee di assemblaggio.
  • Ricerca sulla Neural Architecture Search: Studiare gli effetti della ricerca automatizzata dell'architettura (MAE-NAS) e delle efficienti backbone riparametrizzate sulle prestazioni di rilevamento.

Link to this sectionQuando scegliere YOLO26#

YOLO26 è raccomandato per:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionConclusione#

Entrambe le architetture rappresentano risultati significativi nel campo del deep learning. DAMO-YOLO offre uno sguardo affascinante sul potere della Neural Architecture Search e sulle tecniche di distillazione adattate per specifici benchmark hardware.

Tuttavia, per sviluppatori, ricercatori e aziende che cercano una soluzione pronta per la produzione, Ultralytics YOLO26 si distingue come la scelta superiore. La sua combinazione di un design end-to-end NMS-free, massicci guadagni nell'inferenza su CPU, versatilità multimodale e integrazione nell'ecosistema ben mantenuto di Ultralytics lo rende lo strumento più robusto e pratico per risolvere le sfide di computer vision del mondo reale oggi.

Per gli utenti interessati a esplorare altri modelli all'interno dell'ecosistema Ultralytics, è disponibile una documentazione completa per YOLO11, YOLOv8 e il modello basato su Transformer RT-DETR.

Contributori

Commenti