Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs DAMO-YOLO#

Quando selezioni un modello di visione artificiale all'avanguardia, trovare l'equilibrio ottimale tra velocità di inferenza, precisione e facilità di distribuzione è fondamentale. Questa guida completa confronta due modelli di spicco nel panorama della visione artificiale: Ultralytics YOLO26 e DAMO-YOLO. Sebbene entrambe le architetture spingano i confini del rilevamento di oggetti in tempo reale, le loro filosofie di progettazione sottostanti e i casi d'uso previsti differiscono significativamente.

Link to this sectionInnovazioni architettoniche e design#

Link to this sectionUltralytics YOLO26: Lo standard di visione orientato all'edge#

Sviluppato da Glenn Jocher e Jing Qiu presso Ultralytics e rilasciato il 14 gennaio 2026, YOLO26 rappresenta un enorme passo avanti nella stirpe YOLO. È progettato da zero per l'edge computing, fondendo senza soluzione di continuità le pratiche di addestramento LLM all'avanguardia con architetture di visione avanzate.

Le principali innovazioni architettoniche di YOLO26 includono:

  • Design end-to-end senza NMS: Basandosi sul lavoro pionieristico di YOLOv10, YOLO26 è nativamente end-to-end. Eliminando completamente la Non-Maximum Suppression (NMS) durante la post-elaborazione, garantisce una latenza deterministica e semplifica enormemente le pipeline di distribuzione.
  • Rimozione della DFL: La rimozione della Distribution Focal Loss snellisce il grafo del modello. Ciò rende l'esportazione verso framework di distribuzione come ONNX e TensorRT molto più fluida e assicura una migliore compatibilità con i dispositivi edge a basso consumo.
  • Ottimizzatore MuSGD: Ispirato a Kimi K2 di Moonshot AI, questo ibrido di Stochastic Gradient Descent (SGD) e Muon porta le innovazioni dell'addestramento LLM nella visione artificiale, portando a un addestramento straordinariamente stabile e una rapida convergenza.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate offrono notevoli miglioramenti nel riconoscimento di piccoli oggetti, il che è una necessità critica per l'analisi delle immagini aeree tramite droni e per complesse pipeline di robotica.

Scopri di più su YOLO26

Link to this sectionDAMO-YOLO: Ricerca dell'architettura neurale su larga scala#

Sviluppato da Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun di Alibaba Group (rilasciato il 23 novembre 2022), DAMO-YOLO si concentra pesantemente sulla scoperta automatizzata dell'architettura. La ricerca, dettagliata nel loro articolo arXiv, utilizza la Neural Architecture Search (NAS) per trovare backbone ottimali entro rigorosi limiti di latenza.

Le principali caratteristiche architettoniche di DAMO-YOLO includono:

  • Backbone MAE-NAS: Impiega la ricerca evolutiva multi-obiettivo per progettare automaticamente backbone che bilancino la precisione con la velocità di distribuzione target.
  • Efficient RepGFPN: Un solido design a collo pesante che ottimizza la fusione delle caratteristiche su diverse scale, rendendolo altamente capace nell'elaborazione di scene visive complesse.
  • ZeroHead: Una testa di rilevamento drasticamente semplificata progettata per ridurre al minimo il carico computazionale negli strati di previsione finali.

Scopri di più su DAMO-YOLO

Scegliere l'architettura giusta

Mentre l'architettura basata su NAS di DAMO-YOLO è eccellente per vincoli hardware specifici e predefiniti, il design senza NMS e la rimozione della DFL di YOLO26 lo rendono una scelta molto più versatile e prevedibile in una vasta gamma di ambienti edge e cloud variabili.

Link to this sectionConfronto tra prestazioni e metriche#

Un confronto diretto delle varianti del modello addestrate sul set di dati COCO standard rivela profili prestazionali distinti. La tabella sottostante delinea i compromessi tra precisione (mAP), velocità e impronta computazionale (parametri e FLOPs).

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Link to this sectionAnalisi delle prestazioni#

Quando analizzi i dati, l'equilibrio delle prestazioni pende pesantemente verso YOLO26 per le applicazioni moderne. La variante Nano (YOLO26n) è eccezionalmente leggera con soli 2,4M di parametri, offrendo velocità fulminee di 1,7 ms su una GPU NVIDIA T4. Inoltre, YOLO26 è specificamente progettato per offrire un'inferenza CPU fino al 43% più veloce, rendendolo il campione indiscusso per i dispositivi edge privi di acceleratori GPU dedicati.

Sebbene DAMO-YOLOt superi leggermente YOLO26n nel mAP puro, lo fa al costo di richiedere quasi quattro volte il numero di parametri (8,5M). Man mano che passiamo alle varianti più grandi, YOLO26 supera costantemente DAMO-YOLO in precisione mantenendo un'impronta di memoria inferiore, un minor utilizzo di memoria CUDA durante l'addestramento e velocità TensorRT drasticamente più elevate.

Link to this sectionEcosistema, usabilità ed efficienza dell'addestramento#

La vera forza di un modello di machine learning risiede non solo nelle sue metriche grezze, ma in quanto facilmente può essere utilizzato da sviluppatori e ricercatori.

Link to this sectionIl vantaggio di Ultralytics#

Scegliere un modello Ultralytics garantisce l'accesso a un ecosistema altamente raffinato e incentrato sullo sviluppatore. Flussi di lavoro complessi che coinvolgono aumento dei dati, ottimizzazione degli iperparametri e un solido monitoraggio degli esperimenti sono astratti in comandi intuitivi.

Inoltre, YOLO26 offre una versatilità senza pari. Mentre DAMO-YOLO è strettamente un rilevatore di oggetti, YOLO26 fornisce miglioramenti completi e specifici per l'attività in molteplici domini pronti all'uso:

Link to this sectionMetodologie di addestramento#

L'addestramento di DAMO-YOLO comporta spesso un complesso processo di distillazione in cui un grande modello "insegnante" addestra un modello "studente" più piccolo. Sebbene questa tecnica estragga guadagni di precisione marginali, richiede un'ampia memoria GPU e cicli di addestramento più lunghi.

Al contrario, i requisiti di memoria per YOLO26 sono significativamente inferiori. Alimentato dall'ottimizzatore MuSGD, YOLO26 si addestra rapidamente ed efficientemente su hardware di livello consumer standard. Ecco con quanta facilità puoi addestrare un modello YOLO26 utilizzando l'API Python di Ultralytics basata su PyTorch:

from ultralytics import YOLO

# Initialize the natively end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the optimized, NMS-free model
model.export(format="onnx")
Esplorazione di altri modelli

Se sei interessato a esplorare altre architetture moderne all'interno dell'ecosistema Ultralytics, il validissimo YOLO11 rimane una scelta fantastica per le pipeline legacy. In alternativa, i ricercatori interessati alle architetture basate su Transformer possono esplorare il modello RT-DETR.

Link to this sectionApplicazioni nel mondo reale#

La scelta tra queste architetture dipende in definitiva dal tuo ambiente di distribuzione.

Link to this sectionEdge AI e dispositivi IoT#

Per telecamere smart retail, monitor agricoli automatizzati o robotica, le risorse di calcolo sono rigorosamente limitate. Qui, YOLO26 è la scelta definitiva. La sua inferenza CPU più veloce del 43%, la pipeline completamente priva di NMS e l'impronta di parametri minuscola gli consentono di funzionare senza problemi su dispositivi edge come Raspberry Pi senza sacrificare la precisione critica.

Link to this sectionProduzione ad alta velocità e controllo qualità#

Nelle linee di automazione della produzione dal ritmo serrato, rilevare i difetti su nastri trasportatori in rapido movimento richiede una latenza minima e deterministica. Sebbene DAMO-YOLO possa funzionare adeguatamente su specifiche configurazioni GPU, la latenza fluttuante introdotta dalla post-elaborazione NMS tradizionale può desincronizzare gli attuatori robotici. La natura end-to-end di YOLO26 garantisce tempi di elaborazione dei frame costanti e prevedibili, assicurando un'integrazione impeccabile nella robotica industriale ad alta velocità.

Link to this sectionDroni e immagini aeree#

Rilevare piccoli soggetti da quote elevate è notoriamente difficile. L'integrazione di ProgLoss e STAL in YOLO26 migliora drasticamente il riconoscimento di piccoli oggetti. Che si tratti di tracciare la fauna selvatica o analizzare la congestione del traffico da UAV, YOLO26 identifica costantemente oggetti con aree pixel più piccole che le architetture più vecchie, incluso DAMO-YOLO, mancano frequentemente.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLO26 e DAMO-YOLO dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLO26#

YOLO26 è una scelta valida per:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionQuando scegliere DAMO-YOLO#

DAMO-YOLO è raccomandato per:

  • Video Analytics ad alto throughput: Elaborazione di flussi video ad alto FPS su infrastruttura GPU NVIDIA fissa dove il throughput batch-1 è la metrica principale.
  • Linee di produzione industriale: Scenari con rigorosi vincoli di latenza GPU su hardware dedicato, come l'ispezione di qualità in tempo reale sulle linee di assemblaggio.
  • Ricerca sulla Neural Architecture Search: Studiare gli effetti della ricerca automatizzata dell'architettura (MAE-NAS) e delle efficienti backbone riparametrizzate sulle prestazioni di rilevamento.

Link to this sectionConclusione#

Mentre DAMO-YOLO rimane un affascinante studio sulle capacità della Neural Architecture Search per target hardware specifici, Ultralytics YOLO26 si pone come la soluzione superiore e completa per il professionista AI moderno. Con la sua architettura end-to-end senza NMS, requisiti di memoria significativamente inferiori, l'ottimizzatore ibrido MuSGD e un ecosistema impeccabilmente ben mantenuto, YOLO26 consente agli sviluppatori di costruire e distribuire sistemi di visione all'avanguardia in modo più rapido e affidabile che mai.

Collaboratori

Commenti