Meet YOLO26: next-gen vision AI.

Link to this sectionEfficientDet vs DAMO-YOLO#

Quando costruisci pipeline di computer vision scalabili, selezionare la giusta architettura del modello è una decisione critica che influenza sia la fattibilità del deployment che l'accuratezza del rilevamento. Questa guida fornisce un approfondito confronto tecnico tra due note architetture nel panorama del riconoscimento visivo: EfficientDet e DAMO-YOLO.

Sebbene entrambi i modelli abbiano apportato innovazioni significative nel campo del rilevamento oggetti, il rapido avanzamento dell'IA visiva ha aperto la strada a ecosistemi più integrati. Durante questa analisi, esploreremo i meccanismi fondamentali di queste reti legacy, illustrando al contempo perché soluzioni moderne come la piattaforma Ultralytics e Ultralytics YOLO26 siano diventate lo standard industriale per gli ambienti di produzione.

Link to this sectionEfficientDet: rilevamento oggetti scalabile ed efficiente#

Introdotto dai ricercatori di Google, EfficientDet è stato progettato per scalare sistematicamente l'architettura del modello mantenendo un'elevata efficienza. Ha raggiunto questo obiettivo sfruttando il compound scaling attraverso la profondità della rete, la larghezza e la risoluzione dell'input.

Dettagli di EfficientDet: Autori: Mingxing Tan, Ruoming Pang e Quoc V. Le
Organizzazione: Google Brain
Data: 20/11/2019
Arxiv: 1911.09070
GitHub: google/automl

Link to this sectionInnovazioni architettoniche#

Il principale contributo di EfficientDet è la Bi-directional Feature Pyramid Network (BiFPN). A differenza delle FPN tradizionali, la BiFPN consente una fusione di caratteristiche multiscala facile e veloce, utilizzando pesi apprendibili per comprendere l'importanza delle diverse caratteristiche di input. Questo è combinato con il backbone di EfficientNet, risultando in una famiglia di modelli (da D0 a D7) che scalano in modo prevedibile.

Link to this sectionPunti di forza e punti deboli#

Il punto di forza chiave di EfficientDet risiede nella sua efficienza dei parametri. Per le attività in cui la mean Average Precision (mAP) deve essere massimizzata su ambienti cloud pesantemente vincolati, il suo metodo di compound scaling è altamente prevedibile. Tuttavia, EfficientDet è notoriamente complesso da addestrare da zero e spesso richiede una sostanziale ottimizzazione degli iperparametri. Inoltre, la sua forte dipendenza da specifiche operazioni TensorFlow rende il passaggio ai deployment edge tramite ONNX o TensorRT più macchinoso rispetto alle semplificate funzionalità di esportazione presenti nei moderni modelli YOLO.

Scopri di più su EfficientDet

Link to this sectionDAMO-YOLO: Ricerca automatizzata dell'architettura in azione#

DAMO-YOLO rappresenta un approccio distinto, che utilizza la Neural Architecture Search (NAS) per progettare automaticamente strutture di rete ottimali per l'inferenza in tempo reale.

Dettagli di DAMO-YOLO: Autori: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun
Organizzazione: Alibaba Group
Data: 23/11/2022
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO

Link to this sectionInnovazioni architettoniche#

DAMO-YOLO introduce diverse tecnologie innovative. Utilizza un backbone generato tramite NAS chiamato MAE-NAS, un efficiente RepGFPN per il suo neck e un design ZeroHead che riduce drasticamente il costo computazionale della detection head. Inoltre, impiega AlignedOTA per l'assegnazione delle etichette e si affida pesantemente al potenziamento tramite knowledge distillation per migliorare le prestazioni delle sue varianti più piccole.

Link to this sectionPunti di forza e punti deboli#

DAMO-YOLO brilla per le velocità di inferenza GPU, progettate specificamente per il deployment su architetture NVIDIA utilizzando TensorRT. Rimuovendo le strutture pesanti della head, il modello fornisce previsioni a bassa latenza. Al contrario, la ricerca automatizzata dell'architettura può rendere la struttura del modello opaca e difficile da debuggare manualmente o perfezionare per dispositivi edge personalizzati. A differenza del versatile Ultralytics YOLO11, DAMO-YOLO è focalizzato principalmente sul rilevamento standard di bounding box, mancando di supporto nativo per attività avanzate come la stima della posa o il rilevamento oriented bounding box (OBB) pronto all'uso.

Scopri di più su DAMO-YOLO

Link to this sectionConfronto delle Prestazioni#

Comprendere i compromessi empirici è essenziale per selezionare un modello. La tabella sottostante confronta la famiglia EfficientDet con la serie DAMO-YOLO attraverso metriche di performance cruciali.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
Analisi dei dati

EfficientDet-d7 raggiunge l'accuratezza teorica più elevata ma richiede un'enorme potenza di calcolo, rendendolo inadatto per l'edge AI. DAMO-YOLO offre velocità TensorRT eccezionali, sebbene generalmente richieda più parametri rispetto ai modelli EfficientDet di fascia inferiore per ottenere un'accuratezza paragonabile.

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra EfficientDet e DAMO-YOLO dipende dai requisiti specifici del tuo progetto, dai vincoli di deployment e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere EfficientDet#

EfficientDet è una scelta solida per:

  • Pipeline Google Cloud e TPU: Sistemi profondamente integrati con le API di Google Cloud Vision o l'infrastruttura TPU, dove EfficientDet offre un'ottimizzazione nativa.
  • Ricerca sul Compound Scaling: Benchmarking accademico focalizzato sullo studio degli effetti della profondità della rete, della larghezza e del ridimensionamento della risoluzione.
  • Deployment mobile tramite TFLite: Progetti che richiedono specificamente l'esportazione verso TensorFlow Lite per dispositivi Android o Linux embedded.

Link to this sectionQuando scegliere DAMO-YOLO#

DAMO-YOLO è raccomandato per:

  • Video Analytics ad alto throughput: Elaborazione di flussi video ad alto FPS su infrastruttura GPU NVIDIA fissa dove il throughput batch-1 è la metrica principale.
  • Linee di produzione industriale: Scenari con rigorosi vincoli di latenza GPU su hardware dedicato, come l'ispezione di qualità in tempo reale sulle linee di assemblaggio.
  • Ricerca sulla Neural Architecture Search: Studiare gli effetti della ricerca automatizzata dell'architettura (MAE-NAS) e delle efficienti backbone riparametrizzate sulle prestazioni di rilevamento.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl vantaggio di Ultralytics: andare oltre i modelli legacy#

Mentre EfficientDet e DAMO-YOLO forniscono preziose intuizioni accademiche, gli sviluppatori moderni richiedono framework che bilancino prestazioni all'avanguardia con l'ergonomia per gli sviluppatori. È qui che eccelle l'ecosistema Ultralytics.

Link to this sectionFacilità d'uso ed ecosistema senza pari#

Il deployment di modelli da repository di ricerca separati e fortemente personalizzati porta spesso a incubi di integrazione. Ultralytics fornisce un ecosistema unificato e ben mantenuto con documentazione estesa e un'API in stile Python. Che tu stia utilizzando Google Colab per l'addestramento o esportando verso CoreML per l'inferenza mobile, la pipeline richiede solo poche righe di codice.

from ultralytics import YOLO

# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Export the trained model to ONNX for production
model.export(format="onnx")

Link to this sectionLa rivoluzione di YOLO26#

Per gli sviluppatori che valutano EfficientDet o DAMO-YOLO, Ultralytics YOLO26 rappresenta l'ultimo passo evolutivo. Rilasciato all'inizio del 2026, introduce capacità che cambiano il paradigma:

  • Design end-to-end senza NMS: Introdotto per la prima volta da YOLOv10, YOLO26 elimina nativamente la necessità di post-elaborazione con Non-Maximum Suppression (NMS). Ciò si traduce in architetture di deployment decisamente più semplici e in una latenza costante su diversi hardware.
  • Inferenza su CPU fino al 43% più veloce: Per deployment edge che mancano di GPU potenti — scenari in cui DAMO-YOLO fatica — YOLO26 è pesantemente ottimizzato, offrendo enormi incrementi di velocità su CPU standard.
  • Ottimizzatore MuSGD: Colmando il divario tra le innovazioni LLM e la computer vision, YOLO26 incorpora l'ottimizzatore MuSGD (ispirato a Moonshot AI), garantendo un addestramento incredibilmente stabile e una convergenza rapida rispetto ai fragili cicli di addestramento di EfficientDet.
  • Rimozione di DFL: La rimozione della Distribution Focal Loss semplifica il processo di esportazione, garantendo una compatibilità superiore con microcontrollori a basso consumo e dispositivi Raspberry Pi.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate producono miglioramenti drastici nel riconoscimento di piccoli oggetti, un'area in cui le architetture più vecchie tradizionalmente falliscono.

Link to this sectionEfficienza della memoria e versatilità delle attività#

A differenza dei modelli transformer o delle reti NAS pesantemente fuse, i modelli Ultralytics sono caratterizzati dalla loro rigorosa efficienza di memoria. Consumano una memoria CUDA notevolmente inferiore durante l'addestramento, consentendo un'iterazione rapida su hardware di tipo consumer.

Inoltre, mentre EfficientDet e DAMO-YOLO sono rigidamente vincolati ai bounding box, Ultralytics supporta nativamente l'instance segmentation e l'image classification all'interno dello stesso framework intuitivo. Per gli utenti che mantengono progetti meno recenti, Ultralytics YOLOv8 rimane un'alternativa solida e ampiamente implementata che vale la pena esplorare.

Link to this sectionConclusione#

Scegliere la giusta architettura visiva implica bilanciare le prestazioni teoriche grezze con la realtà del deployment. EfficientDet offre un approccio di scaling matematicamente elegante e DAMO-YOLO offre velocità GPU grezze avvincenti. Tuttavia, per i team che danno priorità allo sviluppo rapido, a deployment affidabili e a funzionalità all'avanguardia, i modelli Ultralytics si distinguono chiaramente. Combinando innovazioni come l'inferenza senza NMS e l'ottimizzazione MuSGD, YOLO26 garantisce che i tuoi progetti di computer vision siano costruiti sulla base più capace, manutenibile ed efficiente oggi disponibile.

Contributori

Commenti