Link to this sectionDAMO-YOLO vs PP-YOLOE+#

Nel panorama altamente competitivo della computer vision in tempo reale, scegliere l'architettura ottimale per le tue specifiche esigenze di distribuzione è fondamentale. Questa guida fornisce un confronto tecnico completo tra DAMO-YOLO e PP-YOLOE+, approfondendo i loro design architetturali, le metodologie di addestramento e le metriche di prestazione. Esamineremo anche come questi modelli si confrontano con soluzioni all'avanguardia come il nuovo Ultralytics YOLO26.

Link to this sectionPanoramica dei modelli#

Entrambi i framework sono emersi nel 2022 come potenti alternative per applicazioni industriali, sfruttando tecniche sofisticate per superare i limiti di accuratezza e velocità di inferenza.

Link to this sectionDAMO-YOLO#

Sviluppato dal Alibaba Group, DAMO-YOLO ha introdotto diverse tecniche innovative per ottimizzare il compromesso tra latenza e accuratezza, facendo forte affidamento su tecniche di ricerca automatizzata e fusione avanzata delle feature.

Autori: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang e Xiuyu Sun
Organizzazione: Alibaba Group
Data: 23-11-2022
Arxiv: DAMO-YOLO: A Report on Real-Time Object Detection Design
GitHub: tinyvision/DAMO-YOLO
Documentazione: DAMO-YOLO README

DAMO-YOLO impiega una Multi-Scale Architecture Search (MAE-NAS) per progettare automaticamente backbone ottimizzate per l'efficienza hardware. Presenta inoltre un'efficiente RepGFPN (Re-parameterized Generalized Feature Pyramid Network) per la fusione delle feature nel collo e un design leggero "ZeroHead". Inoltre, si affida pesantemente a tecniche di distillazione durante l'addestramento per potenziare la capacità di rappresentazione del modello studente.

Scopri di più su DAMO-YOLO

Link to this sectionPP-YOLOE+#

Dal team di Baidu PaddlePaddle, PP-YOLOE+ è un aggiornamento incrementale dell'architettura PP-YOLOE. Si concentra sul pre-addestramento su larga scala e su funzioni di loss raffinate per offrire un mAP elevato, specialmente all'interno del suo framework di deep learning nativo.

Autori: Autori di PaddlePaddle
Organizzazione: Baidu
Data: 02-04-2022
Arxiv: PP-YOLOE: An evolved version of YOLO
GitHub: PaddlePaddle/PaddleDetection
Documentazione: PP-YOLOE+ Configs

PP-YOLOE+ utilizza una backbone CSPRepResNet e una ET-head (Efficient Task-aligned head). La versione "plus" introduce una potente strategia di pre-addestramento sul dataset Objects365, che migliora significativamente la sua capacità di generalizzare attraverso diversi ambienti del mondo reale.

Scopri di più su PP-YOLOE+

Link to this sectionConfronto architetturale#

La divergenza nella filosofia di design tra questi due modelli influenza pesantemente i loro casi d'uso ideali e la compatibilità hardware.

Link to this sectionFusione delle feature e backbone#

Le backbone generate dalla MAE-NAS di DAMO-YOLO sono altamente personalizzate per i dispositivi edge, offrendo spesso un rapporto velocità-parametri favorevole. Tuttavia, queste architetture personalizzate possono essere rigide e complesse da adattare per nuovi task come l'instance segmentation. Il collo RepGFPN migliora la fusione delle feature multi-scala ma aggiunge complessità durante la fase di esportazione della ri-parametrizzazione.

PP-YOLOE+ si affida alla più tradizionale, ma altamente efficace, CSPRepResNet. Sebbene questa backbone richieda un ingombro di parametri maggiore rispetto a DAMO-YOLO per un'accuratezza simile, è molto stabile da addestrare e più facile da integrare nelle pipeline esistenti. La sua ET-head gestisce in modo efficiente classificazione e regressione, ma richiede ancora passaggi di post-elaborazione come il Non-Maximum Suppression (NMS).

Eliminazione dei ritardi di post-elaborazione

Sia DAMO-YOLO che PP-YOLOE+ richiedono NMS per la post-elaborazione dei bounding box. Se la latenza di inferenza è critica, prendi in considerazione l'utilizzo di Ultralytics YOLO26, che presenta un design End-to-End NMS-Free nativo. Questo approccio rivoluzionario elimina la post-elaborazione NMS per una pipeline di distribuzione più veloce e semplice.

Link to this sectionAnalisi delle prestazioni e delle metriche#

Quando valuti questi modelli per la produzione, l'equilibrio tra accuratezza (mAP), velocità di inferenza e dimensione dei parametri è fondamentale. Di seguito è riportato un confronto diretto delle loro varianti principali.

Modello	dimensione ^(pixel)	mAP^val 50-95	Velocità ^{CPU ONNX (ms)}	Velocità ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
DAMO-YOLOt	640	42.0	-	2.32	8.5	18.1
DAMO-YOLOs	640	46.0	-	3.45	16.3	37.8
DAMO-YOLOm	640	49.2	-	5.09	28.2	61.8
DAMO-YOLOl	640	50.8	-	7.18	42.1	97.3

PP-YOLOE+t	640	39.9	-	2.84	4.85	19.15
PP-YOLOE+s	640	43.7	-	2.62	7.93	17.36
PP-YOLOE+m	640	49.8	-	5.56	23.43	49.91
PP-YOLOE+l	640	52.9	-	8.36	52.2	110.07
PP-YOLOE+x	640	54.7	-	14.3	98.42	206.59

Come illustra la tabella, DAMO-YOLO generalmente ottiene una latenza inferiore sulle scale small (s) e tiny (t), grazie alle sue backbone ottimizzate NAS. Tuttavia, PP-YOLOE+ scala incredibilmente bene nei livelli medium (m) e large (l), vantando punteggi mAP significativamente più alti, sebbene a un leggero costo in termini di velocità T4 TensorRT.

Link to this sectionRequisiti di memoria ed efficienza di addestramento#

La dipendenza di DAMO-YOLO dalla distillazione significa che spesso devi addestrare un modello insegnante molto più grande prima di addestrare il modello studente più piccolo. Ciò aumenta drasticamente i requisiti di memoria CUDA e il budget computazionale complessivo. PP-YOLOE+ semplifica questo processo con un addestramento standard a singolo stadio, ma rimane strettamente legato al framework PaddlePaddle, il che potrebbe limitare la flessibilità per i team abituati a PyTorch.

Al contrario, il moderno modello Ultralytics YOLO26 risolve questi colli di bottiglia. Utilizzando il nuovo ottimizzatore MuSGD — un ibrido di SGD e Muon ispirato alle innovazioni nell'addestramento LLM — YOLO26 ottiene una convergenza più rapida e un addestramento altamente stabile senza richiedere complicate pipeline di distillazione. Inoltre, i modelli YOLO richiedono in genere molta meno memoria CUDA durante l'addestramento rispetto ai rilevatori basati su transformer come RT-DETR.

Link to this sectionApplicazioni nel mondo reale e casi d'uso ideali#

Link to this sectionQuando usare DAMO-YOLO#

DAMO-YOLO è ideale per l'inferenza edge ad alto throughput dove la latenza è il limite principale. Le sue varianti piccole eccellono in ambienti come sistemi di gestione del traffico o sorveglianza tramite droni di base, a condizione che il tuo team tecnico abbia la capacità di gestire i suoi complessi processi di distillazione e ri-parametrizzazione.

Link to this sectionQuando usare PP-YOLOE+#

PP-YOLOE+ brilla quando sei già profondamente coinvolto nell'ecosistema Baidu o stai eseguendo distribuzioni server su larga scala. Il suo impressionante mAP lo rende adatto per complessi analisi di immagini mediche o rilevamento di difetti di produzione densi.

Link to this sectionIl vantaggio di Ultralytics#

Sebbene sia DAMO-YOLO che PP-YOLOE+ offrano vantaggi localizzati specifici, gli sviluppatori che cercano la massima versatilità, velocità e facilità d'uso si rivolgono costantemente alla Piattaforma Ultralytics.

Quando aggiorni la tua pipeline di computer vision, Ultralytics YOLO26 offre un'esperienza per gli sviluppatori senza pari:

Fino al 43% di inferenza CPU più veloce: Con la rimozione completa della Distribution Focal Loss (DFL), YOLO26 è straordinariamente veloce su CPU edge e dispositivi IoT a basso consumo.
Rilevamento migliorato di piccoli oggetti: L'integrazione delle funzioni di loss ProgLoss e STAL fornisce miglioramenti drastici nel riconoscimento di piccoli oggetti, fondamentale per l'immagini aeree.
Versatilità estesa: A differenza di PP-YOLOE+, che si concentra rigorosamente sul rilevamento, YOLO26 gestisce perfettamente stima della posa, oriented bounding boxes (OBB) e segmentazione semantica con miglioramenti architetturali specifici per il task.

Link to this sectionConclusione#

DAMO-YOLO e PP-YOLOE+ rappresentano importanti pietre miliari nell'evoluzione del rilevamento di oggetti senza ancoraggi. DAMO-YOLO ha spinto i limiti della ricerca sull'architettura neurale per la latenza edge, mentre PP-YOLOE+ ha dimostrato la potenza del pre-addestramento su larga scala.

Tuttavia, per gli sviluppatori che cercano il miglior equilibrio tra velocità, accuratezza e semplicità di distribuzione, il modello Ultralytics YOLO26 è la scelta definitiva. La sua architettura senza NMS, la solida API Python e l'integrazione fluida con strumenti come Weights & Biases e TensorRT assicurano che i tuoi progetti passino agevolmente dal prototipo alla produzione.

Pronto per iniziare? Esplora la Guida rapida di Ultralytics o confronta più modelli nella nostra panoramica YOLO11 vs DAMO-YOLO.

Collaboratori

GLglenn-jocher¹⁵ PDpderrenger¹

Creato 27 gen 2025Aggiornato 3 settimane fa