Vai al contenuto

YOLO26 vs. PP-YOLOE+: Miglioramento del rilevamento degli oggetti con efficienza di nuova generazione

La scelta dell'architettura di rilevamento oggetti più adatta è una decisione fondamentale per gli sviluppatori che realizzano applicazioni di visione artificiale. Questa guida fornisce un confronto tecnico dettagliato tra due modelli influenti: Ultralytics e PP-YOLOE+. Sebbene entrambi i modelli rappresentino pietre miliari significative nell'evoluzione del rilevamento in tempo reale, essi rispondono a filosofie ingegneristiche e ambienti di implementazione diversi.

Ultralytics , rilasciato nel gennaio 2026, introduce un'architettura nativa end-to-end NMS, ottimizzata per CPU e la facilità d'uso. Al contrario, PP-YOLOE+, sviluppato da PaddlePaddle, si concentra sul perfezionamento del rilevamento senza ancoraggi all'interno dell'ecosistema Baidu. Questa analisi approfondisce le loro architetture, le metriche delle prestazioni e i casi d'uso ideali per aiutarti a scegliere lo strumento migliore per il tuo progetto.

Sintesi: differenze principali

FunzionalitàUltralytics YOLO26PP-YOLOE+
ArchitetturaEnd-to-End (NMS)Senza ancoraggio (richiede NMS)
Velocità di inferenzaOttimizzato per CPU Edge (fino al 43% più veloce)Ottimizzato per GPU PaddleLite
StrutturaPyTorch nativo), esportazione multiformatoPaddlePaddle
Focus sulla formazioneFacilità d'uso, memoria ridotta, ottimizzatore MuSGDAlta precisione, basato sulla configurazione
Attivitàdetect, segment, Pose, obb, classifyRileva (primario), altri tramite configurazioni separate

Ultralytics : la rivoluzione Edge-First

Ultralytics rappresenta un cambiamento paradigmatico nella YOLO . Eliminando la soppressione non massima (NMS) e la perdita focale di distribuzione (DFL), YOLO26 ottiene una pipeline di implementazione semplificata che è nativamente end-to-end. Questa scelta di progettazione riduce significativamente la variabilità della latenza, rendendola particolarmente potente per le applicazioni AI edge in cui il tempo di esecuzione prevedibile è fondamentale.

Innovazioni architettoniche fondamentali

L'architettura di YOLO26 è caratterizzata dall'attenzione all'efficienza e alla stabilità dell'addestramento:

  1. End-to-End NMS: a differenza dei rilevatori tradizionali che generano migliaia di riquadri candidati che richiedono un'elaborazione post-processing complessa, YOLO26 prevede direttamente l'insieme finale di oggetti. Questa innovazione, introdotta per la prima volta in YOLOv10, semplifica il processo di esportazione in formati come ONNX TensorRT.
  2. MuSGD Optimizer: Ispirato alle innovazioni nella formazione LLM di Kimi K2 di Moonshot AI, YOLO26 utilizza un ibrido di SGD e Muon. Ciò si traduce in una convergenza più rapida e in un training più stabile, anche con batch di dimensioni inferiori.
  3. ProgLoss + STAL: l'introduzione della Progressive Loss (ProgLoss) e della Soft-Target Anchor Loss (STAL) offre notevoli miglioramenti nel riconoscimento di oggetti di piccole dimensioni. Ciò è fondamentale per settori come l'agricoltura, dove il rilevamento di parassiti o colture distanti richiede un'elevata fedeltà.

Scopri di più su YOLO26

PP-YOLOE+: Il PaddlePaddle

PP-YOLOE+ è l'evoluzione di PP-YOLOv2, basato sul PaddlePaddle . Utilizza una filosofia senza ancoraggi per evitare la regolazione degli iperparametri associata alle caselle di ancoraggio. Integra una solida struttura portante (CSPRepResNet) e una testa efficiente (ET-head) per bilanciare velocità e precisione, in particolare sull'hardware supportato da PaddleLite.

Caratteristiche principali

  • CSPRepResNet Backbone: utilizza convoluzioni con kernel di grandi dimensioni per acquisire campi recettivi efficaci, migliorando le capacità di estrazione delle caratteristiche.
  • TAL (Task Alignment Learning): incorpora strategie dinamiche di assegnazione delle etichette per allineare le attività di classificazione e localizzazione durante l'addestramento.
  • Integrazione dell'ecosistema Paddle: profondamente integrato con strumenti come PaddleSlim per la quantizzazione, rendendolo una scelta eccellente per gli sviluppatori che già utilizzano lo stack software Baidu.

Benchmark delle prestazioni

La tabella seguente mette a confronto i modelli sul COCO . YOLO26 dimostra un'efficienza superiore, in particolare negli CPU dove la sua architettura riduce il sovraccarico fino al 43%.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Casi d'uso ideali e implementazione

La scelta tra questi modelli dipende spesso dall'hardware utilizzato e dalle preferenze relative al flusso di lavoro.

Quando scegliere Ultralytics

YOLO26 è progettato per gli sviluppatori che necessitano di versatilità e velocità. Il suo ingombro di memoria ridotto durante l'addestramento lo rende accessibile anche a chi non dispone di GPU di livello aziendale.

  • Dispositivi edge (Raspberry Pi, dispositivi mobili): la rimozione del DFL e il design NMS rendono YOLO26 la scelta ideale per CPU e NPU. Scopri come implementarlo in modo efficace sui dispositivi edge.
  • Analisi video in tempo reale: per il monitoraggio delle smart city, la latenza costante di YOLO26 garantisce che nessun fotogramma venga perso durante i picchi di traffico.
  • Progetti multimodali: se il tuo progetto richiede la stima della posa o i bounding box orientati (OBB) oltre al rilevamento standard, YOLO26 offre tutte queste funzionalità in un'unica libreria.

Quando scegliere PP-YOLOE+

  • PaddlePaddle : se il tuo ambiente di produzione è già basato su PaddleServing, continuare a utilizzare PP-YOLOE+ riduce al minimo le difficoltà di integrazione.
  • GPU lato server: PP-YOLOE+ può essere molto efficace in scenari ad alta produttività su NVIDIA quando ottimizzato con TensorRT PaddleInference, in particolare per l'elaborazione di immagini statiche.

Vantaggio dell'ecosistema

Ultralytics un'esperienza "Zero-to-Hero" senza soluzione di continuità. Con la Ultralytics , è possibile etichettare i dati, eseguire la formazione nel cloud e distribuire in qualsiasi formato (TFLite, ONNX, CoreML) senza scrivere complessi script di esportazione.

Metodologie di formazione: semplicità vs personalizzazione

L'esperienza di formazione differisce in modo significativo tra i due framework. Ultralytics la facilità d'uso e l'automazione, mentre PaddlePaddle richiede PaddlePaddle una gestione della configurazione più dettagliata.

Flusso di lavoro Ultralytics

L'addestramento di YOLO26 è semplificato a poche righe di Python o a un singolo CLI . Il framework gestisce automaticamente l'evoluzione degli iperparametri e i controlli dei set di dati.

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Questa semplicità si estende alla Ultralytics , dove è possibile gestire i set di dati e monitorare la formazione da remoto. L'ottimizzatore MuSGD lavora in background per garantire una convergenza più rapida del modello, consentendo di risparmiare sui costi di calcolo.

Flusso di lavoro della formazione PP-YOLOE+

L'addestramento di PP-YOLOE+ comporta in genere la modifica dei file di configurazione YAML all'interno del repository PaddleDetection. Sebbene flessibile, questo approccio può avere una curva di apprendimento più ripida per chi non ha familiarità con la sintassi specifica del sistema di configurazione di Paddle. Si basa in larga misura sul tradizionale SGD momentum e richiede la regolazione manuale dei programmi di apprendimento per ottenere risultati ottimali su set di dati personalizzati.

Versatilità e attività avanzate

Un importante elemento di differenziazione è l'ampiezza delle attività supportate fin da subito.

Ultralytics è un vero e proprio sistema di apprendimento multi-task. Oltre al rilevamento degli oggetti, include architetture specializzate per:

  • Segmentazione delle istanze: con perdita di segmentazione semantica e proto multiscala per maschere precise.
  • Stima della posa: utilizzo della stima della log-verosimiglianza residua (RLE) per una regressione accurata dei punti chiave.
  • OBB: Utilizzo di una perdita angolare specializzata per gestire oggetti ruotati nelle immagini aeree.

PP-YOLOE+ è principalmente un rilevatore di oggetti. Sebbene la libreria PaddleDetection supporti altre attività, spesso utilizza architetture di modelli completamente diverse (come Mask R-CNN per la segmentazione) anziché un'architettura unificata YOLO, complicando l'implementazione di pipeline multi-task.

Conclusione

Nel confronto tra YOLO26 e PP-YOLOE+, la scelta è chiara per la maggior parte degli scenari di sviluppo moderni. Mentre PP-YOLOE+ rimane una valida opzione per gli ecosistemi Baidu/Paddle esistenti, Ultralytics offre una soluzione più completa, efficiente e intuitiva.

Con il suo design end-to-end NMS, YOLO26 elimina i colli di bottiglia della post-elaborazione, offrendo CPU fino al 43% più veloce. In combinazione con il robusto Ultralytics e la capacità di gestire diverse attività come la segmentazione e la stima della posa, YOLO26 è la scelta consigliata per gli sviluppatori che desiderano rendere le loro applicazioni di visione artificiale a prova di futuro nel 2026.

Per chi fosse interessato a esplorare altri modelli, la Ultralytics tratta anche YOLO11 e RT-DETR, assicurandovi di avere lo strumento giusto per ogni sfida.

Dettagli YOLO26: Autori: Glenn Jocher e Jing Qiu
Organizzazione: Ultralytics
Data: 14/01/2026
GitHub: Ultralytics

Dettagli PP-YOLOE+: Autore: PaddlePaddle
Organizzazione: Baidu
Data: 2022-04-02
Arxiv: 2203.16250
GitHub: Repository PaddleDetection


Commenti