Vai al contenuto

PP-YOLOE+ vs YOLO26: Rilevamento di oggetti all'avanguardia

Nel panorama in rapida evoluzione della visione artificiale, la scelta dell'architettura di rilevamento degli oggetti più adeguata è fondamentale per garantire un equilibrio tra precisione, velocità e facilità di implementazione. Questo confronto prende in esame PP-YOLOE+, una versione perfezionata di PP-YOLOE di PaddlePaddle, e YOLO26, l'ultima innovazione ottimizzata per l'edge computing di Ultralytics. Entrambi i modelli rappresentano traguardi significativi nel campo del rilevamento in tempo reale, ma sono adatti a ecosistemi e esigenze di implementazione diversi.

Confronto delle prestazioni visive

Il grafico seguente illustra i compromessi in termini di prestazioni tra PP-YOLOE+ e YOLO26, evidenziando i progressi in termini di latenza e precisione ottenuti dalla nuova architettura.

Panoramica del modello

PP-YOLOE+

PP-YOLOE+ è una versione aggiornata di PP-YOLOE, sviluppata dal PaddlePaddle di Baidu. Si basa sul paradigma anchor-free, introducendo un'architettura unificata cloud-edge che funziona bene su varie piattaforme hardware. Si concentra sull'ottimizzazione del compromesso tra precisione e velocità di inferenza, in particolare all'interno PaddlePaddle .

Scopri di più su PP-YOLOE+

YOLO26

YOLO26 è l'ultima versione della YOLO di Ultralytics, progettata per ridefinire l'efficienza dell'edge computing. Rilasciata nel gennaio 2026, introduce un'architettura nativa end-to-end NMS, eliminando la necessità della post-elaborazione Non-Maximum Suppression. Con importanti ottimizzazioni come la rimozione della Distribution Focal Loss (DFL) e l'introduzione dell'ottimizzatore MuSGD, YOLO26 è progettato specificamente per l'inferenza ad alta velocità su CPU e dispositivi a bassa potenza.

Scopri di più su YOLO26

Architettura tecnica e innovazione

Le differenze architetturali tra questi due modelli ne determinano l'idoneità per compiti specifici.

Architettura di PP-YOLOE+

PP-YOLOE+ utilizza una struttura CSPRepResNet e una rete piramidale di caratteristiche (FPN) con una rete di aggregazione dei percorsi (PAN) per la fusione di caratteristiche multiscala. Le innovazioni principali includono:

  • Progettazione senza ancoraggio: elimina la regolazione degli iperparametri dell'anchor box, semplificando il processo di formazione.
  • Task Alignment Learning (TAL): allinea in modo esplicito le attività di classificazione e localizzazione, migliorando la qualità della selezione dei campioni positivi.
  • ET-Head: una testa efficiente e allineata alle attività che riduce il sovraccarico computazionale mantenendo la precisione.

Tuttavia, PP-YOLOE+ si basa sulla tradizionale NMS , che può introdurre una variabilità della latenza a seconda del numero di oggetti rilevati in una scena.

YOLO26 Innovazione

YOLO26 rappresenta un cambiamento di paradigma verso il rilevamento end-to-end.

  • ProgettazioneNMS: generando rigorosamente una sola previsione per oggetto, YOLO26 elimina completamente la NMS . Ciò è fondamentale per l'implementazione su dispositivi edge in cui la logica di post-elaborazione può rappresentare un collo di bottiglia.
  • MuSGD Optimizer: ispirato all'addestramento dei modelli linguistici di grandi dimensioni (LLM), questo ibrido di SGD Muon (da Moonshot AI) stabilizza l'addestramento e accelera la convergenza.
  • ProgLoss + STAL: l'integrazione di Progressive Loss e Soft Task Alignment Loss migliora significativamente le prestazioni nel rilevamento di oggetti di piccole dimensioni, una sfida comune nell'imaging aereo e nella robotica.
  • Rimozione DFL: la rimozione della perdita focale di distribuzione semplifica il grafico del modello, facilitando l'esportazione in formati come ONNX e TFLite più pulite e compatibili con diversi acceleratori hardware.

Stabilità dell'allenamento con MuSGD

L'ottimizzatore MuSGD in YOLO26 porta la stabilità dell'addestramento LLM nella visione artificiale. Gestendo in modo adattivo lo slancio e i gradienti, riduce la necessità di un'ampia regolazione degli iperparametri, consentendo agli utenti di raggiungere una precisione ottimale in un numero inferiore di epoche rispetto allo SGD standard SGD AdamW.

Metriche di performance

La tabella seguente mette a confronto le prestazioni di PP-YOLOE+ e YOLO26 sul set COCO .

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Punti chiave:

  1. Efficienza: i modelli YOLO26 richiedono costantemente meno FLOP e parametri per una maggiore precisione. Ad esempio, YOLO26x raggiunge un impressionante 57,5 mAP con soli 55,7 milioni di parametri, mentre PP-YOLOE+x richiede 98,42 milioni di parametri per raggiungere 54,7 mAP.
  2. Velocità di inferenza: YOLO26 dimostra una velocità superiore sulle GPU (T4 TensorRT), con il modello Nano che raggiunge appena 1,7 ms. Anche CPU è notevole, offrendo CPU fino al 43% più veloce rispetto alle generazioni precedenti, rendendolo ideale per dispositivi senza acceleratori dedicati.
  3. Precisione: su tutte le scale, da Nano/Tiny a Extra Large, YOLO26 supera PP-YOLOE+ in mAP set COCO .

Ecosistema e facilità d'uso

Quando si sceglie un modello, l'ecosistema circostante è importante quanto i parametri grezzi.

Vantaggi dell'ecosistema Ultralytics

Ultralytics , compreso YOLO26, beneficiano di una piattaforma unificata e incentrata sull'utente.

  • API semplificata: Python coerente consente di passare senza soluzione di continuità dal rilevamento alla segmentazione, dalla stima della posa alla classificazione e all'OBB.
  • Ultralytics : la Ultralytics offre una soluzione senza codice per la gestione dei set di dati, l'etichettatura e la formazione con un solo clic nel cloud.
  • Documentazione: una documentazione completa e aggiornata frequentemente guida gli utenti in ogni fase, dall'installazione alla distribuzione su dispositivi edge come Raspberry Pi.
  • Efficienza della memoria: YOLO26 è progettato per essere efficiente in termini di memoria durante l'addestramento, consentendo batch di dimensioni maggiori su GPU di livello consumer rispetto alle alternative che richiedono molta memoria.

Ecosistema PaddlePaddle

PP-YOLOE+ è profondamente integrato PaddlePaddle Baidu PaddlePaddle . Sebbene potente, spesso richiede una toolchain specifica (PaddleDetection) che può avere una curva di apprendimento più ripida per gli utenti abituati a PyTorch. Eccelle in ambienti in cui l'integrazione PaddlePaddle (come i chip Baidu Kunlun) è una priorità.

Casi d'uso e applicazioni

Analisi in tempo reale dei dati periferici

Per le applicazioni in esecuzione su dispositivi edge come telecamere intelligenti o droni, YOLO26 è il chiaro vincitore. Il suo design end-to-end NMS garantisce una latenza prevedibile, fondamentale per i sistemi di sicurezza. Il numero ridotto di FLOP consente di funzionare in modo efficiente su hardware alimentato a batteria.

Automazione Industriale

In contesti produttivi che richiedono un'elevata precisione, come il controllo qualità, entrambi i modelli sono adeguati. Tuttavia, la funzione ProgLoss di YOLO26 migliora il rilevamento dei piccoli difetti, offrendo un vantaggio nell'individuazione di imperfezioni minime sulle linee di produzione.

Compiti visivi complessi

Mentre PP-YOLOE+ si concentra principalmente sul rilevamento, YOLO26 supporta una gamma più ampia di attività pronte all'uso.

Versatilità multi-tasking

A differenza di PP-YOLOE+, che richiede architetture di modelli diverse per compiti diversi, Ultralytics di cambiare semplicemente l'intestazione del compito. Ad esempio, passando a yolo26n-pose.pt consente immediatamente il rilevamento dei punti chiave con la stessa API familiare.

Esempio di Codice: Iniziare con YOLO26

L'addestramento e l'implementazione di YOLO26 sono incredibilmente semplici graziePython Ultralytics . Il seguente frammento di codice mostra come caricare un modello pre-addestrato ed eseguire l'inferenza su un'immagine.

from ultralytics import YOLO

# Load the nano version of YOLO26 (NMS-free, highly efficient)
model = YOLO("yolo26n.pt")

# Perform inference on a remote image
results = model("https://ultralytics.com/images/bus.jpg")

# Visualize the results
for result in results:
    result.show()  # Display predictions on screen
    result.save("output.jpg")  # Save annotated image to disk

Conclusione

Sia PP-YOLOE+ che YOLO26 rappresentano contributi significativi alla visione artificiale. PP-YOLOE+ rimane una scelta valida per i team che hanno già investito PaddlePaddle .

Tuttavia, per la stragrande maggioranza degli sviluppatori e dei ricercatori, Ultralytics offre un pacchetto superiore. La sua architettura end-to-end semplifica le pipeline di implementazione, mentre la sua accuratezza all'avanguardia e la velocità da record lo rendono il modello più versatile per il 2026. Insieme al solido supporto Ultralytics e a funzionalità come la Ultralytics , YOLO26 riduce significativamente il tempo che intercorre tra l'ideazione e la produzione.

Per gli utenti interessati ad altre architetture moderne, la documentazione copre anche eccellenti alternative come YOLO11 e l'architettura basata su trasformatori RT-DETR.


Commenti