Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ contro YOLOv6-3.0#

Il campo della computer vision in tempo reale si è espanso rapidamente, portando ad architetture altamente specializzate ottimizzate per diversi scenari di distribuzione. Gli sviluppatori confrontano spesso PP-YOLOE+ e YOLOv6-3.0 quando creano applicazioni che richiedono un equilibrio tra throughput elevato e accuratezza affidabile. Entrambi i modelli hanno apportato notevoli miglioramenti architettonici al momento del rilascio, concentrandosi sul miglioramento delle velocità di inferenza per applicazioni industriali e edge.

Prima di immergerti nelle analisi architettoniche dettagliate, esplora il grafico sottostante per visualizzare come questi modelli si comportano l'uno rispetto all'altro in termini di velocità e precisione.

Link to this sectionPP-YOLOE+: Punti di forza e debolezza architettonici#

Sviluppato dagli autori di PaddlePaddle, PP-YOLOE+ è un importante rilevatore anchor-free che si basa sui suoi predecessori per offrire prestazioni robuste in vari requisiti di scala.

Link to this sectionPunti salienti dell'architettura#

PP-YOLOE+ ha introdotto diversi miglioramenti critici rispetto al design originale di PP-YOLOE. Sfrutta una potente backbone CSPRepResNet, che bilancia in modo efficiente il costo computazionale con le capacità di estrazione delle feature. Inoltre, incorpora un'avanzata feature pyramid network (FPN) combinata con una Path Aggregation Network (PAN) per garantire la fusione delle feature multi-scala. Una delle sue caratteristiche distintive è l'ET-head (Efficient Task-aligned head), che migliora significativamente il coordinamento tra classificazione e localizzazione durante l'object detection.

Mentre PP-YOLOE+ raggiunge un'impressionante mean average precision (mAP), la sua dipendenza dall'ecosistema PaddlePaddle può talvolta presentare una ripida curva di apprendimento per i ricercatori abituati ai flussi di lavoro nativi di PyTorch. Questo può complicare leggermente il processo di distribuzione del modello quando si prendono di mira dispositivi edge eterogenei che mancano di supporto diretto per l'inferenza Paddle.

Contesto di distribuzione

PP-YOLOE+ è altamente ottimizzato per la distribuzione all'interno dello stack tecnologico di Baidu, rendendolo una scelta eccellente se il tuo ambiente di produzione si affida pesantemente agli strumenti di inferenza Paddle.

Scopri di più su PP-YOLOE+

Link to this sectionYOLOv6-3.0: Throughput Industriale#

Rilasciato dal Meituan Vision AI Department, YOLOv6-3.0 è stato progettato esplicitamente per fungere da rilevatore di oggetti di nuova generazione per applicazioni industriali, dando priorità al throughput massiccio su hardware GPU.

Link to this sectionPunti salienti dell'architettura#

YOLOv6-3.0 presenta una backbone EfficientRep specificamente progettata per massimizzare l'utilizzo dell'hardware, in particolare sulle GPU NVIDIA utilizzando TensorRT. L'aggiornamento v3.0 ha introdotto un modulo di Bi-directional Concatenation (BiC) nel neck, migliorando la conservazione delle feature spaziali senza gonfiare eccessivamente il numero di parametri. Inoltre, ha introdotto una strategia di Anchor-Aided Training (AAT) che unisce i vantaggi della stabilità basata su anchor durante l'addestramento del modello pur mantenendo un'architettura veloce e senza anchor durante l'inferenza in tempo reale.

Tuttavia, poiché YOLOv6-3.0 è altamente ottimizzato per GPU di livello server, i suoi guadagni di latenza talvolta diminuiscono quando viene distribuito su dispositivi edge fortemente vincolati, basati solo su CPU. Questa specializzazione significa che eccelle in ambienti come l'analisi video offline, ma potrebbe essere superato da modelli ottimizzati dinamicamente su hardware più piccoli e localizzati.

Scopri di più su YOLOv6

Link to this sectionTabella di confronto delle prestazioni#

La seguente tabella evidenzia le principali metriche di prestazione, confrontando direttamente le diverse varianti di scala di entrambe le architetture.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra PP-YOLOE+ e YOLOv6 dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere PP-YOLOE+#

PP-YOLOE+ è una scelta valida per:

  • Integrazione con l'Ecosistema PaddlePaddle: Organizzazioni con infrastrutture esistenti costruite sul framework e sugli strumenti di Baidu PaddlePaddle.
  • Deployment su Edge con Paddle Lite: Deployment su hardware con kernel di inferenza altamente ottimizzati specificamente per il motore Paddle Lite o Paddle.
  • Rilevamento ad alta precisione lato server: Scenari che danno priorità alla massima precisione di rilevamento su potenti server GPU dove la dipendenza dal framework non rappresenta un problema.

Link to this sectionQuando scegliere YOLOv6#

YOLOv6 è consigliato per:

  • Deployment industriale consapevole dell'hardware: Scenari in cui il design consapevole dell'hardware del modello e l'efficiente riparametrizzazione forniscono prestazioni ottimizzate su specifici hardware target.
  • Rilevamento single-stage rapido: Applicazioni che danno priorità alla velocità di inferenza grezza su GPU per l'elaborazione video in tempo reale in ambienti controllati.
  • Integrazione nell'ecosistema Meituan: Team che lavorano già all'interno dello stack tecnologico e dell'infrastruttura di deployment di Meituan.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionIl vantaggio di Ultralytics: andare oltre i modelli legacy#

Mentre PP-YOLOE+ e YOLOv6-3.0 offrono soluzioni mirate, lo sviluppo moderno di IA richiede flussi di lavoro versatili ed efficienti in termini di memoria. È qui che la piattaforma Ultralytics offre un'esperienza per gli sviluppatori senza pari. Con un'API Python unificata, puoi addestrare, convalidare e distribuire modelli all'avanguardia senza l'enorme sovraccarico di configurazione tipicamente presente nei repository di ricerca più vecchi.

Ultralytics models natively support a wide array of vision tasks beyond standard detection, including instance segmentation, pose estimation, image classification, and Oriented Bounding Box (OBB) extraction. Furthermore, they are highly optimized for lower memory usage during training—a stark contrast to transformer-based models like RT-DETR which generally demand massive GPU VRAM allocations.

Link to this sectionScopri YOLO26: Il nuovo standard#

Per le organizzazioni che cercano di distribuire i migliori modelli di visione all'avanguardia, Ultralytics YOLO26 (rilasciato a gennaio 2026) ridefinisce i confini delle prestazioni. Supera significativamente le generazioni precedenti con diverse innovazioni critiche:

  • Design end-to-end senza NMS: basandosi sui concetti di YOLOv10, YOLO26 elimina completamente il post-processing Non-Maximum Suppression (NMS). Questo approccio nativamente end-to-end garantisce un'inferenza prevedibile e a latenza ultra-bassa, cruciale per i sistemi di sicurezza in tempo reale.
  • Inferenza CPU fino al 43% più veloce: attraverso la rimozione della Distribution Focal Loss (DFL) dall'architettura, YOLO26 è radicalmente ottimizzato per l'edge computing e gli ambienti privi di accelerazione GPU dedicata.
  • Ottimizzatore MuSGD: integrando la stabilità dell'addestramento LLM nei modelli di visione, questo ottimizzatore ibrido (ispirato a Moonshot AI) consente una convergenza rapida e sessioni di addestramento personalizzato altamente stabili.
  • ProgLoss + STAL: queste formulazioni avanzate della loss offrono notevoli miglioramenti nel riconoscimento di piccoli oggetti, fondamentale per applicazioni come immagini di droni aerei e analisi di scene affollate.
Rendi le tue pipeline a prova di futuro

Se stai costruendo un nuovo progetto oggi, ti consigliamo vivamente di evitare le architetture legacy e adottare YOLO26. La sua efficienza di memoria e la velocità senza NMS lo rendono significativamente più facile da portare in produzione.

Link to this sectionImplementazione senza interruzioni#

L'addestramento e l'esportazione di modelli all'avanguardia utilizzando il pacchetto Python di Ultralytics è straordinariamente semplice. Il seguente esempio mostra come addestrare l'ultimo modello YOLO26 ed esportarlo in ONNX per una rapida distribuzione edge:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

Per i team profondamente integrati in flussi di lavoro meno recenti ma che cercano stabilità moderna, esplorare Ultralytics YOLO11 è anche un eccellente passo di transizione, offrendo una versatilità completa nelle attività supportata dall'intero ecosistema Ultralytics.

Contributori

Commenti