Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ vs YOLOv7#

Quando costruisci pipeline di computer vision, selezionare il modello di object detection corretto è fondamentale. Due architetture significative del 2022, PP-YOLOE+ e YOLOv7, hanno introdotto potenti progressi nell'object detection in tempo reale. Questo confronto tecnico offre uno sguardo approfondito alle loro architetture, alle metodologie di addestramento e alle prestazioni nel mondo reale per aiutarti a prendere decisioni informate per le tue applicazioni.

Link to this sectionPanoramica dei modelli#

Sia PP-YOLOE+ che YOLOv7 sono stati progettati per spingere i confini dell'accuratezza e della velocità, ma derivano da ecosistemi di sviluppo e filosofie di design differenti.

Link to this sectionPP-YOLOE+#

Sviluppato dagli autori di PaddlePaddle presso Baidu, PP-YOLOE+ si basa sull'originale PP-YOLOv2. È stato introdotto per fornire un detector di oggetti efficiente e altamente accurato, ottimizzato per l'ecosistema PaddlePaddle.

Scopri di più su PP-YOLOE+

Link to this sectionYOLOv7#

Sviluppato da Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao, YOLOv7 ha introdotto i "trainable bag-of-freebies" per stabilire nuovi benchmark allo stato dell'arte per i detector di oggetti in tempo reale al momento del suo rilascio.

Scopri di più su YOLOv7

Link to this sectionInnovazioni architettoniche#

Link to this sectionArchitettura di PP-YOLOE+#

PP-YOLOE+ si affida pesantemente a un paradigma anchor-free, rendendo il processo di deployment più semplice eliminando la necessità di ottimizzare le anchor box per dataset personalizzati. Incorpora un potente backbone RepResNet e una PAN (Path Aggregation Network) in stile CSPNet per un'efficace fusione delle feature multi-scala. Inoltre, sfrutta il concetto di Task Alignment Learning (TAL) per allineare dinamicamente i compiti di classificazione e localizzazione durante l'addestramento, garantendo un'elevata accuratezza attraverso vari task di computer vision.

Link to this sectionArchitettura di YOLOv7#

YOLOv7 ha adottato un approccio diverso introducendo l'Extended Efficient Layer Aggregation Network (E-ELAN). Questa architettura consente alla rete di apprendere feature più diversificate senza distruggere il percorso del gradiente originale, portando a una convergenza migliore. YOLOv7 utilizza anche pesantemente la ri-parametrizzazione del modello, specificamente, convoluzioni pianificate ri-parametrizzate, che fondono i livelli convoluzionali durante l'inferenza per velocizzare l'esecuzione senza sacrificare l'accuratezza. Questo rende YOLOv7 eccezionalmente forte in attività come il multi-object tracking e complessi sistemi di allarme di sicurezza.

Differenze nell'ecosistema

While PP-YOLOE+ is tightly integrated with Baidu's PaddlePaddle framework, YOLOv7 was built in PyTorch, which historically offers a larger community and broader out-of-the-box compatibility with deployment pipelines like ONNX and TensorRT.

Link to this sectionAnalisi delle prestazioni#

Quando si bilanciano velocità, parametri e accuratezza (mAP), i modelli si equivalgono a seconda della variante specifica e dell'hardware di destinazione. Di seguito è riportato un confronto completo delle loro metriche.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Sebbene il modello PP-YOLOE+x raggiunga un mAP leggermente superiore, le varianti di YOLOv7 offrono un rapporto parametri-accuratezza molto solido. L'architettura YOLOv7 rimane una delle preferite per l'elaborazione GPU pura, dove l'ottimizzazione TensorRT fornisce una latenza eccezionalmente bassa.

Link to this sectionIl vantaggio di Ultralytics#

Quando addestri e distribuisci questi modelli, il framework che scegli è importante tanto quanto il modello stesso. Utilizzare Ultralytics offre un'esperienza utente ottimizzata grazie a un'API Python altamente unificata che semplifica l'intero ciclo di vita del machine learning.

  • Ecosistema ben mantenuto: I modelli Ultralytics YOLO beneficiano di un ecosistema continuamente aggiornato, documentazione robusta e una comunità attiva.
  • Requisiti di memoria: Ultralytics ottimizza pesantemente il caricamento dei dati e i regimi di addestramento. L'addestramento dei modelli Ultralytics YOLO richiede tipicamente molta meno memoria CUDA rispetto alle pesanti architetture basate su Transformer, consentendo agli sviluppatori di utilizzare batch size più grandi su hardware di livello consumer.
  • Efficienza di addestramento: Sfruttando solide strategie di data augmentation e l'ottimizzazione degli iperparametri integrata, Ultralytics garantisce che i modelli convergano rapidamente con pesi pre-addestrati prontamente disponibili.

Link to this sectionImplementazione semplice dell'API#

Addestrare un modello YOLOv7 con Ultralytics richiede solo poche righe di codice, astraendo completamente complessi script di addestramento:

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

Link to this sectionIl nuovo standard: introduzione di YOLO26#

Sebbene PP-YOLOE+ e YOLOv7 siano pietre miliari nell'object detection, il panorama dell'IA si evolve rapidamente. Per qualsiasi nuovo progetto di computer vision, raccomandiamo vivamente Ultralytics YOLO26. Rilasciato a gennaio 2026, YOLO26 rappresenta un enorme salto in avanti nell'IA di visione edge-first.

Perché YOLO26 supera le architetture più vecchie:

  • Design end-to-end NMS-Free: YOLO26 è nativamente end-to-end. Eliminando il post-processing Non-Maximum Suppression (NMS), garantisce una latenza di inferenza prevedibile e deterministica: una svolta vista per la prima volta in YOLOv10.
  • Rimozione del DFL: La rimozione della Distribution Focal Loss semplifica il processo di esportazione e migliora significativamente la compatibilità per i dispositivi edge a basso consumo.
  • Inferenza CPU fino al 43% più veloce: Per scenari privi di GPU dedicate, come sensori IoT per smart city, YOLO26 è fortemente ottimizzato per essere eseguito in modo efficiente direttamente sulle CPU.
  • Ottimizzatore MuSGD: Ispirato alle tecniche avanzate di addestramento LLM (come Kimi K2 di Moonshot AI), YOLO26 utilizza un ibrido di SGD e Muon per un addestramento incredibilmente stabile e una convergenza rapida.
  • ProgLoss + STAL: Queste funzioni di perdita migliorate apportano notevoli guadagni nel rilevamento di piccoli oggetti, il che è vitale per casi d'uso come immagini aeree da droni e rilevamento di difetti di fabbricazione.

Scopri di più su YOLO26

Link to this sectionCasi d'uso ideali e scenari di distribuzione#

Link to this sectionQuando usare PP-YOLOE+#

PP-YOLOE+ brilla quando sei profondamente integrato nell'ecosistema Baidu e PaddlePaddle. Se il tuo obiettivo di deployment utilizza hardware specializzato adattato per i modelli Paddle (ad esempio, in alcune pipeline di produzione asiatiche), PP-YOLOE+ fornisce un'eccellente accuratezza e un'integrazione fluida. È altamente efficace per l'automazione della produzione industriale.

Link to this sectionQuando usare YOLOv7#

YOLOv7 rimane un'ottima scelta per l'inferenza generica ad alte prestazioni, in particolare quando si effettua il deployment su hardware NVIDIA utilizzando TensorRT. La sua integrazione nell'ecosistema PyTorch lo rende altamente versatile per la ricerca accademica e pipeline commerciali personalizzate, come il real-time crowd management o complessi task di pose estimation dove l'integrità strutturale della rete è fondamentale.

Link to this sectionAltri modelli da considerare#

A seconda delle tue esigenze esatte, potresti anche essere interessato a confrontare queste architetture con YOLO11 per un'ampia flessibilità pronta per la produzione, o RT-DETR se il tuo progetto richiede i vantaggi specifici dei vision transformer rispetto alle tradizionali reti convoluzionali.

Link to this sectionConclusione#

Sia PP-YOLOE+ che YOLOv7 hanno apportato miglioramenti significativi al mondo dell'object detection in tempo reale. Mentre PP-YOLOE+ eccelle in ambienti standardizzati attorno a PaddlePaddle, YOLOv7 offre un'incredibile flessibilità e prestazioni tramite gli ecosistemi PyTorch e Ultralytics.

Tuttavia, poiché le soluzioni di computer vision continuano ad avanzare, utilizzare strumenti moderni è essenziale. Adottando Ultralytics Platform e architetture di nuova generazione come YOLO26, gli sviluppatori possono garantire che le loro applicazioni rimangano all'avanguardia in termini di velocità, accuratezza e facilità d'uso.

Collaboratori

Commenti