Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 vs PP-YOLOE+: un confronto completo sui rilevatori in tempo reale#

Quando valuti modelli di visione artificiale all'avanguardia per pipeline di produzione, spesso confronti i vantaggi di diverse architetture. Due modelli degni di nota nel panorama del rilevamento oggetti sono YOLOv7 e PP-YOLOE+. Questa guida fornisce un confronto tecnico dettagliato delle loro architetture, metriche di performance e scenari di distribuzione ideali per aiutarti a prendere una decisione informata per il tuo prossimo progetto di visione artificiale.

Link to this sectionInnovazioni architettoniche#

Comprendere le differenze strutturali fondamentali tra questi modelli è cruciale per prevedere come si comporteranno durante l'addestramento e l'inferenza.

Link to this sectionPunti salienti dell'architettura di YOLOv7#

YOLOv7 ha introdotto diversi progressi chiave progettati per migliorare la precisione senza aumentare drasticamente i costi di inferenza.

  • Extended Efficient Layer Aggregation Networks (E-ELAN): questa architettura controlla i percorsi del gradiente più brevi e più lunghi. In questo modo, consente alla rete di apprendere caratteristiche più diversificate e migliora la capacità di apprendimento complessiva senza distruggere il percorso del gradiente originale.
  • Strategie di scaling del modello: YOLOv7 impiega uno scaling del modello composto, regolando profondità e larghezza simultaneamente mentre concatena i livelli per mantenere una struttura architettonica ottimale tra diverse dimensioni.
  • Trainable Bag-of-Freebies: gli autori hanno integrato un metodo di convoluzione riparametrizzato (RepConv) senza connessioni identity, che migliora significativamente la velocità di inferenza senza compromettere la potenza predittiva del modello.

Dettagli YOLOv7: Autori: Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao Organizzazione: Institute of Information Science, Academia Sinica, Taiwan Data: 2022-07-06 Arxiv: https://arxiv.org/abs/2207.02696

Scopri di più su YOLOv7

Link to this sectionPunti salienti dell'architettura di PP-YOLOE+#

Sviluppato da Baidu all'interno dell'ecosistema PaddlePaddle, PP-YOLOE+ si basa sul suo predecessore, PP-YOLOv2, concentrandosi fortemente su metodologie anchor-free e rappresentazioni delle caratteristiche migliorate.

  • Design anchor-free: a differenza degli approcci basati su anchor, questo design semplifica la testina di predizione e riduce il numero di iperparametri, rendendo il modello più facile da regolare per set di dati personalizzati.
  • Backbone CSPRepResNet: questo backbone incorpora connessioni residuali e reti Cross Stage Partial per migliorare le capacità di estrazione delle caratteristiche mantenendo l'efficienza computazionale.
  • Task Alignment Learning (TAL): PP-YOLOE+ utilizza ET-head (Efficient Task-aligned head) per allineare meglio i compiti di classificazione e localizzazione, affrontando un collo di bottiglia comune nei rilevatori a singolo stadio.

Dettagli PP-YOLOE+: Autori: PaddlePaddle Authors Organizzazione: Baidu Data: 2022-04-02 Arxiv: https://arxiv.org/abs/2203.16250

Scopri di più su PP-YOLOE+

Link to this sectionMetriche di prestazione e benchmark#

Scegliere il modello giusto dipende spesso dai vincoli specifici del tuo hardware e dai requisiti di latenza. La tabella sottostante illustra i compromessi tra precisione (mAP), velocità e complessità del modello.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOP
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Link to this sectionAnalisi dei risultati#

  • Scenari ad alta precisione: YOLOv7x dimostra prestazioni elevate, raggiungendo un mAP elevato competitivo per compiti di rilevamento complessi. Sebbene PP-YOLOE+x scali leggermente di più nel mAP, lo fa con un aumento sostanziale di parametri e FLOP.
  • Efficienza e velocità: le varianti più piccole di PP-YOLOE+ (t e s) offrono velocità TensorRT estremamente basse, rendendole altamente adatte per distribuzioni edge in cui i vincoli hardware sono rigorosi.
  • Il punto ottimale: YOLOv7l fornisce un equilibrio convincente, offrendo oltre il 51% di mAP pur mantenendo un tempo di inferenza inferiore a 7ms su GPU T4, rendendolo una scelta robusta per le normali applicazioni server in tempo reale.
Ottimizzazione per la produzione

Quando distribuisci questi modelli, sfruttare formati di esportazione come TensorRT o ONNX può ridurre significativamente la latenza rispetto all'inferenza nativa PyTorch.

Link to this sectionIl vantaggio di Ultralytics#

Sebbene sia YOLOv7 che PP-YOLOE+ offrano forti prestazioni di benchmark, l'esperienza di sviluppo e il supporto dell'ecosistema sono altrettanto critici per il successo del progetto.

Link to this sectionEsperienza utente semplificata#

I modelli Ultralytics danno priorità alla facilità d'uso tramite un'API Python unificata. A differenza di PP-YOLOE+, che richiede di navigare nell'ecosistema PaddlePaddle e nei suoi specifici file di configurazione, Ultralytics ti consente di passare dall'addestramento alla distribuzione senza problemi.

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolov7.pt")

# Train the model effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export for optimized deployment
model.export(format="engine")  # TensorRT export

Link to this sectionEfficienza delle risorse#

Un punto di forza maggiore dei modelli Ultralytics YOLO sono i loro requisiti di memoria inferiori durante l'addestramento e l'inferenza. Questa efficienza consente a ricercatori e sviluppatori di utilizzare batch size maggiori su hardware di livello consumer, accelerando il processo di addestramento rispetto a modelli più pesanti o complesse architetture Transformer come RT-DETR.

Link to this sectionEcosistema e versatilità#

L'ecosistema Ultralytics è eccezionalmente ben mantenuto, caratterizzato da aggiornamenti frequenti, documentazione estesa e supporto nativo per diversi compiti oltre al rilevamento standard. Con Ultralytics, un singolo framework supporta segmentazione di istanze, stima della posa, classificazione e Oriented Bounding Boxes (OBB), fornendo una versatilità impareggiabile che spesso manca ai modelli concorrenti.

Link to this sectionIl futuro della Vision AI: YOLO26#

Poiché la visione artificiale si evolve rapidamente, sono emerse architetture più recenti che ridefiniscono gli standard di velocità ed efficienza. Rilasciato a gennaio 2026, Ultralytics YOLO26 rappresenta l'apice di questa evoluzione ed è la scelta altamente raccomandata per tutti i nuovi progetti.

Principali innovazioni di YOLO26:

  • Design end-to-end NMS-Free: YOLO26 elimina il post-elaborazione Non-Maximum Suppression (NMS). Questo approccio nativamente end-to-end semplifica drasticamente la logica di distribuzione e riduce la latenza variabile, una svolta introdotta per la prima volta in YOLOv10.
  • Performance edge senza precedenti: rimuovendo la Distribution Focal Loss (DFL), YOLO26 raggiunge un'inferenza CPU fino al 43% più veloce, rendendolo superiore per IoT e dispositivi edge rispetto alle generazioni precedenti.
  • Dinamiche di addestramento avanzate: l'integrazione dell'ottimizzatore MuSGD—ispirato alle innovazioni LLM come Kimi K2 di Moonshot AI—garantisce un addestramento più stabile e una convergenza più rapida.
  • Rilevamento superiore di piccoli oggetti: le funzioni di perdita migliorate, specificamente ProgLoss + STAL, affrontano le debolezze storiche nel riconoscimento di piccoli oggetti, cruciali per applicazioni come immagini aeree.

Link to this sectionApplicazioni nel mondo reale#

Scegliere tra queste architetture dipende spesso dall'ambiente di distribuzione specifico.

Link to this sectionQuando scegliere PP-YOLOE+#

  • Integrazione PaddlePaddle: se la tua infrastruttura è già profondamente integrata con l'ecosistema PaddlePaddle di Baidu, PP-YOLOE+ fornisce una soluzione nativa.
  • Ispezione industriale in Asia: spesso utilizzato nei centri manifatturieri asiatici dove gli stack hardware e software sono preconfigurati per gli strumenti di Baidu.

Link to this sectionQuando scegliere YOLOv7#

  • Sistemi accelerati da GPU: funziona eccezionalmente bene su GPU di livello server per attività che richiedono un throughput elevato, come video analytics.
  • Integrazione robotica: ideale per integrare la visione artificiale nella robotica, consentendo un rapido processo decisionale in ambienti dinamici.
  • Ricerca accademica: ampiamente supportato e frequentemente utilizzato come base affidabile nella ricerca basata su PyTorch.

Mentre i modelli più vecchi mantengono un significato storico, il passaggio ad architetture moderne come YOLO26 o YOLO11 tramite la Piattaforma Ultralytics garantisce l'accesso alle ultime ottimizzazioni, ai flussi di lavoro di addestramento più semplici e al più ampio supporto multi-task disponibile oggi.

Collaboratori

Commenti