Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs PP-YOLOE+#

Scegliere la giusta architettura di rete neurale è fondamentale per qualsiasi progetto moderno di visione artificiale. Quando sviluppatori e ricercatori valutano i modelli per il rilevamento di oggetti in tempo reale, la decisione spesso si riduce al bilanciamento tra precisione, velocità di inferenza e facilità di distribuzione. Questo confronto tecnico esamina YOLOv5 e PP-YOLOE+, esplorando le loro architetture, metriche di prestazione e metodologie di addestramento per aiutarti a selezionare la soluzione ottimale per la tua applicazione.

Link to this sectionComprendere le architetture#

Entrambi i modelli hanno avuto un impatto significativo sul panorama della visione artificiale, ma approcciano le sfide del rilevamento oggetti attraverso metodologie strutturali e dipendenze dai framework differenti.

Link to this sectionUltralytics YOLOv5: Lo standard del settore#

Rilasciato a metà 2020, Ultralytics YOLOv5 ha rivoluzionato l'accessibilità dei modelli di visione all'avanguardia. Essendo la prima implementazione nativa di PyTorch nella famiglia YOLO, ha abbassato drasticamente la barriera all'ingresso per gli sviluppatori Python e gli ingegneri ML in tutto il mondo.

Dettagli di YOLOv5:

YOLOv5 utilizza un backbone CSPDarknet modificato, che cattura in modo efficiente ricche rappresentazioni delle caratteristiche mantenendo un numero di parametri leggero. Ha introdotto le anchor box auto-apprendenti, calcolando automaticamente le dimensioni ottimali delle anchor per dataset personalizzati prima ancora che inizi l'addestramento. Inoltre, l'integrazione dell'aumento dei dati mosaic migliora significativamente la capacità del modello di rilevare oggetti più piccoli e generalizzare attraverso contesti spaziali complessi.

Uno dei maggiori punti di forza di YOLOv5 è la sua incredibile versatilità. A differenza dei rilevatori di oggetti standard, la famiglia YOLOv5 supporta perfettamente la classificazione delle immagini, la segmentazione delle istanze e il rilevamento di bounding box all'interno di un'API unificata. La sua architettura altamente ottimizzata si traduce anche in un utilizzo della memoria sostanzialmente inferiore durante l'addestramento e l'inferenza rispetto alle pesanti reti basate su Transformer.

Scopri di più su YOLOv5

Link to this sectionPP-YOLOE+: Il concorrente di PaddlePaddle#

Introdotto circa due anni dopo, PP-YOLOE+ si basa sulle fondamenta delle precedenti iterazioni di PP-YOLO. Sviluppato per mostrare le capacità del framework di deep learning di Baidu, introduce diversi affinamenti architetturali per aumentare la precisione media (mAP).

Dettagli PP-YOLOE+:

PP-YOLOE+ si affida a un paradigma senza anchor e utilizza un backbone CSPRepResNet. Incorpora una potente tecnica di Task Alignment Learning e un Efficient Task-aligned Head per migliorare la precisione. Sebbene PP-YOLOE+ raggiunga punteggi di precisione impressionanti, la sua debolezza principale risiede nella sua rigida dipendenza dal framework PaddlePaddle. Questo spesso introduce una ripida curva di apprendimento e attriti nell'ecosistema per i team di ricerca e le aziende già profondamente investiti in ambienti PyTorch o TensorFlow.

Scopri di più su PP-YOLOE+

Link to this sectionPrestazioni e benchmark#

Quando valuti questi modelli per la produzione, è fondamentale comprendere i compromessi tra precisione, velocità di inferenza e ingombro dei parametri. La tabella sottostante delinea le principali metriche di prestazione tra le diverse varianti di dimensione.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Mentre PP-YOLOE+ raggiunge alti limiti di precisione, YOLOv5 dimostra costantemente una superiore efficienza dei parametri e un'inferenza più rapida su hardware vincolato. Per le distribuzioni edge dove la memoria è scarsa, YOLOv5n offre una velocità senza pari e un ingombro estremamente ridotto.

Efficienza della memoria

I modelli Ultralytics sono progettati specificamente per l'efficienza dell'addestramento. Rispetto ai pesanti Vision Transformer come RT-DETR, YOLOv5 utilizza molta meno memoria CUDA, consentendoti di addestrare su batch size maggiori o hardware di tipo consumer.

Link to this sectionIl vantaggio di Ultralytics: Ecosistema e facilità d'uso#

Il vero valore di un'architettura di apprendimento automatico va oltre i numeri puri; comprende l'intera esperienza dello sviluppatore. La Piattaforma Ultralytics e i relativi strumenti open-source forniscono un ecosistema altamente raffinato e ben mantenuto che accelera drasticamente i cicli di sviluppo.

  • Facilità d'uso: Ultralytics astrae il complesso codice boilerplate. Puoi addestrare, convalidare e testare i modelli tramite un'intuitiva API Python o CLI.
  • Flessibilità di distribuzione: Esportare i modelli è incredibilmente semplice. Con un singolo comando, puoi convertire i tuoi pesi YOLOv5 addestrati in formati come ONNX, TensorRT o OpenVINO, garantendo un'ampia compatibilità tra ambienti edge e cloud.
  • Community attiva: La vivace community garantisce aggiornamenti frequenti, un'ampia documentazione e soluzioni solide alle sfide comuni della visione artificiale.

Al contrario, PP-YOLOE+ si affida pesantemente a file di configurazione complessi specifici per PaddleDetection, che possono rallentare la prototipazione rapida e complicare l'integrazione nelle moderne pipeline MLOps.

Link to this sectionImplementazioni pratiche ed esempi di codice#

Iniziare con Ultralytics è straordinariamente semplice. Ecco un esempio completo ed eseguibile di come caricare un modello YOLOv5 pre-addestrato, addestrarlo su un dataset personalizzato ed esportare i risultati:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Link to this sectionCasi d'uso e raccomandazioni#

La scelta tra YOLOv5 e PP-YOLOE+ dipende dai requisiti specifici del tuo progetto, dai vincoli di distribuzione e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv5#

YOLOv5 è una scelta solida per:

  • Sistemi di produzione comprovati: Deployment esistenti in cui sono apprezzati la lunga storia di stabilità, l'ampia documentazione e il massiccio supporto della comunità di YOLOv5.
  • Addestramento con risorse limitate: Ambienti con risorse GPU limitate in cui la pipeline di addestramento efficiente e i minori requisiti di memoria di YOLOv5 sono vantaggiosi.
  • Ampio supporto di formati di esportazione: Progetti che richiedono il deployment su molti formati, inclusi ONNX, TensorRT, CoreML e TFLite.

Link to this sectionQuando scegliere PP-YOLOE+#

PP-YOLOE+ è consigliato per:

  • Integrazione con l'Ecosistema PaddlePaddle: Organizzazioni con infrastrutture esistenti costruite sul framework e sugli strumenti di Baidu PaddlePaddle.
  • Deployment su Edge con Paddle Lite: Deployment su hardware con kernel di inferenza altamente ottimizzati specificamente per il motore Paddle Lite o Paddle.
  • Rilevamento ad alta precisione lato server: Scenari che danno priorità alla massima precisione di rilevamento su potenti server GPU dove la dipendenza dal framework non rappresenta un problema.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionModelli alternativi all'avanguardia da considerare#

Sebbene YOLOv5 sia uno standard robusto e collaudato, il campo della visione artificiale si muove rapidamente. Per i team che iniziano nuovi progetti, consigliamo vivamente di esplorare le nostre architetture più recenti.

Link to this sectionUltralytics YOLO26#

Rilasciato nel gennaio 2026, YOLO26 rappresenta l'apice assoluto della nostra ricerca. Offre miglioramenti massicci sia nella precisione che nella velocità. Le innovazioni chiave includono:

  • Design end-to-end senza NMS: Basandosi sui concetti di YOLOv10, YOLO26 elimina nativamente il post-processing di Non-Maximum Suppression (NMS), riducendo la latenza e semplificando la logica di distribuzione.
  • Rimozione DFL: Eliminando la Distribution Focal Loss, YOLO26 ottiene un'inferenza CPU fino al 43% più veloce, rendendolo incredibilmente potente per dispositivi edge a basso consumo.
  • Ottimizzatore MuSGD: Ispirato alle tecniche avanzate di addestramento LLM, questo ibrido di SGD e Muon garantisce cicli di addestramento eccezionalmente stabili e una convergenza più rapida.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate offrono notevoli miglioramenti nel riconoscimento di piccoli oggetti, fondamentale per immagini da droni e agricoltura intelligente.

Inoltre, potresti prendere in considerazione YOLO11, che offre prestazioni eccellenti e funge da ponte altamente affidabile tra i sistemi legacy e le capacità all'avanguardia di YOLO26.

Link to this sectionCasi d'uso nel mondo reale#

La scelta tra YOLOv5 e PP-YOLOE+ dipende in ultima analisi dal tuo ambiente di distribuzione e dai vincoli del progetto.

Applicazioni ideali per YOLOv5: I requisiti minimi di risorse e l'incredibile facilità d'uso di YOLOv5 lo rendono la scelta principale per l'Edge AI. Eccelle in applicazioni che richiedono frame rate elevati su hardware limitato, come robotica in tempo reale, integrazione in applicazioni mobili e sistemi di monitoraggio del traffico multi-camera. La sua capacità di gestire simultaneamente attività di stima della posa e oriented bounding box (OBB) all'interno dello stesso framework lo rende altamente adattabile.

Applicazioni ideali per PP-YOLOE+: PP-YOLOE+ è più adatto per scenari in cui la precisione assoluta massima su immagini statiche ha la priorità rispetto ai vincoli di elaborazione in tempo reale. Trova un utilizzo di nicchia nelle pipeline di ispezione industriale, in particolare all'interno dei settori manifatturieri asiatici che hanno stack tecnici prestabiliti pesantemente investiti nell'ecosistema Baidu e PaddlePaddle.

In sintesi, mentre PP-YOLOE+ offre forti benchmark di precisione, i modelli YOLO di Ultralytics forniscono una combinazione impareggiabile di equilibrio delle prestazioni, distribuzione senza problemi e design intuitivo per lo sviluppatore che guida progetti di visione artificiale di successo dal concetto alla produzione.

Contributori

Commenti