Confronto tra modelli: scegli il modello di rilevamento oggetti migliore per il tuo progetto
Scegliere il modello di object detection giusto è fondamentale per il successo del tuo progetto di computer vision. Benvenuto nell'Ultralytics Hub di confronto modelli! Questa pagina centralizza confronti tecnici dettagliati tra modelli di object detection all'avanguardia, concentrandosi sulle ultime versioni di Ultralytics YOLO insieme ad altre architetture leader come RTDETR, EfficientDet e altro.
Il nostro obiettivo è fornirti le informazioni necessarie per selezionare il modello ottimale in base alle tue esigenze specifiche, sia che tu dia la priorità alla massima precisione, alla velocità di inferenza in tempo reale, all'efficienza computazionale o a un equilibrio tra questi. Miriamo a fornire chiarezza su come ogni modello si comporta e dove risiedono i suoi punti di forza, aiutandoti a orientarti nel complesso panorama del rilevamento di oggetti.
Ottieni una rapida panoramica delle prestazioni del modello con il nostro grafico interattivo di benchmark:
Questo grafico visualizza le principali metriche di performance come la mAP (precisione media media) rispetto alla latenza di inferenza, aiutandoti a valutare rapidamente i compromessi tra diversi modelli spesso valutati su set di dati standard come COCO. Comprendere questi compromessi è fondamentale per selezionare un modello che non solo soddisfi i criteri di performance, ma si allinei anche ai vincoli di implementazione.
Approfondisci con le nostre pagine di confronto specifiche. Ogni analisi copre:
- Differenze Architetturali: Comprendere i principi di design fondamentali, come il backbone e gli head di rilevamento, e le innovazioni. Ciò include l'esame di come diversi modelli affrontano l'estrazione e la previsione delle feature.
- Benchmark delle prestazioni: Confronta metriche come accuratezza (mAP), velocità (FPS, latenza) e numero di parametri utilizzando strumenti come la modalità Benchmark di Ultralytics. Questi benchmark forniscono dati quantitativi a supporto del tuo processo decisionale.
- Punti di forza e debolezze: Identifica dove eccelle ogni modello e i suoi limiti in base agli approfondimenti della valutazione. Questa valutazione qualitativa aiuta a comprendere le implicazioni pratiche della scelta di un modello rispetto a un altro.
- Casi d'uso ideali: Determina gli scenari per cui ciascun modello è più adatto, dai dispositivi edge AI alle piattaforme cloud. Esplora le varie Soluzioni Ultralytics per trovare ispirazione. Allineare le capacità del modello alle esigenze specifiche del tuo progetto garantisce risultati ottimali.
Questa ripartizione dettagliata ti aiuta a valutare i pro e i contro per trovare il modello che si adatta perfettamente alle esigenze del tuo progetto, sia per l'implementazione su dispositivi edge, l'implementazione cloud o la ricerca utilizzando framework come PyTorch. La scelta del modello può influire in modo significativo sull'efficienza e l'efficacia della tua applicazione di computer vision.
Guarda: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8 🎉
Utilizza gli elenchi sottostanti per navigare direttamente al confronto desiderato. Li abbiamo organizzati per modello per un facile accesso:
YOLO11 vs
YOLO11, l'ultima iterazione di Ultralytics, si basa sul successo dei suoi predecessori incorporando ricerca all'avanguardia e feedback della comunità. Presenta miglioramenti come un'architettura backbone e neck migliorata per una migliore estrazione delle caratteristiche, un'efficienza ottimizzata per un'elaborazione più rapida e una maggiore precisione con meno parametri. YOLO11 supporta un'ampia gamma di attività di computer vision tra cui il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, la stima della posa e il rilevamento di oggetti orientati, rendendolo altamente adattabile a vari ambienti.
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv9
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv7
- YOLO11 vs YOLOv6-3.0
- YOLO11 vs YOLOv5
- YOLO11 vs PP-YOLOE+
- YOLO11 vs DAMO-YOLO
- YOLO11 vs YOLOX
- YOLO11 vs RT-DETR
- YOLO11 vs EfficientDet
YOLOv10 vs
YOLOv10, sviluppato dai ricercatori della Tsinghua University utilizzando il pacchetto Ultralytics python, introduce un approccio innovativo al rilevamento di oggetti in tempo reale eliminando la soppressione non massima (NMS) e ottimizzando l'architettura del modello. Ciò si traduce in prestazioni all'avanguardia con un overhead computazionale ridotto e un miglior compromesso tra accuratezza e latenza. Le caratteristiche principali includono l'addestramento NMS-free per una latenza ridotta, l'estrazione di feature avanzata con convoluzioni large-kernel e varianti di modello versatili per diverse esigenze applicative.
- YOLOv10 contro YOLO11
- YOLOv10 contro YOLOv9
- YOLOv10 contro YOLOv8
- YOLOv10 contro YOLOv7
- YOLOv10 contro YOLOv6-3.0
- YOLOv10 contro YOLOv5
- YOLOv10 vs PP-YOLOE+
- YOLOv10 vs DAMO-YOLO
- YOLOv10 contro YOLOX
- YOLOv10 contro RT-DETR
- YOLOv10 vs EfficientDet
YOLOv9 vs
YOLOv9 introduce il Programmable Gradient Information (PGI) e la Generalized Efficient Layer Aggregation Network (GELAN) per affrontare la perdita di informazioni nelle reti neurali profonde. Sviluppato da un team open-source separato che sfrutta la codebase YOLOv5 di Ultralytics, YOLOv9 mostra miglioramenti significativi in termini di efficienza, precisione e adattabilità, soprattutto per i modelli leggeri. PGI aiuta a mantenere i dati essenziali tra i livelli, mentre GELAN ottimizza l'uso dei parametri e l'efficienza computazionale.
- YOLOv9 vs YOLO11
- YOLOv9 vs YOLOv10
- YOLOv9 vs YOLOv8
- YOLOv9 vs YOLOv7
- YOLOv9 vs YOLOv6-3.0
- YOLOv9 vs YOLOv5
- YOLOv9 vs PP-YOLOE+
- YOLOv9 vs DAMO-YOLO
- YOLOv9 vs YOLOX
- YOLOv9 vs RT-DETR
- YOLOv9 vs EfficientDet
YOLOv8 vs
Ultralytics YOLOv8 si basa sui successi delle versioni precedenti di YOLO, offrendo prestazioni, flessibilità ed efficienza migliorate. È dotato di architetture backbone e neck avanzate, un head Ultralytics split senza ancore per una migliore precisione e un tradeoff precisione-velocità ottimizzato, adatto a diverse attività di rilevamento oggetti in tempo reale. YOLOv8 supporta una varietà di attività di visione artificiale, tra cui il rilevamento di oggetti, la segmentazione di istanze, il rilevamento di pose/keypoints, il rilevamento di oggetti orientati e la classificazione.
- YOLOv8 contro YOLO11
- YOLOv8 contro YOLOv10
- YOLOv8 contro YOLOv9
- YOLOv8 contro YOLOv7
- YOLOv8 contro YOLOv6-3.0
- YOLOv8 contro YOLOv5
- YOLOv8 vs PP-YOLOE+
- YOLOv8 vs DAMO-YOLO
- YOLOv8 contro YOLOX
- YOLOv8 vs RT-DETR
- YOLOv8 vs EfficientDet
YOLOv7 vs
YOLOv7 è riconosciuto per la sua elevata velocità e precisione, superando molti rilevatori di oggetti al momento del suo rilascio. Ha introdotto funzionalità come la riparametrizzazione del modello, l'assegnazione dinamica delle etichette e metodi di ridimensionamento estesi e compositi per utilizzare efficacemente i parametri e il calcolo. YOLOv7 si concentra sull'ottimizzazione del processo di training, incorporando "trainable bag-of-freebies" per migliorare la precisione senza aumentare i costi di inferenza.
- YOLOv7 vs YOLO11
- YOLOv7 vs YOLOv10
- YOLOv7 vs YOLOv9
- YOLOv7 vs YOLOv8
- YOLOv7 vs YOLOv6-3.0
- YOLOv7 vs YOLOv5
- YOLOv7 vs PP-YOLOE+
- YOLOv7 vs DAMO-YOLO
- YOLOv7 vs YOLOX
- YOLOv7 vs RT-DETR
- YOLOv7 vs EfficientDet
YOLOv6 vs
YOLOv6 di Meituan è un rilevatore di oggetti progettato per applicazioni industriali, che offre un equilibrio tra velocità e precisione. Presenta miglioramenti come un modulo di concatenazione bidirezionale (BiC), una strategia di training assistito da ancore (AAT) e una progettazione migliorata del backbone e del neck. YOLOv6-3.0 perfeziona ulteriormente questo aspetto con un backbone di riparametrizzazione efficiente e blocchi ibridi per una rappresentazione robusta delle caratteristiche.
- YOLOv6-3.0 contro YOLO11
- YOLOv6-3.0 contro YOLOv10
- YOLOv6-3.0 contro YOLOv9
- YOLOv6-3.0 contro YOLOv8
- YOLOv6-3.0 contro YOLOv7
- YOLOv6-3.0 contro YOLOv5
- YOLOv6-3.0 contro PP-YOLOE+
- YOLOv6-3.0 vs DAMO-YOLO
- YOLOv6-3.0 contro YOLOX
- YOLOv6-3.0 contro RT-DETR
- YOLOv6-3.0 contro EfficientDet
YOLOv5 vs
Ultralytics YOLOv5 è noto per la sua facilità d'uso, velocità e precisione, costruito sul framework PyTorch. La variante YOLOv5u integra una split head anchor-free, objectness-free (da YOLOv8) per un migliore compromesso tra precisione e velocità. YOLOv5 supporta vari trucchi di addestramento, più formati di esportazione ed è adatto per una vasta gamma di attività di rilevamento di oggetti, instance segmentation e classificazione delle immagini.
- YOLOv5 contro YOLO11
- YOLOv5 contro YOLOv10
- YOLOv5 contro YOLOv9
- YOLOv5 contro YOLOv8
- YOLOv5 contro YOLOv7
- YOLOv5 contro YOLOv6-3.0
- YOLOv5 contro PP-YOLOE+
- YOLOv5 contro DAMO-YOLO
- YOLOv5 contro YOLOX
- YOLOv5 contro RT-DETR
- YOLOv5 contro EfficientDet
PP-YOLOE+ vs
PP-YOLOE+, sviluppato da Baidu, è un rilevatore di oggetti anchor-free migliorato che si concentra sull'efficienza e la facilità d'uso. È dotato di un backbone basato su ResNet, un neck Path Aggregation Network (PAN) e un head disaccoppiato. PP-YOLOE+ incorpora la loss Task Alignment Learning (TAL) per migliorare l'allineamento tra i punteggi di classificazione e l'accuratezza della localizzazione, mirando a un forte equilibrio tra mAP e velocità di inferenza.
- PP-YOLOE+ vs YOLO11
- PP-YOLOE+ vs YOLOv10
- PP-YOLOE+ vs YOLOv9
- PP-YOLOE+ vs YOLOv8
- PP-YOLOE+ vs YOLOv7
- PP-YOLOE+ vs YOLOv6-3.0
- PP-YOLOE+ vs YOLOv5
- PP-YOLOE+ vs DAMO-YOLO
- PP-YOLOE+ vs YOLOX
- PP-YOLOE+ vs RT-DETR
- PP-YOLOE+ vs EfficientDet
DAMO-YOLO contro
DAMO-YOLO, di Alibaba Group, è un modello di rilevamento oggetti ad alte prestazioni incentrato su accuratezza ed efficienza. Utilizza un'architettura anchor-free, backbone Neural Architecture Search (NAS) (MAE-NAS), una efficiente Reparameterized Gradient Feature Pyramid Network (RepGFPN), un ZeroHead leggero e Aligned Optimal Transport Assignment (AlignedOTA) per l'assegnazione delle etichette. DAMO-YOLO mira a fornire un forte equilibrio tra mAP e velocità di inferenza, specialmente con l'accelerazione TensorRT.
- DAMO-YOLO contro YOLO11
- DAMO-YOLO contro YOLOv10
- DAMO-YOLO vs YOLOv9
- DAMO-YOLO vs YOLOv8
- DAMO-YOLO contro YOLOv7
- DAMO-YOLO contro YOLOv6-3.0
- DAMO-YOLO contro YOLOv5
- DAMO-YOLO contro PP-YOLOE+
- DAMO-YOLO vs YOLOX
- DAMO-YOLO contro RT-DETR
- DAMO-YOLO contro EfficientDet
YOLOX contro
YOLOX, sviluppato da Megvii, è un'evoluzione anchor-free della serie YOLO che mira a un design semplificato e a prestazioni migliorate. Le caratteristiche principali includono un approccio anchor-free, un head disaccoppiato per attività separate di classificazione e regressione e l'assegnazione di etichette SimOTA. YOLOX incorpora anche solide strategie di aumento dei dati come Mosaic e MixUp. Offre un buon equilibrio tra accuratezza e velocità con varie dimensioni di modello disponibili.
- YOLOX contro YOLO11
- YOLOX contro YOLOv10
- YOLOX contro YOLOv9
- YOLOX contro YOLOv8
- YOLOX contro YOLOv7
- YOLOX contro YOLOv6-3.0
- YOLOX contro YOLOv5
- YOLOX contro PP-YOLOE+
- YOLOX contro DAMO-YOLO
- YOLOX contro RT-DETR
- YOLOX contro EfficientDet
RT-DETR vs
RT-DETR (Real-Time Detection Transformer), sviluppato da Baidu, è un rilevatore di oggetti end-to-end che utilizza un'architettura basata su Transformer per ottenere un'elevata precisione con prestazioni in tempo reale. È dotato di un efficiente encoder ibrido che disaccoppia l'interazione intra-scala e la fusione cross-scala di caratteristiche multiscala, e la selezione di query IoU-aware per migliorare l'inizializzazione delle query degli oggetti. RT-DETR offre una regolazione flessibile della velocità di inferenza utilizzando diversi livelli di decoder senza necessità di retraining.
- RT-DETR vs YOLO11
- RT-DETR vs YOLOv10
- RT-DETR vs YOLOv9
- RT-DETR vs YOLOv8
- RT-DETR vs YOLOv7
- RT-DETR vs YOLOv6-3.0
- RT-DETR vs YOLOv5
- RT-DETR vs PP-YOLOE+
- RT-DETR vs DAMO-YOLO
- RT-DETR vs YOLOX
- RT-DETR vs EfficientDet
EfficientDet vs
EfficientDet, di Google Brain, è una famiglia di modelli di rilevamento oggetti progettati per un'efficienza ottimale, ottenendo un'elevata precisione con meno parametri e un costo computazionale inferiore. Le sue principali innovazioni includono l'uso del backbone EfficientNet, una rete piramidale di caratteristiche bidirezionale ponderata (BiFPN) per la fusione rapida di caratteristiche multi-scala e un metodo di ridimensionamento composto che ridimensiona uniformemente risoluzione, profondità e larghezza. I modelli EfficientDet (D0-D7) forniscono uno spettro di compromessi tra precisione ed efficienza.
- EfficientDet vs YOLO11
- EfficientDet vs YOLOv10
- EfficientDet vs YOLOv9
- EfficientDet vs YOLOv8
- EfficientDet vs YOLOv7
- EfficientDet vs YOLOv6-3.0
- EfficientDet vs YOLOv5
- EfficientDet vs PP-YOLOE+
- EfficientDet vs DAMO-YOLO
- EfficientDet vs YOLOX
- EfficientDet vs RT-DETR
Questo indice viene continuamente aggiornato man mano che vengono rilasciati nuovi modelli e vengono resi disponibili confronti. Ti invitiamo a esplorare queste risorse per acquisire una comprensione più approfondita delle capacità di ciascun modello e trovare la soluzione perfetta per il tuo prossimo progetto di computer vision. La selezione del modello appropriato è un passo fondamentale verso la costruzione di soluzioni AI robuste ed efficienti. Ti invitiamo inoltre a interagire con la community di Ultralytics per ulteriori discussioni, supporto e approfondimenti sul mondo in evoluzione del rilevamento di oggetti. Buona comparazione!