Comparaisons de modèles : choisissez le meilleur modèle de détection d’objets pour votre projet
Choisir le bon modèle de détection d'objets est crucial pour le succès de votre projet de vision par ordinateur. Bienvenue sur le hub de comparaison de modèles Ultralytics ! Cette page centralise des comparaisons techniques détaillées entre des modèles de détection d'objets de pointe, en se concentrant sur les dernières versions d'Ultralytics YOLO ainsi que sur d'autres architectures de premier plan comme RTDETR, EfficientDet, et plus encore.
Notre objectif est de vous fournir les informations nécessaires pour sélectionner le modèle optimal en fonction de vos besoins spécifiques, que vous privilégiez une précision maximale, une vitesse d'inférence en temps réel, une efficacité de calcul ou un équilibre entre ces éléments. Nous visons à clarifier les performances de chaque modèle et à mettre en évidence ses points forts, afin de vous aider à vous orienter dans le paysage complexe de la détection d'objets.
Obtenez un aperçu rapide des performances du modèle grâce à notre tableau de bord interactif :
Ce graphique visualise les principales métriques de performance telles que la mAP (précision moyenne moyenne) par rapport à la latence d'inférence, ce qui vous aide à évaluer rapidement les compromis entre différents modèles souvent évalués sur des ensembles de données standard comme COCO. Comprendre ces compromis est essentiel pour sélectionner un modèle qui non seulement répond aux critères de performance, mais qui s'aligne également sur les contraintes de déploiement.
Explorez plus en détail avec nos pages de comparaison spécifiques. Chaque analyse couvre :
- Différences architecturales : Comprendre les principes de conception de base, comme le backbone et les têtes de détection, ainsi que les innovations. Cela comprend l’examen de la façon dont différents modèles abordent l’extraction et la prédiction de caractéristiques.
- Bancs d’essai de performance : Comparez des mesures telles que la précision (mAP), la vitesse (FPS, latence) et le nombre de paramètres à l’aide d’outils tels que le mode Ultralytics Benchmark. Ces bancs d’essai fournissent des données quantitatives pour appuyer votre processus décisionnel.
- Forces et faiblesses : Identifiez les points forts et les limites de chaque modèle en fonction des informations d'évaluation. Cette évaluation qualitative aide à comprendre les implications pratiques du choix d'un modèle plutôt qu'un autre.
- Cas d'utilisation idéaux : Déterminez les scénarios auxquels chaque modèle est le mieux adapté, des appareils Edge AI aux plateformes cloud. Explorez diverses solutions Ultralytics pour vous inspirer. L'alignement des capacités du modèle sur les exigences spécifiques de votre projet garantit des résultats optimaux.
Cette ventilation détaillée vous aide à peser le pour et le contre afin de trouver le modèle qui correspond parfaitement aux besoins de votre projet, que ce soit pour un déploiement sur des appareils edge, un déploiement dans le cloud ou une recherche utilisant des frameworks comme PyTorch. Le choix du modèle peut avoir un impact significatif sur l'efficacité et l'efficience de votre application de vision par ordinateur.
Regarder : Comparaison des modèles YOLO : Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8 🎉
Naviguez directement vers la comparaison dont vous avez besoin en utilisant les listes ci-dessous. Nous les avons organisées par modèle pour un accès facile :
YOLO11 vs
YOLO11, la dernière version d'Ultralytics, s'appuie sur le succès de ses prédécesseurs en intégrant la recherche de pointe et les commentaires de la communauté. Il présente des améliorations telles qu'une architecture dorsale et de cou améliorée pour une meilleure extraction des caractéristiques, une efficacité optimisée pour un traitement plus rapide et une plus grande précision avec moins de paramètres. YOLO11 prend en charge un large éventail de tâches de vision par ordinateur, notamment la détection d'objets, la segmentation d'instances, la classification d'images, l'estimation de pose et la détection d'objets orientés, ce qui le rend très adaptable à divers environnements.
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv9
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv7
- YOLO11 vs YOLOv6-3.0
- YOLO11 vs YOLOv5
- YOLO11 vs PP-YOLOE+
- YOLO11 vs DAMO-YOLO
- YOLO11 vs YOLOX
- YOLO11 vs RT-DETR
- YOLO11 vs EfficientDet
YOLOv10 vs
YOLOv10, développé par des chercheurs de l'université de Tsinghua à l'aide du package python Ultralytics, introduit une approche innovante de la détection d'objets en temps réel en éliminant la suppression non maximale (NMS) et en optimisant l'architecture du modèle. Il en résulte des performances de pointe avec une surcharge de calcul réduite et des compromis précision-latence supérieurs. Les principales caractéristiques comprennent l'entraînement sans NMS pour une latence réduite, l'extraction de caractéristiques améliorée avec des convolutions à grand noyau et des variantes de modèle polyvalentes pour différents besoins d'application.
- YOLOv10 vs YOLO11
- YOLOv10 vs YOLOv9
- YOLOv10 vs YOLOv8
- YOLOv10 vs YOLOv7
- YOLOv10 vs YOLOv6-3.0
- YOLOv10 vs YOLOv5
- YOLOv10 vs PP-YOLOE+
- YOLOv10 vs DAMO-YOLO
- YOLOv10 vs YOLOX
- YOLOv10 vs RT-DETR
- YOLOv10 vs EfficientDet
YOLOv9 vs
YOLOv9 introduit l'Information de Gradient Programmable (PGI) et le Réseau d'Agrégation de Couches Efficace Généralisé (GELAN) pour traiter la perte d'informations dans les réseaux neuronaux profonds. Développé par une équipe open-source distincte utilisant la base de code YOLOv5 d'Ultralytics, YOLOv9 présente des améliorations significatives en termes d'efficacité, de précision et d'adaptabilité, en particulier pour les modèles légers. PGI aide à maintenir les données essentielles à travers les couches, tandis que GELAN optimise l'utilisation des paramètres et l'efficacité computationnelle.
- YOLOv9 vs YOLO11
- YOLOv9 vs YOLOv10
- YOLOv9 vs YOLOv8
- YOLOv9 vs YOLOv7
- YOLOv9 vs YOLOv6-3.0
- YOLOv9 vs YOLOv5
- YOLOv9 vs PP-YOLOE+
- YOLOv9 vs DAMO-YOLO
- YOLOv9 vs YOLOX
- YOLOv9 vs RT-DETR
- YOLOv9 vs EfficientDet
YOLOv8 vs
Ultralytics YOLOv8 s’appuie sur les réussites des versions précédentes de YOLO, offrant des performances, une flexibilité et une efficacité améliorées. Il est doté d’une architecture dorsale et d’une architecture de tête de réseau avancées, d’une tête Ultralytics divisée sans point d’ancrage pour une meilleure précision et d’un compromis précision-vitesse optimisé, adapté à diverses tâches de détection d’objets en temps réel. YOLOv8 prend en charge diverses tâches de vision par ordinateur, notamment la détection d’objets, la segmentation d’instances, la détection de pose/points clés, la détection d’objets orientés et la classification.
- YOLOv8 vs YOLO11
- YOLOv8 vs YOLOv10
- YOLOv8 vs YOLOv9
- YOLOv8 vs YOLOv7
- YOLOv8 vs YOLOv6-3.0
- YOLOv8 vs YOLOv5
- YOLOv8 vs PP-YOLOE+
- YOLOv8 vs DAMO-YOLO
- YOLOv8 vs YOLOX
- YOLOv8 vs RT-DETR
- YOLOv8 vs EfficientDet
YOLOv7 vs
YOLOv7 est reconnu pour sa vitesse et sa précision élevées, surpassant de nombreux détecteurs d'objets au moment de sa sortie. Il a introduit des fonctionnalités telles que la re-paramétrisation du modèle, l'attribution dynamique d'étiquettes et des méthodes de mise à l'échelle étendues et composées pour utiliser efficacement les paramètres et le calcul. YOLOv7 se concentre sur l'optimisation du processus d'entraînement, en intégrant des "trainable bag-of-freebies" pour améliorer la précision sans augmenter les coûts d'inférence.
- YOLOv7 contre YOLO11
- YOLOv7 contre YOLOv10
- YOLOv7 contre YOLOv9
- YOLOv7 contre YOLOv8
- YOLOv7 contre YOLOv6-3.0
- YOLOv7 contre YOLOv5
- YOLOv7 vs PP-YOLOE+
- YOLOv7 vs DAMO-YOLO
- YOLOv7 contre YOLOX
- YOLOv7 contre RT-DETR
- YOLOv7 vs EfficientDet
YOLOv6 vs
YOLOv6 de Meituan est un détecteur d'objets conçu pour les applications industrielles, offrant un équilibre entre vitesse et précision. Il présente des améliorations telles qu'un module de concaténation bidirectionnelle (BiC), une stratégie d'entraînement assistée par ancres (AAT) et une conception améliorée du backbone et du neck. YOLOv6-3.0 affine encore cela avec un backbone de reparamétrisation efficace et des blocs hybrides pour une représentation robuste des caractéristiques.
- YOLOv6-3.0 vs YOLO11
- YOLOv6-3.0 vs YOLOv10
- YOLOv6-3.0 vs YOLOv9
- YOLOv6-3.0 vs YOLOv8
- YOLOv6-3.0 vs YOLOv7
- YOLOv6-3.0 vs YOLOv5
- YOLOv6-3.0 vs PP-YOLOE+
- YOLOv6-3.0 vs DAMO-YOLO
- YOLOv6-3.0 vs YOLOX
- YOLOv6-3.0 vs RT-DETR
- YOLOv6-3.0 vs EfficientDet
YOLOv5 vs
Ultralytics YOLOv5 est reconnu pour sa facilité d'utilisation, sa rapidité et sa précision, étant basé sur le framework PyTorch. La variante YOLOv5u intègre un "split head" sans ancrage et sans "objectness" (provenant de YOLOv8) pour un meilleur compromis précision-vitesse. YOLOv5 prend en charge diverses astuces d'entraînement, de multiples formats d'exportation, et est adapté à un large éventail de tâches de détection d'objets, de segmentation d'instances et de classification d'images.
- YOLOv5 vs YOLO11
- YOLOv5 vs YOLOv10
- YOLOv5 vs YOLOv9
- YOLOv5 vs YOLOv8
- YOLOv5 vs YOLOv7
- YOLOv5 vs YOLOv6-3.0
- YOLOv5 vs PP-YOLOE+
- YOLOv5 vs DAMO-YOLO
- YOLOv5 vs YOLOX
- YOLOv5 vs RT-DETR
- YOLOv5 vs EfficientDet
PP-YOLOE+ vs
PP-YOLOE+, développé par Baidu, est un détecteur d'objets sans ancres amélioré, axé sur l'efficacité et la facilité d'utilisation. Il comprend un backbone basé sur ResNet, un neck Path Aggregation Network (PAN) et une tête découplée. PP-YOLOE+ intègre la perte Task Alignment Learning (TAL) pour améliorer l'alignement entre les scores de classification et la précision de la localisation, visant un équilibre solide entre mAP et vitesse d'inférence.
- PP-YOLOE+ vs YOLO11
- PP-YOLOE+ vs YOLOv10
- PP-YOLOE+ vs YOLOv9
- PP-YOLOE+ vs YOLOv8
- PP-YOLOE+ vs YOLOv7
- PP-YOLOE+ vs YOLOv6-3.0
- PP-YOLOE+ vs YOLOv5
- PP-YOLOE+ vs DAMO-YOLO
- PP-YOLOE+ vs YOLOX
- PP-YOLOE+ vs RT-DETR
- PP-YOLOE+ vs EfficientDet
DAMO-YOLO vs
DAMO-YOLO, du groupe Alibaba, est un modèle de détection d’objets haute performance axé sur la précision et l’efficacité. Il utilise une architecture sans ancrage, des backbones de recherche d’architecture neuronale (NAS) (MAE-NAS), un réseau pyramidal de caractéristiques de gradient reparamétré efficace (RepGFPN), un ZeroHead léger et une affectation de transport optimal alignée (AlignedOTA) pour l’affectation d’étiquettes. DAMO-YOLO vise à fournir un équilibre solide entre mAP et vitesse d’inférence, en particulier avec l’accélération TensorRT.
- DAMO-YOLO vs YOLO11
- DAMO-YOLO vs YOLOv10
- DAMO-YOLO vs YOLOv9
- DAMO-YOLO vs YOLOv8
- DAMO-YOLO vs YOLOv7
- DAMO-YOLO vs YOLOv6-3.0
- DAMO-YOLO vs YOLOv5
- DAMO-YOLO vs PP-YOLOE+
- DAMO-YOLO vs YOLOX
- DAMO-YOLO vs RT-DETR
- DAMO-YOLO vs EfficientDet
YOLOX vs
YOLOX, développé par Megvii, est une évolution sans ancrage de la série YOLO qui vise une conception simplifiée et des performances améliorées. Les principales caractéristiques comprennent une approche sans ancrage, une tête découplée pour des tâches de classification et de régression distinctes, et l'attribution de labels SimOTA. YOLOX intègre également de puissantes stratégies d'augmentation de données comme Mosaic et MixUp. Il offre un bon équilibre entre précision et vitesse avec différentes tailles de modèles disponibles.
- YOLOX vs YOLO11
- YOLOX vs YOLOv10
- YOLOX vs YOLOv9
- YOLOX vs YOLOv8
- YOLOX vs YOLOv7
- YOLOX vs YOLOv6-3.0
- YOLOX vs YOLOv5
- YOLOX vs PP-YOLOE+
- YOLOX vs DAMO-YOLO
- YOLOX vs RT-DETR
- YOLOX vs EfficientDet
RT-DETR vs
RT-DETR (Real-Time Detection Transformer), de Baidu, est un détecteur d'objets de bout en bout utilisant une architecture basée sur Transformer pour atteindre une haute précision avec une performance en temps réel. Il dispose d'un encodeur hybride efficace qui découple l'interaction intra-échelle et la fusion inter-échelle des caractéristiques multi-échelles, et d'une sélection de requêtes basée sur l'IoU pour améliorer l'initialisation des requêtes d'objets. RT-DETR offre un ajustement flexible de la vitesse d'inférence en utilisant différentes couches de décodeur sans réentraînement.
- RT-DETR vs YOLO11
- RT-DETR vs YOLOv10
- RT-DETR vs YOLOv9
- RT-DETR vs YOLOv8
- RT-DETR vs YOLOv7
- RT-DETR vs YOLOv6-3.0
- RT-DETR vs YOLOv5
- RT-DETR vs PP-YOLOE+
- RT-DETR vs DAMO-YOLO
- RT-DETR vs YOLOX
- RT-DETR vs EfficientDet
EfficientDet vs
EfficientDet, de Google Brain, est une famille de modèles de détection d'objets conçus pour une efficacité optimale, atteignant une haute précision avec moins de paramètres et un coût de calcul inférieur. Ses principales innovations comprennent l'utilisation du backbone EfficientNet, un réseau de pyramide de caractéristiques bidirectionnel pondéré (BiFPN) pour une fusion rapide des caractéristiques multi-échelles, et une méthode de mise à l'échelle composite qui met à l'échelle uniformément la résolution, la profondeur et la largeur. Les modèles EfficientDet (D0-D7) offrent un éventail de compromis précision-efficacité.
- EfficientDet vs YOLO11
- EfficientDet vs YOLOv10
- EfficientDet vs YOLOv9
- EfficientDet vs YOLOv8
- EfficientDet vs YOLOv7
- EfficientDet vs YOLOv6-3.0
- EfficientDet vs YOLOv5
- EfficientDet vs PP-YOLOE+
- EfficientDet vs DAMO-YOLO
- EfficientDet vs YOLOX
- EfficientDet vs RT-DETR
Cet index est mis à jour en permanence au fur et à mesure que de nouveaux modèles sont publiés et que des comparaisons sont disponibles. Nous vous encourageons à explorer ces ressources pour acquérir une compréhension plus approfondie des capacités de chaque modèle et trouver celui qui convient le mieux à votre prochain projet de vision par ordinateur. La sélection du modèle approprié est une étape essentielle dans la construction de solutions d'IA robustes et efficaces. Nous vous invitons également à vous engager avec la communauté Ultralytics pour d'autres discussions, un soutien et des informations sur le monde en constante évolution de la détection d'objets. Bonne comparaison !