YOLOv5 vs YOLOv7 : Une Comparaison Détaillée
Choisir le bon modèle de détection d'objets est une décision cruciale qui équilibre le besoin de vitesse, de précision et de facilité de déploiement. Cette page offre une comparaison technique entre Ultralytics YOLOv5 et YOLOv7, deux modèles influents dans le paysage de la vision par ordinateur. Bien que les deux aient apporté des contributions significatives, Ultralytics YOLOv5 se distingue par son équilibre exceptionnel entre performance, conception conviviale et un écosystème complet et bien entretenu, ce qui en fait un choix privilégié pour un large éventail d'applications du monde réel.
Ultralytics YOLOv5 : la norme industrielle établie
Ultralytics YOLOv5, publié en 2020 par Glenn Jocher, est rapidement devenu l'un des modèles de détection d'objets les plus populaires en raison de son mélange remarquable de vitesse, de précision et de facilité d'utilisation. Développé entièrement en PyTorch, YOLOv5 est hautement optimisé, offrant une expérience simplifiée de l'entraînement au déploiement.
Auteur : Glenn Jocher
Organisation : Ultralytics
Date : 2020-06-26
GitHub : https://github.com/ultralytics/yolov5
Docs : https://docs.ultralytics.com/models/yolov5/
Architecture et principales caractéristiques de YOLOv5
YOLOv5 présente une architecture flexible et efficace construite sur un backbone CSPDarknet53 et un neck PANet pour une agrégation efficace des caractéristiques. Il utilise une tête de détection basée sur des ancres, qui a été affinée au fil de nombreuses versions. L'un de ses principaux atouts est la variété des tailles de modèles (n, s, m, l, x), permettant aux développeurs de sélectionner le compromis optimal entre performance et ressources de calcul. Cette évolutivité le rend adapté à tout, des appareils périphériques légers aux puissants serveurs cloud.
Points forts de YOLOv5
- Facilité d'utilisation : YOLOv5 est réputé pour ses interfaces Python et CLI simples, sa documentation exhaustive et ses pipelines de formation et d'inférence simples.
- Écosystème bien maintenu : Il est soutenu par l'écosystème robuste d'Ultralytics, qui comprend un développement actif, une large communauté, des mises à jour fréquentes et des outils puissants comme Ultralytics HUB pour l'entraînement et le déploiement sans code.
- Équilibre des performances : YOLOv5 offre un excellent compromis entre la vitesse d'inférence et la précision de la détection, ce qui le rend très pratique pour divers scénarios réels.
- Polyvalence et efficacité de l'apprentissage : Il prend en charge plusieurs tâches de vision, notamment la détection d'objets, la segmentation d'instance et la classification d'images. Le processus d'apprentissage est efficace, avec des poids pré-entraînés facilement disponibles et des besoins en mémoire inférieurs à ceux des architectures plus complexes.
Faiblesses de YOLOv5
- Limites de précision : Bien que très précis, les modèles plus récents ont dépassé ses scores mAP sur des benchmarks standard comme COCO.
- Conception basée sur les ancres : Son recours à des boîtes d'ancrage prédéfinies peut parfois nécessiter plus de réglages pour les ensembles de données avec des objets de forme inhabituelle par rapport aux approches modernes sans ancres.
Cas d'utilisation pour YOLOv5
- Applications en temps réel: Idéal pour les applications nécessitant une inférence rapide, telles que la robotique, la vision par drone dans les applications de vision par ordinateur dans les opérations de drones IA et l'analyse vidéo en temps réel.
- Déploiement Edge : Bien adapté au déploiement sur des appareils edge dotés de ressources limitées en raison de sa conception efficace et de la plus petite taille de ses modèles. Explorez les guides de déploiement NVIDIA Jetson.
- Prototypage rapide : Un excellent choix pour le prototypage rapide et le déploiement de solutions de détection d’objets, grâce à sa facilité d’utilisation et à son support étendu.
YOLOv7 : Priorité à la haute précision
YOLOv7, créé par Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao, a été publié le 6 juillet 2022. Il a introduit plusieurs optimisations architecturales et stratégies d'entraînement, connues sous le nom de "trainable bag-of-freebies", visant à repousser les limites de la précision tout en maintenant une vitesse en temps réel.
Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
Organisation : Institut des sciences de l'information, Academia Sinica, Taïwan
Date : 2022-07-06
Arxiv : https://arxiv.org/abs/2207.02696
GitHub : https://github.com/WongKinYiu/yolov7
Docs : https://docs.ultralytics.com/models/yolov7/
Architecture et principales caractéristiques de YOLOv7
- E-ELAN : Utilise Extended Efficient Layer Aggregation Network (E-ELAN) dans le backbone pour améliorer la capacité d’apprentissage.
- Adaptation de modèle : Implémente une adaptation composée pour la profondeur et la largeur du modèle afin d'optimiser les différents budgets de calcul.
- Entraînement de la tête auxiliaire: Utilise des têtes auxiliaires pendant l'entraînement (supprimées pendant l'inférence) pour améliorer l'apprentissage des caractéristiques.
- Bag-of-Freebies : Tire parti de techniques d’entraînement avancées pour améliorer la précision sans augmenter le coût d’inférence.
Points forts de YOLOv7
- Haute précision : Obtient des scores mAP élevés sur des benchmarks comme COCO, en particulier avec les variantes de modèles plus grandes.
- Techniques d'entraînement efficaces : Intègre de nouvelles stratégies d'entraînement pour maximiser les performances.
Faiblesses de YOLOv7
- Complexité : L'architecture et le processus d'entraînement peuvent être plus complexes par rapport à l'approche rationalisée d'Ultralytics YOLOv5.
- Écosystème et support : Manque de documentation exhaustive, de tutoriels et d'écosystème intégré fournis par Ultralytics pour YOLOv5.
- Gourmand en ressources : Les modèles plus grands exigent des ressources de calcul importantes, ce qui peut limiter le déploiement sur des appareils contraints.
Cas d'utilisation pour YOLOv7
- Détection haute performance : Convient aux applications où l'obtention de la plus haute précision absolue est essentielle et où les ressources de calcul sont moins limitées, comme dans les véhicules autonomes.
- Recherche : Utilisé dans la recherche académique explorant les techniques de détection d'objets de pointe.
Performances et comparaison technique
Une comparaison directe de YOLOv5 et YOLOv7 sur l’ensemble de données COCO révèle des différences essentielles dans leurs profils de performance. Les modèles YOLOv7 atteignent généralement des scores mAP plus élevés, mais souvent au prix d’une complexité et d’une demande de ressources accrues. En revanche, Ultralytics YOLOv5 offre un profil plus équilibré, excellant en vitesse d’inférence CPU et maintenant une précision compétitive, ce qui est crucial pour de nombreux déploiements dans le monde réel.
Modèle | Taille (pixels) |
mAPval 50-95 |
Vitesse CPU ONNX (ms) |
Vitesse T4 TensorRT10 (ms) |
paramètres (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Conclusion : Quel modèle devriez-vous choisir ?
Le choix entre YOLOv5 et YOLOv7 dépend fortement des priorités du projet.
YOLOv7 est un choix judicieux pour les chercheurs et les développeurs qui ont besoin de la plus grande précision possible sur les benchmarks standard et qui ont accès à des ressources de calcul importantes. Ses techniques d'entraînement innovantes démontrent comment repousser les limites de la performance.
Cependant, pour la grande majorité des applications pratiques, Ultralytics YOLOv5 reste le choix supérieur. Ses principaux avantages—facilité d'utilisation, déploiement rapide, excellent équilibre vitesse-précision et un écosystème florissant—en font un outil incroyablement efficace et fiable. Il permet aux développeurs de créer rapidement des solutions de vision par ordinateur robustes, du prototype initial au déploiement en production.
De plus, l'écosystème Ultralytics a continué d'évoluer. Les nouveaux modèles comme YOLOv8 et YOLO11 s'appuient sur les bases de YOLOv5, offrant des performances encore meilleures et une plus grande polyvalence dans des tâches telles que la segmentation, l'estimation de pose et le suivi. Pour les développeurs à la recherche d'un framework moderne, pérenne et convivial, la famille Ultralytics YOLO offre la solution la plus convaincante et la plus complète.
Explorer d'autres modèles
Si vous explorez des modèles de détection d'objets, vous pourriez également être intéressé par ces autres comparaisons :
- YOLOv5 vs YOLOv8
- YOLOv5 vs YOLOv9
- YOLOv7 contre YOLOv8
- YOLOv7 contre YOLO11
- RT-DETR vs YOLOv7
- Explorez les derniers modèles comme YOLOv10 et YOLO11.