YOLOv5 YOLOv9: comparaison technique approfondie
Le domaine de la vision par ordinateur et de la détection d'objets en temps réel a connu des progrès remarquables au cours des dernières années. Choisir entre des modèles éprouvés et des architectures de recherche plus récentes est un défi courant pour les ingénieurs en apprentissage automatique. Ce guide fournit une comparaison technique complète entre deux modèles très influents de la YOLO : YOLOv5 et YOLOv9.
Que vous déployiez des modèles sur des appareils périphériques aux ressources limitées, que vous meniez des recherches sur l'extraction de caractéristiques haute fidélité ou que vous développiez des pipelines complexes de détection d'objets, il est essentiel de comprendre les nuances architecturales, les mesures de performance et les différences entre les écosystèmes de ces modèles.
Aperçus des modèles
Avant de se plonger dans les comparaisons architecturales, il est utile de comprendre les origines et les principaux objectifs de chaque modèle.
Ultralytics YOLOv5
Développé par Glenn Jocher et publié par Ultralytics le 26 juin 2020, YOLOv5 un changement de paradigme dans la manière dont les développeurs interagissaient avec les modèles de vision. En adoptant pleinement le langage de programmation PyTorch , YOLOv5 les étapes de compilation complexes des modèles antérieurs basés sur Darknet par une expérience utilisateur intuitive, Python.
- Auteur : Glenn Jocher
- Organisation :Ultralytics
- Date : 2020-06-26
- GitHub :Dépôt YOLOv5
- Documents :Présentation deYOLOv5
YOLOv5 réputé pour sa facilité d'utilisation et ses performances stables dans divers environnements matériels. Il prend en charge non seulement la détection, mais aussi la classification d'images et la segmentation d'instances.
YOLOv9
Présenté par Chien-Yao Wang et Hong-Yuan Mark Liao de l'Institut des sciences de l'information de l'Academia Sinica, à Taïwan, YOLOv9 fortement YOLOv9 sur la théorie architecturale afin d'atténuer les problèmes de goulots d'étranglement dans les réseaux neuronaux profonds.
- Auteurs : Chien-Yao Wang et Hong-Yuan Mark Liao
- Organisation : Institut des sciences de l'information, Academia Sinica, Taïwan
- Date : 2024-02-21
- Arxiv :2402.13616
- GitHub :Dépôt YOLOv9
- Docs :Documentation YOLOv9
Le cœur de YOLOv9 sur deux innovations théoriques majeures : les informations de gradient programmables (PGI) et le réseau généralisé d'agrégation de couches efficaces (GELAN). Ces concepts aident le modèle à conserver les caractéristiques spatiales essentielles à travers les couches profondes du réseau.
Assurez la pérennité de vos déploiements
Si YOLOv5 YOLOv9 puissants, le tout nouveau YOLO26 offre un équilibre parfait entre vitesse et précision. Doté d'une conception de bout en bout NMS et CPU jusqu'à 43 % plus rapide, YOLO26 est vivement recommandé pour les déploiements modernes en matière d'informatique de pointe et de production.
Différences architecturales et techniques
Il est essentiel de comprendre ce qui alimente ces modèles de vision en arrière-plan pour optimiser les stratégies de déploiement des modèles.
Extraction de caractéristiques et conservation des informations
YOLOv5 une infrastructure CSPNet (Cross Stage Partial Network), qui réduit efficacement la charge de calcul tout en maintenant un flux de gradient précis pendant la rétropropagation. Cette conception est hautement optimisée pour GPU traditionnelles et garantit des besoins en mémoire réduits pendant l'entraînement par rapport aux alternatives transformatrices lourdes.
YOLOv9 GELAN, une architecture générique qui étend les principes CSPNet. Associé à PGI, une branche réversible auxiliaire,YOLOv9 que les couches profondes ne perdent pas les données sémantiques nécessaires à des fonctions objectives précises. Cela permet YOLOv9 atteindre une grande précision, en particulier sur les objets de petite taille, même si la complexité des branches auxiliaires peut parfois compliquer les pipelines d'exportation vers du matériel périphérique fortement contraint.
Besoins en mémoire et efficacité de l'apprentissage
En termes d'efficacité de formation, YOLOv5 incroyablement robuste. Ultralytics , bien entretenu, garantit que YOLOv5 consomment beaucoup moins CUDA , ce qui permet aux chercheurs de maximiser la taille des lots sur les GPU grand public. Si YOLOv9 une excellente efficacité en termes de paramètres (précision élevée par rapport à sa taille), son processus de formation peut être plus gourmand en ressources s'il n'utilise pas de frameworks optimisés. Heureusement, l'intégration YOLOv9 Ultralytics le rapproche de la parité avec la gestion rationalisée des ressources YOLOv5.
Performance et indicateurs
Pour évaluer objectivement ces architectures, nous comparons leurs performances sur des ensembles de données standard tels que COCO. Vous trouverez ci-dessous une analyse détaillée des indicateurs tels que mAP Mean Average Precision), la vitesse d'inférence et le nombre de paramètres.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Comme le montre le tableau, YOLOv9 une précision brute supérieure à des niveaux équivalents, reflétant ainsi sa nouvelle architecture. Cependant, YOLOv5n conserve une TensorRT incroyablement faible de 1,12 ms, soulignant ainsi sa force durable pour les applications informatiques de pointe localisées à haute vitesse.
Méthodologies de formation et facilité d'utilisation
Le véritable avantage de l'utilisation de la vision par ordinateur réside aujourd'hui dans l'accessibilité de la chaîne d'outils.
L'avantage Ultralytics
Si les référentiels de recherche originaux pour des modèles tels que YOLOv9 fondamentaux, ils s'accompagnent souvent de matrices de dépendances complexes et de scripts standardisés. Python Ultralytics élimine complètement cette complexité. Grâce à Ultralytics , vous pouvez former, évaluer et exporter à la fois YOLOv5 YOLOv9 une syntaxe identique et unifiée.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for fast deployment
model_v5 = YOLO("yolov5s.pt")
# Or leverage a YOLOv9 model for high-fidelity accuracy
model_v9 = YOLO("yolov9c.pt")
# Train seamlessly on custom data with automatic MLflow logging
results = model_v9.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX
model_v9.export(format="onnx")
Cette approche à API unique offre une grande polyvalence, prenant en charge non seulement la détection, mais aussi l'estimation de la pose et les boîtes englobantes orientées (OBB) en fonction du modèle choisi. De plus, elle s'intègre parfaitement à des outils tels que Comet et Weights & Biases sont directement intégrées dans la boucle d'entraînement.
Cas d'utilisation idéaux et applications concrètes
Le choix entre ces architectures dépend en grande partie des contraintes de votre matériel et de la précision requise par votre domaine d'application.
Quand choisir YOLOv5
YOLOv5 un vétéran aguerri qui excelle dans les déploiements privilégiant la stabilité, une faible empreinte mémoire et une compatibilité d'exportation extrême.
- Déploiements mobiles : exportation de YOLOv5 TFLite ou CoreML une inférence sur appareil sur des smartphones plus anciens est incroyablement fluide.
- Matériel Legacy Edge : pour les appareils tels que le Raspberry Pi ou les premières générations NVIDIA Nanos, les convolutions simples de YOLOv5 des fréquences d'images constantes pour des applications telles que la gestion intelligente du stationnement.
- Prototypage rapide : la grande disponibilité de tutoriels communautaires, de poids pré-entraînés personnalisés et la compatibilité avec des ensembles de données massifs en font le moyen le plus rapide de valider une preuve de concept.
Quand choisir YOLOv9
YOLOv9 idéal pour les scénarios où la capture de détails complexes et la minimisation des faux négatifs sont absolument essentielles, même si cela nécessite une charge de calcul légèrement plus importante.
- Imagerie aérienne et satellitaire : le cadre PGI est très efficace pour préserver la fidélité des petits objets, ce qui rend YOLOv9 pour la surveillance agricole par drone.
- Diagnostic par imagerie médicale : lors de la détection d'anomalies ou de lésions infimes dans des scans haute résolution, le flux gradient précis de GELAN offre un avantage décisif en matière de rappel.
- Analyse haut de gamme dans le commerce de détail : le suivi des produits qui se chevauchent sur des étagères densément remplies bénéficie considérablement des capacités supérieures de conservation des caractéristiques YOLOv9.
Élargir vos horizons
Si la comparaison YOLOv5 YOLOv9 une vision claire de l'évolution des architectures entre 2020 et 2024, le domaine de l'IA évolue plus rapidement que jamais. Les développeurs à la recherche de performances de pointe sont vivement encouragés à explorer les derniers modèles YOLO26. En remplaçant la suppression non maximale traditionnelle par une conception native de bout en bout NMS et en utilisant l'optimiseur MuSGD avancé, YOLO26 comble le fossé entre la précision au niveau de la recherche et la vitesse au niveau de la production. Grâce à la suppression de la DFL (Distribution Focal Loss supprimée pour simplifier l'exportation et améliorer la compatibilité avec les appareils périphériques/à faible consommation d'énergie), YOLO26 atteint CPU jusqu'à 43 % plus rapide, ce qui le rend idéal pour l'informatique périphérique. De plus, ProgLoss + STAL offre des fonctions de perte améliorées avec des progrès notables dans la reconnaissance des petits objets, ce qui est essentiel pour l'IoT, la robotique et l'imagerie aérienne.
Vous pourriez également être intéressé par une comparaison de ces architectures avec d'autres modèles de pointe tels que RT-DETR ou le très performant YOLO11. L'utilisation du Ultralytics unifié Ultralytics garantit que, quel que soit le modèle que vous choisissez, votre pipeline de développement reste propre, efficace et prêt à être mis à l'échelle.