YOLOv8 vs. DAMO-YOLO : une comparaison technique complète
Dans le domaine en constante évolution de la vision par ordinateur, il est essentiel de choisir la bonne architecture de détection d'objets afin d'équilibrer précision, rapidité et efficacité de déploiement. Ce guide fournit une analyse technique approfondie de deux modèles phares : Ultralytics YOLOv8, connu pour son écosystème robuste et sa facilité d'utilisation, et YOLO, une architecture axée sur la recherche qui exploite la recherche d'architecture neuronale (NAS).
Résumé
Alors queYOLO en 2022 des concepts innovants tels que les dorsales NAS et la reparamétrisation, YOLOv8 (sorti en 2023) et le plus récent YOLO26 (sorti en 2026) offrent un écosystème plus mature et prêt à être mis en production. Ultralytics offrent une expérience « zero-to-hero » fluide avec une prise en charge intégrée de la formation, de la validation et du déploiement sur divers matériels, tandis queYOLO cibleYOLO la recherche universitaire avec un pipeline de formation plus complexe.
Mesures de performance
Le tableau ci-dessous compare les performances de YOLOv8 YOLO l'ensemble de données COCO . YOLOv8 une polyvalence et une vitesse supérieures, en particulier dans les scénarios d'inférence du monde réel.
| Modèle | Taille (pixels) | mAPval 50-95 | Vitesse CPU ONNX (ms) | Vitesse T4 TensorRT10 (ms) | paramètres (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Présentation de Ultralytics YOLOv8
YOLOv8 représente une avancée significative dans la YOLO . Conçu par Ultralytics du modèle de pointe le plus utilisable et le plus précis pour un large éventail de tâches.
- Auteurs : Glenn Jocher, Ayush Chaurasia et Jing Qiu
- Organisation :Ultralytics
- Date : 10 janvier 2023
- Docs :Documentation YOLOv8
- GitHub :ultralytics/ultralytics
Principales caractéristiques de YOLOv8
YOLOv8 sur les succès précédents avec un cadre unifié qui prend en charge la détection d'objets, la segmentation d'instances, l'estimation de pose, la classification et la détection de boîtes englobantes orientées (OBB). Sa tête de détection sans ancrage et ses nouvelles fonctions de perte rationalisent le processus d'apprentissage, ce qui se traduit par une plus grande précision et une convergence plus rapide.
Écosystème intégré
Contrairement aux référentiels réservés à la recherche, YOLOv8 sur Ultralytics complet Ultralytics . Celui-ci comprend la Ultralytics pour la formation sans code et la gestion des ensembles de données, ainsi que des intégrations transparentes avec des outils tels que Weights & Biases et Ultralytics .
Présentation de DAMO-YOLO
YOLO est un cadre de détection d'objets développé par l'Alibaba DAMO Academy. Il met l'accent sur une faible latence et une grande précision en exploitant la recherche d'architecture neuronale (NAS) et d'autres techniques avancées.
- Auteurs : Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang et Xiuyu Sun
- Organisation : Alibaba Group
- Date : 23 novembre 2022
- Arxiv :DAMO-YOLO : un rapport sur la conception de la detect d’objets en temps réel
- GitHub :tinyvision/DAMO-YOLO
Architecture et méthodologie
YOLO une recherche d'architecture multi-échelle (MAE-NAS) afin de trouver les structures optimales pour différentes contraintes de latence. Il utilise un réseau RepGFPN (Re-parameterized Generalized Feature Pyramid Network) pour une fusion efficace des caractéristiques et emploie un processus de distillation intensif pendant l'entraînement afin d'améliorer les performances du modèle étudiant.
Comparaison architecturale détaillée
Les philosophies architecturales de ces deux modèles divergent considérablement, ce qui a un impact sur leur facilité d'utilisation et leur flexibilité.
Backbone et fusion des caractéristiques
YOLOv8 utilise une structure CSPDarknet modifiée avec des modules C2f, optimisés pour un flux de gradient riche et une efficacité matérielle. Cette approche « bag-of-freebies » garantit des performances élevées sans nécessiter de phases de recherche complexes.
En revanche, YOLO s'appuie sur le NAS pour découvrir des architectures telles que MobileOne ou des variantes basées sur CSP adaptées à un matériel spécifique. Bien que cela puisse entraîner des gains d'efficacité théoriques, cela complique souvent le processus d'apprentissage et rend la personnalisation de l'architecture pour de nouvelles tâches plus difficile pour le développeur moyen.
Méthodologie d'entraînement
La formationYOLO un processus complexe en plusieurs étapes. Elle implique une stratégie « ZeroHead » et un pipeline de distillation lourd où un grand modèle enseignant guide l'élève. Cela nécessite des ressources informatiques importantes et une configuration complexe.
Ultralytics privilégient l'efficacité de l'entraînement. YOLOv8 et le plus récent YOLO26) peuvent être entraînés à partir de zéro ou affinés à partir de données personnalisées à l'aide d'une seule commande. L'utilisation de poids pré-entraînés réduit considérablement le temps et CUDA nécessaires à la convergence.
# Simplicity of Ultralytics Training
yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640
Polyvalence et prise en charge des tâches
L'un des principaux avantages du Ultralytics réside dans sa polyvalence inhérente. Alors queYOLO principalement un détecteur d'objets, YOLOv8 une multitude de tâches de vision par ordinateur. Les développeurs peuvent passer de la détection de voitures à la segmentation de tumeurs ou à l'estimation de postures humaines sans modifier leur pile logicielle.
Ultralytics : pourquoi choisir YOLOv8 YOLO26 ?
Pour les développeurs et les entreprises, le choix du modèle va souvent au-delà mAP brut mAP 'mAP l'ensemble du cycle de vie du produit d'IA.
1. Facilité d'utilisation et documentation
Ultralytics réputé pour sa documentation de pointe et Python simple. L'intégration YOLOv8 une application ne nécessite que quelques lignes de code, tandis queYOLO nécessiteYOLO de naviguer dans des bases de code de recherche complexes avec un support externe limité.
2. Déploiement et exportation
Le déploiement dans le monde réel exige de la flexibilité. Ultralytics prennent en charge l'exportation en un clic vers des formats tels que ONNX, TensorRT, CoreMLet TFLite. Cela garantit que votre modèle peut fonctionner sur tous les supports, des serveurs cloud aux appareils périphériques tels que le Raspberry Pi ou NVIDIA .
3. Équilibre des performances
YOLOv8 un compromis exceptionnel entre vitesse et précision. Pour les utilisateurs qui recherchent encore plus d'efficacité, la nouvelle version YOLO26 s'appuie sur cet héritage avec une conception de bout en bout NMS. Cela élimine le post-traitement NMS(Non-Maximum Suppression), ce qui se traduit par une inférence plus rapide et une logique de déploiement plus simple.
L'avenir est NMS
YOLO26 est le pionnier d'une architecture native de bout en bout. En supprimant le besoin d'NMS en utilisant le nouvel optimiseur MuSGD (inspiré de la formation LLM), YOLO26 offre CPU jusqu'à 43 % plus rapide que les générations précédentes, ce qui en fait le choix idéal pour l'informatique de pointe.
Cas d'utilisation idéaux
- ChoisissezYOLO : vous êtes un chercheur spécialisé dans les techniques de recherche d'architecture neuronale (NAS) ou si vous avez des contraintes matérielles très spécifiques pour lesquelles une infrastructure générique ne suffit pas, et si vous disposez des ressources nécessaires pour gérer des pipelines de distillation complexes.
- Choisissez Ultralytics YOLOv8 si : vous avez besoin d'une solution prête à l'emploi pour l'analyse commerciale, les véhicules autonomes, l'imagerie médicale ou les applications de ville intelligente. Ses options d'exportation robustes, ses faibles exigences en matière de mémoire et le soutien actif de sa communauté en font la norme en matière de déploiement commercial fiable.
Conclusion
Alors queYOLO des innovations académiques intéressantes dans le domaine de la recherche architecturale, Ultralytics YOLOv8 et le très performant YOLO26 restent les choix privilégiés pour les applications pratiques. Leur combinaison de facilité d'utilisation, d'écosystème bien entretenu et de performances équilibrées permet aux développeurs de se concentrer sur la résolution de problèmes concrets plutôt que de se débattre avec les détails de la mise en œuvre des modèles.
Pour ceux qui sont prêts à se lancer dans l'aventure de la vision par ordinateur, consultez le guide de démarrage rapide ou découvrez dès aujourd'hui les fonctionnalités de la Ultralytics .
Lectures complémentaires
- Comparez YOLOv8 EfficientDet
- Découvrez YOLO26 vs RT-DETR
- En savoir plus sur YOLO11