Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs PP-YOLOE+#

Choisir la bonne architecture de réseau de neurones est essentiel pour tout projet moderne de vision par ordinateur. Lorsque les développeurs et chercheurs évaluent des modèles pour la détection d'objets en temps réel, la décision revient souvent à équilibrer précision, vitesse d'inférence et facilité de déploiement. Cette comparaison technique examine YOLOv5 et PP-YOLOE+, en explorant leurs architectures, leurs mesures de performance et leurs méthodologies d'entraînement pour t'aider à sélectionner la solution optimale pour ton application.

Link to this sectionComprendre les architectures#

Les deux modèles ont eu un impact significatif sur le paysage de la vision par IA, mais ils abordent les défis de la détection d'objets via des méthodologies structurelles et des dépendances de framework différentes.

Link to this sectionUltralytics YOLOv5 : La norme de l'industrie#

Sorti mi-2020, Ultralytics YOLOv5 a révolutionné l'accessibilité des modèles de vision de pointe. En étant la première implémentation native PyTorch de la famille YOLO, il a considérablement abaissé la barrière à l'entrée pour les développeurs Python et les ingénieurs ML du monde entier.

Détails de YOLOv5 :

YOLOv5 utilise une dorsale CSPDarknet modifiée, qui capture efficacement des représentations de caractéristiques riches tout en maintenant un nombre de paramètres léger. Il a introduit l'auto-apprentissage des anchor boxes, calculant automatiquement les dimensions optimales des ancres pour tes jeux de données personnalisés avant même que l'entraînement ne commence. De plus, son intégration de l'augmentation de données mosaïque améliore considérablement la capacité du modèle à détecter des objets plus petits et à généraliser à travers des contextes spatiaux complexes.

L'une des plus grandes forces de YOLOv5 est son incroyable polyvalence. Contrairement aux détecteurs d'objets standard, la famille YOLOv5 prend en charge de manière transparente la classification d'images, la segmentation d'instance et la détection par boîte englobante au sein d'une API unifiée. Son architecture hautement optimisée se traduit également par une utilisation de la mémoire substantiellement plus faible pendant l'entraînement et l'inférence par rapport aux réseaux lourds basés sur des Transformer.

En savoir plus sur YOLOv5

Link to this sectionPP-YOLOE+ : Le concurrent de PaddlePaddle#

Introduit environ deux ans plus tard, PP-YOLOE+ s'appuie sur les bases des itérations précédentes de PP-YOLO. Développé pour présenter les capacités du framework de deep learning de Baidu, il introduit plusieurs raffinements architecturaux pour augmenter la précision moyenne (mAP).

Détails de PP-YOLOE+ :

PP-YOLOE+ repose sur un paradigme sans ancres et utilise une dorsale CSPRepResNet. Il intègre une puissante technique d'alignement de tâches (Task Alignment Learning) et une tête efficace alignée sur les tâches (Efficient Task-aligned Head) pour améliorer la précision. Bien que PP-YOLOE+ atteigne des scores de précision impressionnants, sa faiblesse principale réside dans sa dépendance stricte au framework PaddlePaddle. Cela introduit souvent une courbe d'apprentissage abrupte et des frictions écosystémiques pour les équipes de recherche et les entreprises déjà fortement investies dans des environnements PyTorch ou TensorFlow.

En savoir plus sur PP-YOLOE+

Link to this sectionPerformances et benchmarks#

Lors de l'évaluation de ces modèles pour la production, il est crucial de comprendre les compromis entre précision, vitesse d'inférence et empreinte des paramètres. Le tableau ci-dessous décrit les mesures de performance clés à travers différentes variantes de taille.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Alors que PP-YOLOE+ atteint des limites de précision élevées, YOLOv5 démontre systématiquement une efficacité supérieure des paramètres et une inférence plus rapide sur du matériel contraint. Pour les déploiements en périphérie (edge) où la mémoire est rare, YOLOv5n offre une vitesse inégalée et une empreinte extrêmement faible.

Efficacité mémoire

Les modèles Ultralytics sont spécifiquement conçus pour l'efficacité de l'entraînement. Comparé aux lourds vision Transformers comme RT-DETR, YOLOv5 utilise beaucoup moins de mémoire CUDA, te permettant de t'entraîner sur des tailles de batch plus grandes ou du matériel grand public.

Link to this sectionL'avantage Ultralytics : Écosystème et facilité d'utilisation#

La véritable valeur d'une architecture d'apprentissage automatique dépasse les chiffres bruts ; elle englobe toute l'expérience du développeur. La plateforme Ultralytics et ses outils open-source correspondants fournissent un écosystème hautement raffiné et bien entretenu qui accélère radicalement les cycles de développement.

  • Facilité d'utilisation : Ultralytics abstrait le code boilerplate complexe. Tu peux entraîner, valider et tester des modèles via une API Python intuitive ou une CLI.
  • Flexibilité de déploiement : Exporter des modèles est incroyablement simple. Avec une seule commande, tu peux convertir tes poids YOLOv5 entraînés vers des formats comme ONNX, TensorRT ou OpenVINO, assurant une large compatibilité à travers les environnements edge et cloud.
  • Communauté active : La communauté dynamique garantit des mises à jour fréquentes, une documentation étendue et des solutions robustes aux défis courants de la vision par ordinateur.

En revanche, PP-YOLOE+ repose fortement sur des fichiers de configuration complexes spécifiques à PaddleDetection, ce qui peut ralentir le prototypage rapide et compliquer l'intégration dans des pipelines MLOps modernes.

Link to this sectionImplémentations pratiques et exemples de code#

Commencer avec Ultralytics est remarquablement simple. Voici un exemple complet et exécutable de la façon de charger un modèle YOLOv5 pré-entraîné, de l'entraîner sur un jeu de données personnalisé et d'exporter les résultats :

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Link to this sectionCas d'utilisation et recommandations#

Choisir entre YOLOv5 et PP-YOLOE+ dépend de tes exigences de projet spécifiques, de tes contraintes de déploiement et de tes préférences d'écosystème.

Link to this sectionQuand choisir YOLOv5#

YOLOv5 est un choix solide pour :

  • Systèmes de production éprouvés : Déploiements existants où la longue expérience de stabilité de YOLOv5, sa documentation étendue et le soutien massif de la communauté sont valorisés.
  • Entraînement aux ressources limitées : Environnements avec des ressources GPU limitées où le pipeline d'entraînement efficace et les exigences mémoire inférieures de YOLOv5 sont avantageux.
  • Prise en charge étendue des formats d'exportation : Projets nécessitant un déploiement sur de nombreux formats, dont ONNX, TensorRT, CoreML et TFLite.

Link to this sectionQuand choisir PP-YOLOE+#

PP-YOLOE+ est recommandé pour :

  • Intégration à l'écosystème PaddlePaddle : Organisations disposant d'infrastructures existantes basées sur le framework et les outils de PaddlePaddle de Baidu.
  • Déploiement Edge sur Paddle Lite : Déploiement sur du matériel doté de noyaux d'inférence hautement optimisés spécifiquement pour le moteur Paddle Lite ou le moteur d'inférence Paddle.
  • Détection côté serveur haute précision : Scénarios privilégiant une précision de détection maximale sur des serveurs GPU puissants où la dépendance au framework n'est pas un problème.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionModèles de pointe alternatifs à considérer#

Bien que YOLOv5 soit un standard robuste et éprouvé, le domaine de la vision par ordinateur évolue rapidement. Pour les équipes commençant de nouveaux projets, nous recommandons vivement d'explorer nos architectures plus récentes.

Link to this sectionUltralytics YOLO26#

Sorti en janvier 2026, YOLO26 représente le sommet absolu de notre recherche. Il apporte des améliorations massives en termes de précision et de vitesse. Les innovations clés incluent :

  • Conception de bout en bout sans NMS : En s'appuyant sur les concepts de YOLOv10, YOLO26 élimine nativement le post-traitement de suppression non-maximale (NMS), réduisant la latence et simplifiant la logique de déploiement.
  • Suppression de DFL : En supprimant la Distribution Focal Loss, YOLO26 atteint jusqu'à 43 % d'inférence CPU plus rapide, ce qui le rend incroyablement puissant pour les appareils edge à faible consommation.
  • Optimiseur MuSGD : Inspiré par des techniques avancées d'entraînement LLM, cet hybride de SGD et Muon assure des entraînements exceptionnellement stables et une convergence plus rapide.
  • ProgLoss + STAL : Ces fonctions de perte avancées offrent des améliorations notables dans la reconnaissance des petits objets, ce qui est critique pour l'imagerie par drone et l'agriculture intelligente.

De plus, tu pourrais considérer YOLO11, qui offre d'excellentes performances et sert de pont hautement fiable entre les systèmes hérités et les capacités de pointe de YOLO26.

Link to this sectionCas d'utilisation réels#

Le choix entre YOLOv5 et PP-YOLOE+ dépend finalement de ton environnement de déploiement et des contraintes de ton projet.

Applications idéales de YOLOv5 : Les besoins minimaux en ressources de YOLOv5 et son incroyable facilité d'utilisation en font le premier choix pour l'Edge AI. Il excelle dans les applications nécessitant des fréquences d'images élevées sur du matériel limité, comme la robotique en temps réel, l'intégration d'applications mobiles et les systèmes de surveillance du trafic multi-caméras. Sa capacité à gérer simultanément des tâches d'estimation de pose et de boîtes englobantes orientées (OBB) au sein du même framework le rend hautement adaptable.

Applications idéales de PP-YOLOE+ : PP-YOLOE+ est mieux adapté aux scénarios où une précision maximale absolue sur des images statiques est priorisée par rapport aux contraintes de traitement en temps réel. Il trouve une utilisation de niche dans les pipelines d'inspection industrielle, en particulier au sein des secteurs manufacturiers asiatiques qui ont des piles techniques préétablies fortement investies dans l'écosystème Baidu et PaddlePaddle.

En résumé, bien que PP-YOLOE+ fournisse des benchmarks de précision solides, les modèles Ultralytics YOLO offrent une combinaison inégalée d'équilibre de performance, de déploiement transparent et de conception conviviale pour le développeur qui propulse des projets de vision par ordinateur réussis, du concept à la production.

Contributeurs

Commentaires