Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ vs YOLOv7#

Lorsque tu construis des pipelines de vision par ordinateur, choisir le bon modèle de détection d'objets est essentiel. Deux architectures majeures de 2022, PP-YOLOE+ et YOLOv7, ont apporté des avancées puissantes dans la détection d'objets en temps réel. Cette comparaison technique offre un examen approfondi de leurs architectures, méthodologies d'entraînement et performances en conditions réelles pour t'aider à prendre des décisions éclairées pour tes applications.

Link to this sectionPrésentation des modèles#

PP-YOLOE+ et YOLOv7 ont été conçus pour repousser les limites de la précision et de la vitesse, mais ils sont issus d'écosystèmes de développement et de philosophies de conception différents.

Link to this sectionPP-YOLOE+#

Développé par les auteurs de PaddlePaddle chez Baidu, PP-YOLOE+ repose sur le PP-YOLOv2 original. Il a été introduit pour fournir un détecteur d'objets efficace et très précis, optimisé pour l'écosystème PaddlePaddle.

En savoir plus sur PP-YOLOE+

Link to this sectionYOLOv7#

Développé par Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao, YOLOv7 a introduit des "trainable bag-of-freebies" pour établir de nouveaux benchmarks de pointe pour les détecteurs d'objets en temps réel au moment de sa sortie.

  • Auteurs : Chien-Yao Wang, Alexey Bochkovskiy et Hong-Yuan Mark Liao
  • Organisation : Institute of Information Science, Academia Sinica, Taïwan
  • Date : 2022-07-06
  • Arxiv : 2207.02696
  • GitHub : Dépôt YOLOv7
  • Docs : Ultralytics YOLOv7 Docs

En savoir plus sur YOLOv7

Link to this sectionInnovations architecturales#

Link to this sectionArchitecture de PP-YOLOE+#

PP-YOLOE+ repose fortement sur un paradigme sans ancres, simplifiant le processus de déploiement en éliminant le besoin de régler des boîtes d'ancrage pour des jeux de données personnalisés. Il intègre une puissante structure RepResNet et un PAN (Path Aggregation Network) de style CSPNet pour une fusion efficace des caractéristiques multi-échelles. De plus, il exploite le concept de Task Alignment Learning (TAL) pour aligner dynamiquement les tâches de classification et de localisation pendant l'entraînement, garantissant une grande précision à travers diverses computer vision tasks.

Link to this sectionArchitecture de YOLOv7#

YOLOv7 a adopté une approche différente en introduisant le Extended Efficient Layer Aggregation Network (E-ELAN). Cette architecture permet au réseau d'apprendre des caractéristiques plus diversifiées sans détruire le chemin de gradient original, ce qui conduit à une meilleure convergence. YOLOv7 utilise également intensivement la re-paramétrisation des modèles — spécifiquement des convolutions re-paramétrées planifiées — qui fusionne les couches convolutionnelles pendant l'inférence pour accélérer l'exécution sans sacrifier la précision. Cela rend YOLOv7 exceptionnellement performant dans des tâches comme le multi-object tracking et les security alarm systems complexes.

Différences d'écosystème

Alors que PP-YOLOE+ est étroitement intégré au framework PaddlePaddle de Baidu, YOLOv7 a été construit en PyTorch, qui offre historiquement une communauté plus large et une compatibilité plus étendue avec les pipelines de déploiement comme ONNX et TensorRT.

Link to this sectionAnalyse des performances#

Lors de l'équilibrage entre vitesse, paramètres et précision (mAP), les modèles se valent selon la variante spécifique et le matériel cible. Tu trouveras ci-dessous une comparaison complète de leurs métriques.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627,9317,36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053,1-11.5771.3189.9

Bien que le modèle PP-YOLOE+x atteigne un mAP légèrement supérieur, les variantes YOLOv7 offrent un très bon ratio paramètres/précision. L'architecture YOLOv7 reste un choix privilégié pour le traitement brut sur GPU où l'optimisation TensorRT permet une latence exceptionnellement faible.

Link to this sectionL'avantage Ultralytics#

Lors de l'entraînement et du déploiement de ces modèles, le framework que tu choisis est tout aussi important que le modèle lui-même. Utiliser Ultralytics t'offre une expérience utilisateur simplifiée grâce à une API Python hautement unifiée qui simplifie tout le cycle de vie de l'apprentissage automatique.

  • Écosystème bien entretenu : Les modèles Ultralytics YOLO bénéficient d'un écosystème continuellement mis à jour, d'une documentation robuste et d'une communauté active.
  • Exigences en mémoire : Ultralytics optimise considérablement le chargement des données et les régimes d'entraînement. L'entraînement des modèles Ultralytics YOLO nécessite généralement beaucoup moins de mémoire CUDA par rapport aux architectures lourdes basées sur Transformer, te permettant, en tant que développeur, d'utiliser des batch sizes plus importantes sur du matériel grand public.
  • Efficacité de l'entraînement : En exploitant des data augmentation strategies robustes et un réglage intégré des hyperparamètres, Ultralytics garantit que les modèles convergent rapidement avec des poids pré-entraînés facilement disponibles.

Link to this sectionImplémentation simple de l'API#

Entraîner un modèle YOLOv7 avec Ultralytics ne prend que quelques lignes de code, abstraisant complètement les scripts d'entraînement complexes :

from ultralytics import YOLO

# Load a pretrained YOLOv7 model
model = YOLO("yolov7.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to TensorRT for deployment
model.export(format="engine", device=0)

Link to this sectionLa nouvelle norme : Présentation de YOLO26#

Bien que PP-YOLOE+ et YOLOv7 soient des étapes importantes dans la détection d'objets, le paysage de l'IA évolue rapidement. Pour tout nouveau projet de vision par ordinateur, nous te recommandons vivement Ultralytics YOLO26. Sorti en janvier 2026, YOLO26 représente un bond en avant massif dans l'IA de vision orientée edge.

Pourquoi YOLO26 surpasse les anciennes architectures :

  • Conception de bout en bout sans NMS : YOLO26 est nativement de bout en bout. En éliminant le post-traitement Non-Maximum Suppression (NMS), il garantit une latence d'inférence prévisible et déterministe — une percée vue pour la première fois dans YOLOv10.
  • Suppression du DFL : La suppression de la Distribution Focal Loss simplifie le processus d'exportation et améliore considérablement la compatibilité pour les appareils edge à faible consommation.
  • Inférence CPU jusqu'à 43 % plus rapide : Pour les scénarios dépourvus de GPU dédiés — tels que les smart city IoT sensors — YOLO26 est fortement optimisé pour s'exécuter efficacement directement sur les CPU.
  • Optimiseur MuSGD : Inspiré par des techniques avancées d'entraînement de LLM (comme le Kimi K2 de Moonshot AI), YOLO26 utilise un hybride de SGD et Muon pour un entraînement incroyablement stable et une convergence rapide.
  • ProgLoss + STAL : Ces fonctions de perte améliorées apportent des gains remarquables dans la détection de petits objets, ce qui est vital pour des cas d'utilisation comme drone aerial imagery et la détection de défauts de fabrication.

En savoir plus sur YOLO26

Link to this sectionCas d'utilisation idéaux et scénarios de déploiement#

Link to this sectionQuand utiliser PP-YOLOE+#

PP-YOLOE+ brille lorsque tu es profondément ancré dans l'écosystème Baidu et PaddlePaddle. Si ta cible de déploiement utilise du matériel spécialisé adapté aux modèles Paddle (par exemple, dans certains pipelines de fabrication asiatiques), PP-YOLOE+ offre une excellente précision et une intégration transparente. Il est très efficace pour l'industrial manufacturing automation.

Link to this sectionQuand utiliser YOLOv7#

YOLOv7 reste un excellent choix pour l'inférence générique haute performance, particulièrement lors d'un déploiement sur du matériel NVIDIA utilisant TensorRT. Son intégration dans l'écosystème PyTorch le rend très polyvalent pour la recherche académique et les pipelines commerciaux personnalisés, tels que le real-time crowd management ou les tâches complexes de pose estimation où l'intégrité structurelle du réseau est primordiale.

Link to this sectionAutres modèles à considérer#

En fonction de tes besoins précis, tu pourrais également être intéressé par la comparaison de ces architectures avec YOLO11 pour une flexibilité étendue et prête pour la production, ou RT-DETR si ton projet nécessite les avantages spécifiques des vision transformers par rapport aux réseaux convolutionnels traditionnels.

Link to this sectionConclusion#

PP-YOLOE+ et YOLOv7 ont tous deux apporté des améliorations significatives au monde de la détection d'objets en temps réel. Alors que PP-YOLOE+ excelle dans les environnements standardisés autour de PaddlePaddle, YOLOv7 offre une incroyable flexibilité et performance via les écosystèmes PyTorch et Ultralytics.

Cependant, alors que les computer vision solutions continuent de progresser, l'utilisation d'outils modernes est essentielle. En adoptant la Ultralytics Platform et des architectures de nouvelle génération comme YOLO26, tu peux t'assurer que tes applications restent à la pointe de la vitesse, de la précision et de la facilité d'utilisation.

Contributeurs

Commentaires