Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ vs YOLOX#

Le paysage de la computer vision a été considérablement façonné par l'évolution rapide des modèles de détection d'objets. Parmi les jalons notables de ce parcours figurent PP-YOLOE+ et YOLOX, deux architectures qui ont repoussé les limites de la performance et de la précision en temps réel. Comprendre leurs nuances architecturales, leurs compromis de performance et leurs scénarios de déploiement idéaux est crucial pour les chercheurs et les développeurs qui construisent la prochaine génération de systèmes de reconnaissance visuelle.

Link to this sectionLignée et détails des modèles#

Avant de plonger dans les architectures techniques, il est utile de remettre dans leur contexte les origines des deux modèles. Chacun a été développé pour résoudre des goulots d'étranglement spécifiques dans la object detection, fortement influencé par ses organisations de soutien.

Détails de PP-YOLOE+ :

En savoir plus sur PP-YOLOE+

Détails de YOLOX :

En savoir plus sur YOLOX

Link to this sectionInnovations architecturales#

Les différences fondamentales entre ces deux détecteurs résident dans leur approche de l'extraction de caractéristiques et de la prédiction de BBox.

YOLOX a fait sensation en 2021 en adaptant avec succès la famille YOLO à une conception anchor-free. En supprimant les anchor boxes, YOLOX a considérablement réduit le nombre de paramètres de conception et le réglage heuristique requis pour les jeux de données personnalisés. De plus, il a introduit une tête découplée (decoupled head), qui sépare les tâches de classification et de localisation dans des voies neuronales distinctes. Cette séparation a résolu le conflit inhérent entre la classification d'un objet et la régression de ses coordonnées spatiales, conduisant à une convergence plus rapide pendant l'entraînement.

PP-YOLOE+, développé par Baidu, est fortement optimisé pour l'écosystème PaddlePaddle. Il s'appuie sur son prédécesseur, PP-YOLOv2, en introduisant une stratégie d'affectation dynamique des étiquettes (TAL) et un nouveau backbone appelé CSPRepResNet. Ce backbone tire parti de la re-paramétrisation structurelle, permettant au modèle de bénéficier d'architectures multi-branches complexes pendant l'entraînement tout en se repliant de manière transparente en un réseau rapide à chemin unique pour l'inférence.

Re-paramétrisation structurelle

La re-paramétrisation structurelle permet à un modèle de s'entraîner avec plusieurs branches parallèles (améliorant le flux de gradient) puis de réduire mathématiquement ces branches en une seule couche de convolution pour le déploiement, augmentant ainsi les vitesses d'inférence sans sacrifier la précision.

Link to this sectionComparaison des performances et des mesures#

En comparant ces modèles, il devient évident qu'ils servent des extrémités légèrement différentes du spectre de performance. PP-YOLOE+ atteint généralement une précision absolue plus élevée, tandis que YOLOX excelle en fournissant des variantes extrêmement légères adaptées au matériel très contraint.

Modèletaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2,627,9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Remarque : Les meilleures valeurs de performance dans chaque segment de colonne pertinent sont mises en gras.

Alors que YOLOX propose des variantes nano et tiny qui consomment à peine d'espace disque ou de mémoire CUDA, PP-YOLOE+ s'adapte incroyablement bien au matériel de classe serveur, ce qui en fait un choix robuste pour les applications industrielles lourdes au sein de l'écosystème Baidu.

Link to this sectionApplications concrètes#

Le choix entre ces frameworks dépend souvent des exigences d'intégration et des cibles matérielles.

Link to this sectionOù YOLOX excelle#

En raison de sa nature anchor-free et de la disponibilité de variantes edge extrêmes, YOLOX est populaire dans la robotics et le déploiement sur microcontrôleurs. Son pipeline de post-traitement simple facilite le portage vers des formats matériels NPU personnalisés comme TensorRT et NCNN.

Link to this sectionLà où PP-YOLOE+ excelle#

Pour les organisations profondément intégrées dans les hubs de fabrication asiatiques utilisant la pile technologique de Baidu, PP-YOLOE+ offre un chemin de déploiement pré-optimisé. Il brille dans les scénarios de quality inspection à haute précision fonctionnant sur de puissants serveurs où des contraintes strictes de temps réel permettent des poids de modèle légèrement plus lourds.

Link to this sectionCas d'utilisation et recommandations#

Choisir entre PP-YOLOE+ et YOLOX dépend de tes exigences de projet spécifiques, des contraintes de déploiement et des préférences d'écosystème.

Link to this sectionQuand choisir PP-YOLOE+#

PP-YOLOE+ est un choix solide pour :

  • Intégration à l'écosystème PaddlePaddle : Organisations disposant d'infrastructures existantes basées sur le framework et les outils de PaddlePaddle de Baidu.
  • Déploiement Edge sur Paddle Lite : Déploiement sur du matériel doté de noyaux d'inférence hautement optimisés spécifiquement pour le moteur Paddle Lite ou le moteur d'inférence Paddle.
  • Détection côté serveur haute précision : Scénarios privilégiant une précision de détection maximale sur des serveurs GPU puissants où la dépendance au framework n'est pas un problème.

Link to this sectionQuand choisir YOLOX#

YOLOX est recommandé pour :

  • Recherche sur la détection sans ancres : La recherche académique utilisant l'architecture propre et sans ancres de YOLOX comme base pour expérimenter de nouvelles têtes de détection ou des fonctions de perte.
  • Appareils en périphérie ultra-légers : Le déploiement sur des microcontrôleurs ou du matériel mobile ancien où l'empreinte extrêmement réduite de la variante YOLOX-Nano (0.91 M de paramètres) est critique.
  • Études sur l'assignation de labels SimOTA : Les projets de recherche étudiant les stratégies d'assignation de labels basées sur le transport optimal et leur impact sur la convergence de l'entraînement.

Link to this sectionQuand choisir Ultralytics (YOLO26)#

Pour la plupart des nouveaux projets, Ultralytics YOLO26 offre la meilleure combinaison de performance et d'expérience développeur :

  • Déploiement en périphérie sans NMS : Applications nécessitant une inférence cohérente et à faible latence sans la complexité du post-traitement par Non-Maximum Suppression.
  • Environnements CPU uniquement : Appareils sans accélération GPU dédiée, où l'inférence CPU jusqu'à 43 % plus rapide de YOLO26 offre un avantage décisif.
  • Détection de petits objets : Scénarios difficiles comme l'imagerie par drone aérien ou l'analyse de capteurs IoT où ProgLoss et STAL améliorent considérablement la précision sur les objets minuscules.

Link to this sectionL'avantage Ultralytics : place à YOLO26#

Bien que PP-YOLOE+ et YOLOX représentent d'excellents jalons de recherche, le paysage actuel du déploiement exige une expérience plus cohérente, orientée développeur, avec une efficacité supérieure. C'est là qu' Ultralytics YOLO26 redéfinit complètement la norme pour l'IA visuelle moderne.

Pour les équipes cherchant à passer de dépôts de recherche isolés à des systèmes prêts pour la production, Ultralytics propose un écosystème robuste et bien maintenu. L'entraînement d'un modèle ne nécessite plus la configuration d'environnements complexes ; c'est aussi simple que d'accéder à une API Python unifiée.

Les avantages clés d'Ultralytics YOLO26 incluent :

  • Conception end-to-end NMS-Free : Contrairement à PP-YOLOE+ et YOLOX, qui nécessitent une NMS pour filtrer les BBox redondantes, YOLO26 est nativement end-to-end. Cela élimine les goulots d'étranglement de latence et simplifie considérablement la logique de déploiement.
  • Jusqu'à 43 % d'inférence CPU plus rapide : En supprimant stratégiquement la Distribution Focal Loss (DFL), YOLO26 atteint des vitesses d'inférence inégalées sur le matériel CPU, le rendant bien supérieur pour l'edge computing et les appareils basse consommation.
  • Optimiseur MuSGD : Inspiré par Kimi K2 de Moonshot AI, cet optimiseur hybride apporte la stabilité de l'entraînement LLM à la computer vision, garantissant une convergence beaucoup plus rapide et minimisant les besoins en mémoire pendant les phases d'entraînement.
  • ProgLoss + STAL : Ces fonctions de perte avancées offrent des améliorations notables dans la reconnaissance de petits objets, une fonctionnalité critique pour les drone operations et l'imagerie aérienne très détaillée.
  • Polyvalence : Alors que PP-YOLOE+ et YOLOX se concentrent uniquement sur la détection, YOLO26 gère de manière transparente l'instance segmentation, la pose estimation et les Oriented Bounding Boxes (OBB) en utilisant exactement la même syntaxe intuitive.

En savoir plus sur YOLO26

Link to this sectionEntraînement simplifié avec Ultralytics#

L'efficacité de la mémoire et la vitesse d'entraînement des modèles Ultralytics sont inégalées, surpassant complètement les alternatives basées sur Transformer qui nécessitent une surcharge de mémoire CUDA immense. Tu peux tirer parti de la puissance de YOLO26 en quelques lignes de code seulement :

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
Explore la plateforme Ultralytics

Pour les équipes à la recherche d'une solution no-code, la plateforme Ultralytics fournit un entraînement basé sur le cloud, une annotation de jeu de données intégrée et un déploiement en un clic pour tous tes modèles YOLO.

Link to this sectionConclusion#

PP-YOLOE+ et YOLOX ont tous deux gagné leur place dans l'histoire de la computer vision, offrant respectivement une grande précision et des conceptions légères anchor-free. Cependant, pour les organisations construisant l'avenir de l'AI in agriculture, des smart cities et du retail, la maintenance continue, la facilité d'utilisation et l'architecture native NMS-free d'Ultralytics YOLO26 en font le choix incontesté.

Si tu explores des architectures alternatives pour des benchmarks spécifiques, tu pourrais aussi trouver de la valeur à comparer l'ancien YOLO11 ou des options basées sur Transformer comme RT-DETR via la documentation complète d'Ultralytics. En migrant vers l'écosystème unifié Ultralytics, les développeurs économisent un temps et des ressources inestimables tout en obtenant des résultats de pointe sur tout déploiement edge ou cloud.

Contributeurs

Commentaires