Passer au contenu

PP-YOLOE+ vs YOLOv10: comparaison entre deux détecteurs d'objets modernes

Le domaine de la détection d'objets en temps réel a évolué rapidement, poussé par le besoin de modèles alliant haute précision et faible latence. Deux contributions importantes dans ce domaine sont PP-YOLOE+, développé par Baidu dans le cadre de la suite PaddleDetection, et YOLOv10, une publication universitaire de l'université Tsinghua qui a introduit l'entraînement NMS.

Ce guide fournit une comparaison technique détaillée de ces architectures, en examinant leurs mesures de performance, leurs méthodologies de formation et leur adéquation à diverses applications de vision par ordinateur. Bien que les deux modèles offrent des capacités impressionnantes, nous soulignons également comment Ultralytics et les modèles plus récents tels que YOLO26 offrent une voie plus unifiée et plus efficace pour le déploiement.

Aperçu du modèle et spécifications techniques

Comprendre l'origine et la philosophie de conception de chaque modèle aide à choisir l'outil adapté à vos contraintes techniques spécifiques.

PP-YOLOE+

PP-YOLOE+ est une version améliorée de PP-YOLOE, qui se concentre sur le perfectionnement du mécanisme sans ancrage et l'efficacité de la formation. Il est profondément intégré dans le PaddlePaddle .

  • Auteurs :PaddlePaddle
  • Organisation :Baidu
  • Date : avril 2022
  • Référence :arXiv:2203.16250
  • Architecture clé : utilise une structure CSPRepResNet avec une stratégie d'attribution d'étiquettes Task Alignment Learning (TAL). Elle repose sur une conception standard sans ancrage.

En savoir plus sur PP-YOLOE+

YOLOv10

YOLOv10 a marqué un tournant important dans la YOLO en introduisant une conception de bout en bout qui élimine le besoin de suppression non maximale (NMS) pendant l'inférence.

  • Auteurs : Ao Wang, Hui Chen, et al.
  • Organisation :Tsinghua University
  • Date : mai 2024
  • Référence :arXiv:2405.14458
  • Architecture clé : propose des affectations doubles cohérentes pour une formation NMS et une conception de modèle holistique axée sur l'efficacité et la précision.

En savoir plus sur YOLOv10

Bancs d'essai de performance

Le tableau suivant compare les modèles sur l'COCO . Les indicateurs clés comprennent la précision moyenne (mAP) et la vitesse d'inférence sur différentes configurations matérielles. Notez les gains d'efficacité significatifs de YOLOv10 , en particulier en termes de nombre de paramètres.

ModèleTaille
(pixels)
mAPval
50-95
Vitesse
CPU ONNX
(ms)
Vitesse
T4 TensorRT10
(ms)
paramètres
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Analyse des performances

YOLOv10 une efficacité supérieure, atteignant souvent une précision similaire ou supérieure avec beaucoup moins de paramètres. Par exemple, YOLOv10x atteint presque le même mAP PP-YOLOE+x, mais avec environ 42 % de paramètres en moins, ce qui le rend beaucoup plus adapté à un déploiement en périphérie avec une mémoire limitée.

Plongée en profondeur dans l'architecture

Conception PP-YOLOE+

PP-YOLOE+ s'appuie sur les bases solides de PP-YOLOv2. Il utilise une structure évolutive appelée CSPRepResNet, qui combine des connexions résiduelles avec des réseaux partiels inter-étapes afin d'améliorer le flux de gradient. La tête est sans ancrage, ce qui simplifie l'espace de recherche d'hyperparamètres par rapport à ses prédécesseurs basés sur l'ancrage, tels que YOLOv4.

Cependant, PP-YOLOE+ repose sur des étapes de post-traitement complexes. Bien que précis, le recours au NMS entraîner des goulots d'étranglement en termes de latence dans les scènes encombrées où de nombreux cadres de sélection se chevauchent.

YOLOv10 : traitement de bout en bout

YOLOv10 un changement de paradigme en éliminant NMS . Il y parvient grâce à des attributions doubles cohérentes:

  1. Affectation un-à-plusieurs : utilisée pendant la formation pour fournir des signaux de supervision riches.
  2. Affectation univoque : utilisée pour l'inférence afin de garantir des prédictions uniques par objet.

Cet alignement permet de déployer le modèle sans la charge informatique liée au tri et au filtrage des boîtes, ce qui constitue un avantage majeur pour les applications en temps réel.

Écosystème et facilité d'utilisation

L'écosystème qui entoure un modèle est souvent aussi important que l'architecture elle-même. C'est là que la différence entre les modèles PaddlePaddle et ceux Ultralytics devient la plus évidente.

L'avantage Ultralytics

YOLOv10 la nouvelle version YOLO26 sont toutes deux prises en charge dans lePython Ultralytics , offrant ainsi une expérience fluide aux développeurs.

  • API unifiée : passez d'un modèle à l'autre (par exemple, de YOLOv8 YOLOv10 YOLO26) en modifiant un seul argument de chaîne.
  • Intégration de la plateforme : les utilisateurs peuvent exploiter la Ultralytics pour gérer des ensembles de données, visualiser des cycles d'entraînement et déployer des modèles sur des terminaux Web et périphériques en quelques clics.
  • Prise en charge étendue de l'exportation : bien que PP-YOLOE+ soit optimisé pour l'inférence Paddle, Ultralytics s'exportent nativement vers ONNX, TensorRT, CoreMLet OpenVINO, couvrant ainsi une gamme plus large de matériel de déploiement.
from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
path = model.export(format="onnx")

Flux de travail PP-YOLOE+

PP-YOLOE+ nécessite généralement l'installation de PaddlePaddle le clonage du référentiel PaddleDetection. Cet écosystème est puissant, mais peut être moins accessible pour les utilisateurs habitués aux PyTorch standard. Le processus d'exportation donne souvent la priorité au moteur Paddle Inference, ce qui peut nécessiter des étapes de conversion supplémentaires pour un déploiement générique.

L'avenir : YOLO26

Alors que YOLOv10 le concept NMS, le récent YOLO26 affine et développe ces innovations.

YOLO26 est nativement NMS de bout en bout, garantissant les vitesses d'inférence les plus rapides possibles sans délais de post-traitement. Il intègre l'optimiseur MuSGD, un hybride de SGD Muon (inspiré de la formation LLM), garantissant une convergence stable. De plus, grâce à la suppression de la perte focale de distribution (DFL), YOLO26 est nettement plus facile à exporter et à exécuter sur des appareils périphériques à faible consommation d'énergie.

Pour les développeurs qui recherchent le meilleur en termes de vitesse et de précision, en particulier pour la détection de petits objets via ProgLoss et STAL, YOLO26 est la mise à niveau recommandée.

En savoir plus sur YOLO26

Cas d'utilisation concrets

Quand choisir PP-YOLOE+

  • Déploiement sur Baidu Cloud : si votre infrastructure est déjà construite sur Baidu Cloud ou utilise Paddle Serving, PP-YOLOE+ offre une optimisation native.
  • Matériel spécifique : certaines puces IA destinées au marché asiatique prennent en charge de manière spécifique les modèles PaddlePaddle .

Quand choisir Ultralytics YOLOv10 YOLO26)

  • Edge Computing : avec CPU jusqu'à 43 % plus rapide dans YOLO26, ces modèles sont idéaux pour les déploiements sur Raspberry Pi, Jetson Nano ou mobiles.
  • Tâches complexes : au-delà de la détection, la Ultralytics prend en charge l'estimation de pose, la segmentation d'instances et la détection d'objets orientés (OBB), vous permettant ainsi de résoudre divers problèmes à l'aide d'un seul outil.
  • Prototypage rapide : la facilité de formation et de validation permet aux équipes d'itérer rapidement, un facteur crucial dans les environnements de développement agiles.

Efficacité de la mémoire

YOLO Ultralytics sont réputés pour leur faible empreinte mémoire. Contrairement aux architectures lourdes en transformateurs qui consomment d'énormes quantités de CUDA , YOLO efficaces tels que YOLO26 permettent des tailles de lots plus importantes sur les GPU grand public, démocratisant ainsi l'accès à la formation en IA haut de gamme.

Conclusion

PP-YOLOE+ et YOLOv10 tous deux des modèles performants. PP-YOLOE+ est un choix judicieux pour PaddlePaddle , tandis que YOLOv10 les limites de l'efficacité grâce à sa conception NMS. Cependant, pour une expérience de développement optimisée, une prise en charge matérielle étendue et des fonctionnalités de pointe telles que l'optimiseur MuSGD et ProgLoss, Ultralytics s'impose comme le choix idéal pour les ingénieurs en vision par ordinateur modernes.

Pour explorer d'autres options, pensez à vous renseigner sur YOLOv8 ou le RT-DETR pour les scénarios nécessitant une grande précision.


Commentaires