Link to this sectionComment définir les objectifs de ton projet de vision par ordinateur#
Pour définir un projet de vision par ordinateur, rédige un énoncé de problème qui nomme le problème central, le périmètre, les parties prenantes et les contraintes ; fixe des objectifs mesurables et limités dans le temps ; et fais correspondre le problème à la tâche de vision par ordinateur qui déterminera tes choix en matière de modèle, de jeu de données et de déploiement. Ce guide détaille chaque étape avec un exemple concret.
Watch: How to define Computer Vision Project's Goal | Problem Statement and VisionAI Tasks Connection 🚀
Pour une vue d'ensemble du flux de travail complet, de la collecte des données au déploiement, consulte notre guide sur les étapes clés d'un projet de vision par ordinateur.
Link to this sectionComment rédiger un énoncé de problème de vision par ordinateur#
Un énoncé de problème clair est la première étape importante pour trouver la solution la plus efficace. Il comprend quatre parties :
- Identifie le problème central : Cible le défi spécifique que ton projet de vision par ordinateur vise à résoudre.
- Détermine la portée : Définis les limites de ton problème.
- Prends en compte les utilisateurs finaux et les parties prenantes : Identifie qui sera affecté par la solution.
- Analyse les exigences et les contraintes du projet : Évalue les ressources disponibles (temps, budget, personnel) et identifie toute contrainte technique ou réglementaire.
Link to this sectionExemple d'un énoncé de problème métier#
Considère un projet de vision par ordinateur où tu souhaites estimer la vitesse des véhicules sur une autoroute. Le problème central est que les méthodes actuelles de surveillance de la vitesse sont inefficaces et sujettes aux erreurs en raison de systèmes radar obsolètes et de processus manuels. Le projet vise à développer un système de vision par ordinateur en temps réel capable de remplacer les anciens systèmes d'estimation de vitesse.
Les principaux utilisateurs incluent les autorités de gestion du trafic et les forces de l'ordre, tandis que les parties prenantes secondaires sont les planificateurs routiers et le public bénéficiant de routes plus sûres. Les exigences clés impliquent l'évaluation du budget, du temps et du personnel, ainsi que la prise en compte des besoins techniques tels que les caméras haute résolution et le traitement des données en temps réel. De plus, les contraintes réglementaires en matière de confidentialité et de sécurité des données doivent être prises en compte.
Link to this sectionFixer des objectifs mesurables#
Fixer des objectifs mesurables est essentiel à la réussite d'un projet de vision par ordinateur. Des objectifs efficaces suivent les critères SMART :
| Critère | Signification |
|---|---|
| Spécifique | Définit des objectifs clairs et détaillés. |
| Mesurable | S'assure que les objectifs sont quantifiables. |
| Atteignable | Fixe des cibles réalistes selon tes capacités. |
| Pertinent | Aligne les objectifs avec les buts globaux de ton projet. |
| Temporel | Fixe des échéances pour chaque objectif. |
Pour l'exemple de l'estimation de la vitesse sur autoroute, les objectifs SMART pourraient être :
- Atteindre au moins 95 % de précision dans la détection de vitesse en six mois, en utilisant un jeu de données de 10 000 images de véhicules.
- Le système doit être capable de traiter des flux vidéo en temps réel à 30 images par seconde avec un délai minimal.
En fixant des objectifs spécifiques et quantifiables, tu peux suivre efficacement les progrès, identifier les domaines à améliorer et t'assurer que le projet reste sur la bonne voie.
Link to this sectionComment choisir la bonne tâche de vision par ordinateur#
Ton énoncé de problème t'aide à conceptualiser quelle tâche de vision par ordinateur peut résoudre ton problème. Les tâches les plus populaires incluent la classification d'images, la détection d'objets et la segmentation d'images — consulte la page des tâches Ultralytics pour une comparaison détaillée.
Par exemple, si ton problème consiste à surveiller la vitesse des véhicules sur une autoroute, la tâche pertinente est le suivi d'objets. Le suivi est adapté car il suit chaque véhicule à travers les images vidéo avec un identifiant persistant, ce qui est nécessaire au calcul de la vitesse.
D'autres tâches sont moins adaptées seules. La détection d'objets, par exemple, localise les véhicules dans chaque image mais ne maintient pas l'identité de chaque véhicule entre les images — et sans cette identité, le système ne peut pas mesurer le mouvement dans le temps. Une fois que tu as identifié la tâche de vision par ordinateur appropriée, elle guide plusieurs aspects critiques de ton projet, comme le choix du modèle, la préparation du jeu de données et les approches d'entraînement du modèle.
Link to this sectionQu'est-ce qui arrive en premier : modèle, données ou approche d'entraînement ?#
L'ordre du choix du modèle, de la préparation du jeu de données et de l'approche d'entraînement dépend des spécificités de ton projet :
| Ta situation | Commence par | Exemple |
|---|---|---|
| Problème et objectifs bien définis | Choix du modèle | Pour un système de surveillance du trafic qui estime la vitesse des véhicules, choisis un modèle de suivi d'objets, collecte et annote des vidéos d'autoroute, puis entraîne avec des techniques de traitement vidéo en temps réel. |
| Données uniques ou limitées | Préparation du jeu de données | Pour un système de reconnaissance faciale avec un petit jeu de données, annote les données en premier, puis sélectionne un modèle qui fonctionne bien avec des données limitées — comme un modèle pré-entraîné pour l'apprentissage par transfert — et planifie une augmentation de données pour agrandir le jeu de données. |
| L'expérimentation est cruciale (recherche) | Approche d'entraînement | Dans un projet explorant de nouvelles méthodes pour détecter des défauts de fabrication, expérimente d'abord sur un petit sous-ensemble de données. Une fois que tu trouves une technique prometteuse, sélectionne un modèle adapté à ces résultats et prépare un jeu de données complet. |
Si tu commences par les données, la Plateforme Ultralytics simplifie l'organisation, l'annotation et l'entraînement du jeu de données au fur et à mesure que ton projet évolue.
Link to this sectionComment les options de déploiement affectent ton projet#
Les options de déploiement de modèle ont un impact critique sur les performances de ton projet de vision par ordinateur, donc prends-les en compte dès le début. L'environnement de déploiement doit gérer la charge computationnelle de ton modèle :
| Option de déploiement | Idéal pour | Technologies d'exemple |
|---|---|---|
| Appareils de périphérie (Edge) | Smartphones et appareils IoT avec des ressources de calcul limitées ; modèles légers | TensorFlow Lite, ONNX Runtime |
| Serveurs cloud | Modèles complexes avec des exigences de calcul plus élevées ; matériel évolutif avec le projet | AWS, Google Cloud, Azure |
| Serveurs sur site | Besoins élevés en confidentialité des données et sécurité ; contrôle total sur les données et l'infrastructure | Serveurs GPU auto-hébergés |
| Solutions hybrides | Équilibre entre performance, coût et latence ; traitement en périphérie plus analyse cloud | Combinaison d'exécutions en périphérie et de plateformes cloud |
Chaque option offre des avantages et des défis différents, et le choix dépend des exigences spécifiques du projet comme la performance, le coût et la sécurité.
Link to this sectionConclusion#
Un projet de vision par ordinateur réussi commence par un énoncé de problème clair, des objectifs mesurables SMART et la bonne tâche de vision par ordinateur pour le travail — ces décisions guident tout ce qui suit, du choix du modèle au déploiement. Comme prochaine étape, apprends à collecter et annoter des données, ou discute de ton projet avec d'autres développeurs sur GitHub et le serveur Discord d'Ultralytics.
Link to this sectionFAQ#
Link to this sectionComment définir un énoncé de problème clair pour mon projet de vision par ordinateur ?#
Un énoncé de problème clair nomme le problème central que ton projet résout, son périmètre, les utilisateurs finaux et les parties prenantes, ainsi que tes contraintes de ressources et réglementaires. Travaille sur ces quatre parties dans l'ordre, puis valide l'énoncé avec les parties prenantes avant de prendre des décisions techniques. Consulte Comment rédiger un énoncé de problème de vision par ordinateur pour le détail complet et un exemple concret.
Link to this sectionComment choisir la bonne tâche de vision par ordinateur pour mon problème ?#
Fais correspondre la sortie dont ton problème a besoin avec la tâche qui la produit : une étiquette unique par image pointe vers la classification d'images, les localisations d'objets pointent vers la détection d'objets, les frontières au niveau du pixel pointent vers la segmentation d'images, et les identités maintenues à travers les images vidéo pointent vers le suivi d'objets. La surveillance des vitesses des véhicules, par exemple, nécessite le suivi car la vitesse est calculée à partir du mouvement de chaque véhicule dans le temps. Consulte la page des tâches Ultralytics pour toutes les tâches prises en charge.
Link to this sectionComment fixer des objectifs mesurables efficaces pour mon projet de vision par ordinateur ?#
Utilise les critères SMART : Spécifique, Mesurable, Atteignable, Pertinent et Temporel. Par exemple, "Atteindre 95 % de précision dans la détection de vitesse en six mois en utilisant un jeu de données de 10 000 images de véhicules". Cette approche aide à suivre les progrès et identifie les domaines à améliorer. En savoir plus sur la fixation d'objectifs mesurables.
Link to this sectionUn modèle pré-entraîné peut-il se souvenir des classes qu'il connaissait avant un entraînement personnalisé ?#
Non, les modèles pré-entraînés ne "se souviennent" pas des classes au sens traditionnel. Ils apprennent des motifs à partir de jeux de données massifs, et lors de l'entraînement personnalisé (fine-tuning), ces motifs sont ajustés pour ta tâche spécifique. La capacité du modèle est limitée, et se concentrer sur de nouvelles informations peut écraser certains apprentissages précédents.
Si tu souhaites utiliser les classes sur lesquelles le modèle a été pré-entraîné, une approche pratique consiste à utiliser deux modèles : l'un conserve les performances d'origine, et l'autre est affiné pour ta tâche spécifique. De cette façon, tu peux combiner les sorties des deux modèles. Il existe d'autres options comme le gel des couches, l'utilisation du modèle pré-entraîné comme extracteur de caractéristiques, et la spécialisation par branche, mais ce sont des solutions plus complexes qui nécessitent plus d'expertise.
Link to this sectionComment les options de déploiement affectent-elles mon projet de vision par ordinateur ?#
Les options de déploiement déterminent quelles tailles et quels formats de modèle sont viables, donc elles façonnent ton projet dès le début. Les appareils de périphérie ont besoin de modèles légers servis via des formats et des exécutions comme TensorFlow Lite ou ONNX Runtime, les serveurs cloud gèrent des modèles complexes sur du matériel évolutif, les serveurs sur site donnent un contrôle total des données pour les projets sensibles à la confidentialité, et les configurations hybrides équilibrent les deux. Compare-les dans le tableau des options de déploiement, ou consulte le guide des options de déploiement de modèle pour plus de détails.
Link to this sectionQuels sont les défis les plus courants pour définir un problème de vision par ordinateur ?#
Les défis courants incluent :
- Des énoncés de problème vagues ou trop larges.
- Des objectifs irréalistes.
- Un manque d'alignement des parties prenantes.
- Une compréhension insuffisante des contraintes techniques.
- Sous-estimer les exigences en matière de données.
Résous ces défis grâce à une recherche initiale approfondie, une communication claire avec les parties prenantes et un affinement itératif de l'énoncé du problème et des objectifs. Pour le flux de travail complet du projet, consulte les étapes clés d'un projet de vision par ordinateur.