Comprendre les étapes clés d'un projet de vision par ordinateur

Introduction

La vision par ordinateur est un sous-domaine de l'intelligence artificielle (IA) qui aide les ordinateurs à voir et à comprendre le monde comme le font les humains. Elle traite et analyse des images ou des vidéos pour en extraire des informations, reconnaître des modèles et prendre des décisions en fonction de ces données.

Les techniques de vision par ordinateur telles que la détection d'objets, la classification d'images et la segmentation d'instances peuvent être appliquées dans divers secteurs, de la conduite autonome à l'imagerie médicale, afin d'obtenir des informations précieuses.

Aperçu des techniques de vision par ordinateur

Travailler sur vos propres projets de vision par ordinateur est un excellent moyen de comprendre et d’en apprendre davantage sur la vision par ordinateur. Cependant, un projet de vision par ordinateur peut comporter de nombreuses étapes, et cela peut sembler déroutant au début. À la fin de ce guide, vous serez familiarisé avec les étapes d’un projet de vision par ordinateur. Nous passerons en revue tout du début à la fin d’un projet, en expliquant pourquoi chaque partie est importante. Commençons et faisons de votre projet de vision par ordinateur un succès !

Aperçu d'un projet de vision par ordinateur

Avant d’aborder les détails de chaque étape d’un projet de vision par ordinateur, examinons le processus global. Si vous avez commencé un projet de vision par ordinateur aujourd’hui, vous devez suivre les étapes suivantes :

Votre première priorité serait de comprendre les exigences de votre projet.
Ensuite, vous collecterez et étiqueterez avec précision les images qui aideront à entraîner votre modèle.
Ensuite, vous nettoyez vos données et appliquez des techniques d’augmentation pour les préparer à l’entraînement du modèle.
Après l’entraînement du modèle, vous testez et évaluez minutieusement votre modèle pour vous assurer qu’il fonctionne de manière cohérente dans différentes conditions.
Enfin, vous déployez votre modèle dans le monde réel et le mettez à jour en fonction de nouvelles informations et de nouveaux commentaires.

Vue d'ensemble des étapes du projet Vision par ordinateur

Maintenant que nous savons à quoi nous attendre, plongeons dans les étapes et faisons avancer ton projet.

Étape 1 : Définir les objectifs de votre projet

La première étape de tout projet de vision par ordinateur consiste à définir clairement le problème que vous essayez de résoudre. Connaître l’objectif final vous aide à commencer à construire une solution. Cela est particulièrement vrai en matière de vision par ordinateur, car l’objectif de votre projet affectera directement la tâche de vision par ordinateur sur laquelle vous devez vous concentrer.

Voici quelques exemples d'objectifs de projets et de tâches de vision par ordinateur qui peuvent être utilisées pour atteindre ces objectifs :

Objectif : Développer un système capable de surveiller et de gérer le flux de différents types de véhicules sur les autoroutes, afin d'améliorer la gestion du trafic et la sécurité.
- Tâche de vision par ordinateur : La détection d'objets est idéale pour la surveillance du trafic car elle permet de localiser et d'identifier efficacement plusieurs véhicules. Elle est moins exigeante en termes de calcul que la segmentation d'image, qui fournit des détails inutiles pour cette tâche, ce qui garantit une analyse plus rapide et en temps réel.
Objectif : Développer un outil qui aide les radiologues en fournissant des contours précis, au niveau des pixels, des tumeurs dans les scans d'imagerie médicale.
- Tâche de vision par ordinateur : La segmentation d'image est adaptée à l'imagerie médicale car elle fournit des limites précises et détaillées des tumeurs qui sont cruciales pour évaluer la taille, la forme et la planification du traitement.
Objectif : Créer un système numérique qui catégorise divers documents (par exemple, factures, reçus, documents juridiques) afin d'améliorer l'efficacité de l'organisation et la recherche de documents.
- Tâche de vision par ordinateur : La classification d'images est idéale ici car elle traite un document à la fois, sans qu'il soit nécessaire de prendre en compte la position du document dans l'image. Cette approche simplifie et accélère le processus de tri.

Étape 1.5 : Choisir le bon modèle et la bonne méthode de formation

Après avoir compris l'objectif du projet et les tâches de vision par ordinateur appropriées, une partie essentielle de la définition de l'objectif du projet consiste à sélectionner le bon modèle et la bonne approche de formation.

En fonction de l'objectif, tu peux choisir de sélectionner le modèle en premier ou après avoir vu les données que tu es en mesure de collecter à l'étape 2. Par exemple, supposons que ton projet dépende fortement de la disponibilité de certains types de données. Dans ce cas, il peut être plus pratique de recueillir et d'analyser d'abord les données avant de sélectionner un modèle. D'un autre côté, si tu comprends bien les exigences du modèle, tu peux choisir le modèle d'abord, puis collecter les données qui correspondent à ces spécifications.

Le choix entre l’entraînement à partir de zéro ou l’utilisation de l’apprentissage par transfert affecte la façon dont vous préparez vos données. L’entraînement à partir de zéro nécessite un ensemble de données diversifié pour construire la compréhension du modèle à partir de zéro. L’apprentissage par transfert, quant à lui, vous permet d’utiliser un modèle pré-entraîné et de l’adapter avec un ensemble de données plus petit et plus spécifique. En outre, le choix d’un modèle spécifique à entraîner déterminera la façon dont vous devez préparer vos données, comme le redimensionnement des images ou l’ajout d’annotations, en fonction des exigences spécifiques du modèle.

Formation à partir de zéro ou utilisation de l'apprentissage par transfert

Remarque : lorsque tu choisis un modèle, tiens compte de son déploiement pour assurer sa compatibilité et ses performances. Par exemple, les modèles légers sont idéaux pour l'informatique de périphérie en raison de leur efficacité sur les appareils à ressources limitées. Pour en savoir plus sur les points clés liés à la définition de ton projet, lis notre guide sur la définition des objectifs de ton projet et le choix du bon modèle.

Avant de se lancer dans les travaux pratiques d'un projet de vision par ordinateur, il est important de bien comprendre ces détails. Vérifie que tu as bien pris en compte les points suivants avant de passer à l'étape 2 :

Définissez clairement le problème que vous essayez de résoudre.
Détermine l'objectif final de ton projet.
Identifie la tâche spécifique de vision par ordinateur nécessaire (par exemple, la détection d'objets, la classification d'images, la segmentation d'images).
Décide de former un modèle à partir de zéro ou d'utiliser l'apprentissage par transfert.
Choisis le modèle approprié à ta tâche et à tes besoins de déploiement.

Étape 2 : Collecte et annotation des données

La qualité de tes modèles de vision par ordinateur dépend de la qualité de ton ensemble de données. Tu peux soit collecter des images sur Internet, soit prendre tes propres photos, soit utiliser des ensembles de données préexistants. Voici quelques ressources intéressantes pour télécharger des ensembles de données de haute qualité : Google Dataset Search Engine, UC Irvine Machine Learning Repository, et Kaggle Datasets.

Certaines bibliothèques, comme Ultralytics, offrent une prise en charge intégrée de divers ensembles de données, ce qui facilite le démarrage avec des données de haute qualité. Ces bibliothèques comprennent souvent des utilitaires permettant d'utiliser des ensembles de données populaires de façon transparente, ce qui peut te faire gagner beaucoup de temps et d'efforts dans les premières étapes de ton projet.

Cependant, si vous choisissez de collecter des images ou de prendre vos propres photos, vous devrez annoter vos données. L’annotation de données est le processus d’étiquetage de vos données pour transmettre des connaissances à votre modèle. Le type d’annotation de données avec lequel vous travaillerez dépend de votre technique de vision par ordinateur spécifique. Voici quelques exemples :

Classification des images : Tu vas étiqueter l'image entière comme une seule classe.
Détection d'objets : Tu dessineras des boîtes de délimitation autour de chaque objet de l'image et tu étiquetteras chaque boîte.
Segmentation d'image : Tu étiqueteras chaque pixel de l'image en fonction de l'objet auquel il appartient, créant ainsi des limites d'objets détaillées.

Différents types d'annotation d'images

La collecte et l'annotation des données peuvent être un effort manuel qui prend beaucoup de temps. Les outils d'annotation peuvent faciliter ce processus. Voici quelques outils d'annotation ouverts utiles : LabeI Studio, CVAT et Labelme.

Étape 3 : Augmentation des données et division de ton ensemble de données

Après avoir collecté et annoté tes données d'images, il est important de diviser ton ensemble de données en ensembles de formation, de validation et de test avant de procéder à l'augmentation des données. Il est essentiel de diviser ton ensemble de données avant de procéder à l'augmentation pour tester et valider ton modèle sur des données originales et non modifiées. Cela permet d'évaluer avec précision la capacité de généralisation du modèle à de nouvelles données inédites.

Voici comment diviser tes données :

Ensemble de formation : Il s'agit de la plus grande partie de tes données, généralement 70 à 80 % du total, utilisée pour former ton modèle.
Ensemble de validation : Généralement, environ 10 à 15 % de tes données ; cet ensemble est utilisé pour régler les hyperparamètres et valider le modèle pendant l'entraînement, ce qui permet d'éviter le surajustement.
Ensemble de test : Les 10 à 15 % restants de tes données sont mis de côté en tant qu'ensemble de test. Il sert à évaluer les performances du modèle sur des données inédites une fois la formation terminée.

Après avoir divisé tes données, tu peux procéder à l'augmentation des données en appliquant des transformations telles que la rotation, la mise à l'échelle et le retournement des images pour augmenter artificiellement la taille de ton ensemble de données. L'augmentation des données rend ton modèle plus robuste aux variations et améliore ses performances sur des images inédites.

Des bibliothèques comme OpenCV, Albumentations et TensorFlow offrent des fonctions d'augmentation flexibles que tu peux utiliser. En outre, certaines bibliothèques, telles que Ultralytics, intègrent des paramètres d'augmentation directement dans la fonction d'apprentissage du modèle, ce qui simplifie le processus.

Pour mieux comprendre tes données, tu peux utiliser des outils comme Matplotlib ou Seaborn pour visualiser les images et analyser leur distribution et leurs caractéristiques. La visualisation de tes données permet d'identifier les schémas, les anomalies et l'efficacité de tes techniques d'augmentation. Tu peux aussi utiliser Ultralytics Explorer, un outil qui permet d'explorer les ensembles de données de vision par ordinateur à l'aide de la recherche sémantique, des requêtes SQL et de la recherche de similarités vectorielles.

L'outil d'exploration Ultralytics

En comprenant, divisant et augmentant correctement tes données, tu peux développer un modèle bien entraîné, validé et testé qui donne de bons résultats dans les applications du monde réel.

Étape 4 : Formation au modèle

Une fois que ton jeu de données est prêt pour la formation, tu peux te concentrer sur la mise en place de l'environnement nécessaire, la gestion de tes jeux de données et la formation de ton modèle.

Tout d’abord, vous devez vous assurer que votre environnement est correctement configuré. En règle générale, cela comprend les éléments suivants :

Installer les bibliothèques et les cadres essentiels comme TensorFlow, PyTorch, ou Ultralytics.
Si tu utilises un site GPU, l'installation de bibliothèques telles que CUDA et cuDNN te permettra d'activer l'accélération GPU et d'accélérer le processus d'apprentissage.

Ensuite, tu peux charger tes ensembles de données d'entraînement et de validation dans ton environnement. Normalise et prétraite les données en les redimensionnant, en convertissant leur format ou en les augmentant. Une fois le modèle sélectionné, configure les couches et spécifie les hyperparamètres. Compile le modèle en définissant la fonction de perte, l'optimiseur et les mesures de performance.

Les bibliothèques comme Ultralytics simplifient le processus de formation. Tu peux commencer la formation en introduisant des données dans le modèle avec un minimum de code. Ces bibliothèques gèrent automatiquement les ajustements de poids, la rétropropagation et la validation. Elles proposent également des outils permettant de suivre les progrès et d'ajuster facilement les hyperparamètres. Après l'entraînement, enregistre le modèle et ses poids en quelques commandes.

Il est important de garder à l'esprit qu'une bonne gestion des ensembles de données est vitale pour une formation efficace. Utilise le contrôle de version pour les ensembles de données afin de suivre les modifications et d'assurer la reproductibilité. Des outils tels que DVC (Data Version Control) peuvent aider à gérer de grands ensembles de données.

Étape 5 : Évaluation et perfectionnement du modèle

Il est important d'évaluer les performances de ton modèle à l'aide de diverses mesures et de l'affiner pour en améliorer la précision. L'évaluation permet d'identifier les domaines dans lesquels le modèle excelle et ceux dans lesquels il peut avoir besoin d'être amélioré. Le peaufinage permet de s'assurer que le modèle est optimisé pour obtenir les meilleures performances possibles.

Mesures de performance: Utilise des mesures telles que l'exactitude, la précision, le rappel et le score F1 pour évaluer les performances de ton modèle. Ces mesures fournissent des indications sur la qualité des prédictions de ton modèle.
Réglage des hyperparamètres : Ajuste les hyperparamètres pour optimiser les performances du modèle. Des techniques telles que la recherche en grille ou la recherche aléatoire peuvent aider à trouver les meilleures valeurs d'hyperparamètres.
Mise au point : Effectue de petits ajustements à l'architecture du modèle ou au processus de formation pour améliorer les performances. Il peut s'agir de modifier les taux d'apprentissage, la taille des lots ou d'autres paramètres du modèle.

Étape 6 : Test du modèle

Au cours de cette étape, tu peux t'assurer que ton modèle fonctionne bien sur des données totalement inédites, confirmant ainsi qu'il est prêt à être déployé. La différence entre le test de modèle et l'évaluation de modèle est qu'il se concentre sur la vérification des performances du modèle final plutôt que sur son amélioration itérative.

Il est important de faire des tests approfondis et de déboguer tous les problèmes courants qui peuvent survenir. Teste ton modèle sur un ensemble de données de test distinct qui n'a pas été utilisé pendant la formation ou la validation. Cet ensemble de données doit représenter des scénarios du monde réel pour s'assurer que les performances du modèle sont cohérentes et fiables.

Aborde également les problèmes courants tels que l'ajustement excessif, l'ajustement insuffisant et les fuites de données. Utilise des techniques comme la validation croisée et la détection des anomalies pour identifier et résoudre ces problèmes.

Étape 7 : Déploiement du modèle

Une fois que ton modèle a été soigneusement testé, il est temps de le déployer. Le déploiement consiste à rendre ton modèle disponible pour une utilisation dans un environnement de production. Voici les étapes du déploiement d'un modèle de vision par ordinateur :

Mise en place de l'environnement : Configure l'infrastructure nécessaire à l'option de déploiement que tu as choisie, qu'elle soit basée sur le cloud (AWS, Google Cloud, Azure) ou sur la périphérie (appareils locaux, IoT).
Exporter le modèle: Exporte ton modèle au format approprié (par exemple, ONNX, TensorRT, CoreML pour YOLOv8) pour assurer la compatibilité avec ta plateforme de déploiement.
Déployer le modèle : Déploie le modèle en mettant en place des API ou des points d'extrémité et en l'intégrant à ton application.
Assurer l'évolutivité: Mets en place des équilibreurs de charge, des groupes de mise à l'échelle automatique et des outils de surveillance pour gérer les ressources et faire face à l'augmentation des données et des demandes des utilisateurs.

Étape 8 : Surveillance, entretien et documentation

Une fois votre modèle déployé, il est important de surveiller en permanence ses performances, de le maintenir pour gérer les problèmes et de documenter l’ensemble du processus pour référence et améliorations futures.

Les outils de surveillance peuvent t'aider à suivre les indicateurs clés de performance (ICP) et à détecter les anomalies ou les baisses de précision. En surveillant le modèle, tu peux être conscient de la dérive du modèle, où les performances du modèle diminuent au fil du temps en raison des changements dans les données d'entrée. Entraîne périodiquement le modèle avec des données mises à jour pour maintenir sa précision et sa pertinence.

Surveillance du modèle

En plus de la surveillance et de la maintenance, la documentation est également essentielle. Documente minutieusement l'ensemble du processus, y compris l'architecture du modèle, les procédures d'entraînement, les hyperparamètres, les étapes de prétraitement des données et toutes les modifications apportées au cours du déploiement et de la maintenance. Une bonne documentation garantit la reproductibilité et facilite les mises à jour futures ou le dépannage. En surveillant, en entretenant et en documentant efficacement ton modèle, tu peux t'assurer qu'il reste précis, fiable et facile à gérer tout au long de son cycle de vie.

S'engager auprès de la communauté

Se connecter à une communauté de passionnés de vision par ordinateur peut t'aider à aborder en toute confiance les problèmes auxquels tu es confronté lorsque tu travailles sur ton projet de vision par ordinateur. Voici quelques moyens d'apprendre, de dépanner et de travailler en réseau de manière efficace.

Ressources communautaires

GitHub Issues : Consulte le dépôt GitHub YOLOv8 et utilise l'onglet Issues pour poser des questions, signaler des bogues et suggérer de nouvelles fonctionnalités. La communauté active et les mainteneurs sont là pour t'aider à résoudre des problèmes spécifiques.
Ultralytics Serveur Discord : Rejoins le serveur DiscordUltralytics pour interagir avec d'autres utilisateurs et développeurs, obtenir de l'aide et partager des idées.

Documentation officielle

Ultralytics YOLOv8 Documentation : Explore la documentation officielle de YOLOv8 pour trouver des guides détaillés avec des conseils utiles sur différentes tâches et projets de vision par ordinateur.

L'utilisation de ces ressources t'aidera à surmonter les défis et à rester au courant des dernières tendances et des meilleures pratiques dans la communauté de la vision par ordinateur.

Lance ton projet de vision par ordinateur dès aujourd'hui !

Se lancer dans un projet de vision par ordinateur peut être passionnant et gratifiant. En suivant les étapes de ce guide, tu peux construire une base solide pour réussir. Chaque étape est cruciale pour développer une solution qui répond à tes objectifs et fonctionne bien dans les scénarios du monde réel. Au fur et à mesure que tu gagneras en expérience, tu découvriras des techniques et des outils avancés pour améliorer tes projets. Reste curieux, continue d'apprendre et explore de nouvelles méthodes et innovations !

FAQ

Comment choisir la bonne tâche de vision par ordinateur pour mon projet ?

Le choix de la bonne tâche de vision par ordinateur dépend de l'objectif final de ton projet. Par exemple, si tu veux surveiller la circulation, la détection d'objets est appropriée car elle peut localiser et identifier plusieurs types de véhicules en temps réel. Pour l'imagerie médicale, la segmentation d'image est idéale pour fournir des limites détaillées des tumeurs, ce qui facilite le diagnostic et la planification du traitement. En savoir plus sur des tâches spécifiques comme la détection d'objets, la classification d'images et la segmentation d'instances.

Pourquoi l'annotation des données est-elle cruciale dans les projets de vision par ordinateur ?

L'annotation des données est essentielle pour apprendre à ton modèle à reconnaître les modèles. Le type d'annotation varie en fonction de la tâche :

Classification des images: Toute l'image est étiquetée comme une seule classe.
Détection d'objets: Boîtes de délimitation dessinées autour des objets.
Segmentation d'image: Chaque pixel est étiqueté en fonction de l'objet auquel il appartient.

Des outils tels que Label Studio, CVAT et Labelme peuvent t'aider dans ce processus. Pour plus de détails, reporte-toi à notre guide de collecte et d'annotation des données.

Quelles sont les étapes à suivre pour augmenter et diviser efficacement mon ensemble de données ?

Diviser ton ensemble de données avant l'augmentation permet de valider les performances du modèle sur les données originales, non modifiées. Suis les étapes suivantes :

Ensemble de formation: 70 à 80 % de tes données.
Ensemble de validation: 10-15% pour le réglage des hyperparamètres.
Ensemble de tests: Les 10 à 15 % restants serviront à l'évaluation finale.

Après la division, applique des techniques d'augmentation des données telles que la rotation, la mise à l'échelle et le retournement pour augmenter la diversité des ensembles de données. Des bibliothèques telles que Albumentations et OpenCV peuvent t'aider. Ultralytics propose également des paramètres d'augmentation intégrés pour plus de commodité.

Comment puis-je exporter mon modèle de vision par ordinateur entraîné pour le déployer ?

L'exportation de ton modèle garantit la compatibilité avec les différentes plates-formes de déploiement. Ultralytics propose plusieurs formats, dont ONNX, TensorRT, et CoreML. Pour exporter ton modèle YOLOv8 , suis ce guide :

Utilise le export avec le paramètre de format souhaité.
Assure-toi que le modèle exporté correspond aux spécifications de ton environnement de déploiement (par exemple, appareils périphériques, nuage).

Pour plus d'informations, consulte le guide d'exportation des modèles.

Quelles sont les meilleures pratiques pour surveiller et entretenir un modèle de vision par ordinateur déployé ?

Le suivi et la maintenance continus sont essentiels à la réussite à long terme d'un modèle. Mets en place des outils pour suivre les indicateurs clés de performance (ICP) et détecter les anomalies. Entraîne régulièrement le modèle avec des données mises à jour pour contrer la dérive du modèle. Documenter l'ensemble du processus, y compris l'architecture du modèle, les hyperparamètres et les changements, afin de garantir la reproductibilité et la facilité des mises à jour futures. Pour en savoir plus, consulte notre guide sur la surveillance et la maintenance.

Créé le 2024-05-29, Mis à jour le 2024-07-05
Auteurs : glenn-jocher (6), abirami-vina (2)