Maintenance de vos modèles de vision par ordinateur après le déploiement

Introduction

Si vous êtes ici, nous pouvons supposer que vous avez effectué de nombreuses étapes dans votre projet de vision par ordinateur : de la collecte des exigences, l'annotation des données et l'entraînement du modèle à enfin le déploiement. Votre application est maintenant en production, mais votre projet ne s'arrête pas là. La partie la plus importante d'un projet de vision par ordinateur est de s'assurer que votre modèle continue d'atteindre les objectifs de votre projet au fil du temps, et c'est là que la surveillance, la maintenance et la documentation de votre modèle de vision par ordinateur entrent en jeu.

Regarder : Comment maintenir les modèles de vision par ordinateur après le déploiement | Détection de la dérive des données

Dans ce guide, nous examinerons de plus près comment maintenir vos modèles de vision par ordinateur après leur déploiement. Nous verrons comment la surveillance des modèles peut vous aider à détecter les problèmes rapidement, comment maintenir votre modèle précis et à jour, et pourquoi la documentation est importante pour le dépannage.

La surveillance du modèle est essentielle

Il est essentiel de surveiller de près vos modèles de vision par ordinateur déployés. Sans une surveillance appropriée, les modèles peuvent perdre en précision. Un problème courant est le décalage de la distribution des données ou la dérive des données, où les données que le modèle rencontre diffèrent de celles sur lesquelles il a été entraîné. Lorsque le modèle doit faire des prédictions sur des données qu'il ne reconnaît pas, cela peut entraîner des erreurs d'interprétation et de mauvaises performances. Les valeurs aberrantes, ou points de données inhabituels, peuvent également fausser la précision du modèle.

Une surveillance régulière des modèles aide les développeurs à suivre les performances du modèle, à détecter les anomalies et à résoudre rapidement les problèmes tels que la dérive des données. Elle permet également de gérer les ressources en indiquant quand des mises à jour sont nécessaires, en évitant les refontes coûteuses et en assurant la pertinence du modèle.

Meilleures pratiques pour la surveillance des modèles

Voici quelques bonnes pratiques à garder à l'esprit lors de la surveillance de votre modèle de vision par ordinateur en production :

Surveiller régulièrement les performances du suivi : Surveiller en permanence les performances du modèle afin de détecter les changements au fil du temps.
Vérifiez la qualité des données : Recherchez les valeurs manquantes ou les anomalies dans les données.
Utiliser diverses sources de données : Surveillez les données provenant de diverses sources afin d’obtenir une vue d’ensemble des performances du modèle.
Combiner les techniques de surveillance : Utilisez un mélange d’algorithmes de détection de dérive et d’approches basées sur des règles pour identifier un large éventail de problèmes.
Surveiller les entrées et les sorties : Gardez un œil sur les données traitées par le modèle et sur les résultats qu’il produit pour vous assurer que tout fonctionne correctement.
Configurer les alertes : Mettez en œuvre des alertes pour les comportements inhabituels, tels que les baisses de performances, afin de pouvoir prendre des mesures correctives rapides.

Outils de surveillance des modèles d'IA

Vous pouvez utiliser des outils de surveillance automatisés pour faciliter la surveillance des modèles après le déploiement. De nombreux outils offrent des informations en temps réel et des capacités d'alerte. Voici quelques exemples d'outils de surveillance de modèles open source qui peuvent fonctionner ensemble :

Prometheus : Prometheus est un outil de surveillance open source qui collecte et stocke des métriques pour un suivi détaillé des performances. Il s'intègre facilement à Kubernetes et Docker, collectant des données à intervalles définis et les stockant dans une base de données de séries chronologiques. Prometheus peut également extraire des points de terminaison HTTP pour collecter des métriques en temps réel. Les données collectées peuvent être interrogées à l'aide du langage PromQL.
Grafana : Grafana est un outil open source de visualisation des données et de surveillance qui vous permet d'interroger, de visualiser, d'alerter et de comprendre vos mesures, quel que soit l'endroit où elles sont stockées. Il fonctionne bien avec Prometheus et offre des fonctionnalités avancées de visualisation des données. Vous pouvez créer des tableaux de bord personnalisés pour afficher des mesures importantes pour vos modèles de vision par ordinateur, telles que la latence d'inférence, les taux d'erreur et l'utilisation des ressources. Grafana transforme les données collectées en tableaux de bord faciles à lire avec des graphiques linéaires, des cartes thermiques et des histogrammes. Il prend également en charge les alertes, qui peuvent être envoyées via des canaux tels que Slack pour informer rapidement les équipes de tout problème.
Evidently AI : Evidently AI est un outil open source conçu pour la surveillance et le débogage des modèles d’apprentissage automatique en production. Il génère des rapports interactifs à partir de pandas DataFrames, ce qui permet d’analyser les modèles d’apprentissage automatique. Evidently AI peut detecter la dérive des données, la dégradation des performances du modèle et d’autres problèmes qui peuvent survenir avec vos modèles déployés.

Les trois outils présentés ci-dessus, Evidently AI, Prometheus et Grafana, peuvent fonctionner ensemble de manière transparente en tant que solution de surveillance ML entièrement open source, prête pour la production. Evidently AI est utilisé pour collecter et calculer les métriques, Prometheus stocke ces métriques et Grafana les affiche et configure des alertes. Bien qu'il existe de nombreux autres outils disponibles, cette configuration est une option open source intéressante qui offre des capacités robustes pour la surveillance des modèles et la maintenance de vos modèles.

Aperçu des outils de surveillance de modèles Open Source

Détection d'anomalies et systèmes d'alerte

Une anomalie est tout point de données ou motif qui s'écarte considérablement de ce qui est attendu. En ce qui concerne les modèles de vision par ordinateur, les anomalies peuvent être des images très différentes de celles sur lesquelles le modèle a été entraîné. Ces images inattendues peuvent être des signes de problèmes tels que des changements dans la distribution des données, des valeurs aberrantes ou des comportements susceptibles de réduire les performances du modèle. La mise en place de systèmes d'alerte pour détecter ces anomalies est un élément important de la surveillance des modèles.

En définissant des niveaux de performance et des limites standard pour les indicateurs clés, vous pouvez détecter les problèmes à un stade précoce. Lorsque les performances dépassent ces limites, des alertes sont déclenchées, ce qui incite à des corrections rapides. La mise à jour et le réentraînement réguliers des modèles avec de nouvelles données les maintiennent pertinents et précis à mesure que les données évoluent.

Éléments à garder à l'esprit lors de la configuration des seuils et des alertes

Lorsque vous configurez vos systèmes d'alerte, gardez à l'esprit les meilleures pratiques suivantes :

Alertes standardisées : Utilisez des outils et des formats cohérents pour toutes les alertes, tels que les e-mails ou les applications de messagerie comme Slack. La standardisation vous permet de comprendre et de répondre rapidement aux alertes.
Inclure le comportement attendu : Les messages d'alerte doivent indiquer clairement ce qui n'a pas fonctionné, ce qui était attendu et le délai évalué. Cela vous aide à évaluer l'urgence et le contexte de l'alerte.
Alertes configurables : Configurez facilement les alertes pour vous adapter aux conditions changeantes. Modifiez les seuils, mettez en veille, désactivez ou accusez réception des alertes.

Détection de la dérive des données

La détection de la dérive des données est un concept qui aide à identifier le moment où les propriétés statistiques des données d'entrée changent au fil du temps, ce qui peut dégrader les performances du modèle. Avant de décider de réentraîner ou d'ajuster vos modèles, cette technique permet de repérer qu'il y a un problème. La dérive des données traite des changements dans le paysage global des données au fil du temps, tandis que la détection d'anomalies se concentre sur l'identification des points de données rares ou inattendus qui peuvent nécessiter une attention immédiate.

Pipeline de surveillance de la détection de dérive des données

Voici plusieurs méthodes pour detect la dérive des données :

Surveillance continue : Surveillez régulièrement les données d'entrée et les sorties du modèle pour détecter les signes de dérive. Suivez les indicateurs clés et comparez-les aux données historiques pour identifier les changements importants.

Techniques statistiques : Utilisez des méthodes telles que le test de Kolmogorov-Smirnov ou l'indice de stabilité de la population (PSI) pour détecter les changements dans les distributions de données. Ces tests comparent la distribution des nouvelles données avec les données d'entraînement pour identifier les différences significatives.

Dérive des caractéristiques : Surveillez la dérive des caractéristiques individuelles. Parfois, la distribution globale des données peut rester stable, mais les caractéristiques individuelles peuvent dériver. L'identification des caractéristiques qui dérivent aide à affiner le processus de réentraînement.

Maintenance du modèle

La maintenance du modèle est essentielle pour maintenir la précision et la pertinence des modèles de vision par ordinateur au fil du temps. La maintenance du modèle implique la mise à jour et le réentraînement réguliers des modèles, la gestion de la dérive des données et la garantie que le modèle reste pertinent à mesure que les données et les environnements changent. Vous vous demandez peut-être en quoi la maintenance du modèle diffère de la surveillance du modèle. La surveillance consiste à observer les performances du modèle en temps réel pour détecter rapidement les problèmes. La maintenance, d'autre part, consiste à résoudre ces problèmes.

Mises à jour régulières et réentraînement

Une fois qu'un modèle est déployé, lors de la surveillance, vous pouvez remarquer des changements dans les modèles de données ou les performances, indiquant une dérive du modèle. Des mises à jour régulières et un réentraînement deviennent des éléments essentiels de la maintenance du modèle pour garantir que le modèle peut gérer de nouveaux modèles et scénarios. Il existe quelques techniques que vous pouvez utiliser en fonction de la façon dont vos données évoluent.

Causes de la dérive des modèles de vision par ordinateur

Par exemple, si les données évoluent progressivement au fil du temps, l'apprentissage incrémentiel est une bonne approche. L'apprentissage incrémentiel implique la mise à jour du modèle avec de nouvelles données sans avoir à le réentraîner complètement à partir de zéro, ce qui permet d'économiser des ressources de calcul et du temps. Toutefois, si les données ont radicalement changé, un réentraînement complet périodique pourrait être une meilleure option pour s'assurer que le modèle ne suradapte pas aux nouvelles données tout en perdant la trace des anciens schémas.

Quelle que soit la méthode, la validation et les tests sont indispensables après les mises à jour. Il est important de valider le modèle sur un ensemble de données de test distinct pour vérifier les améliorations ou la dégradation des performances.

Décider quand réentraîner votre modèle

La fréquence de réentraînement de votre modèle de vision par ordinateur dépend des modifications des données et des performances du modèle. Réentraînez votre modèle chaque fois que vous observez une baisse significative des performances ou que vous détectez une dérive des données. Des évaluations régulières peuvent aider à déterminer le calendrier de réentraînement approprié en testant le modèle par rapport à de nouvelles données. La surveillance des indicateurs de performance et des modèles de données vous permet de décider si votre modèle a besoin de mises à jour plus fréquentes pour maintenir la précision.

Organigramme « Quand faut-il réentraîner les modèles ML ? »

Documentation

Documenter un projet de vision par ordinateur facilite sa compréhension, sa reproduction et la collaboration. Une bonne documentation couvre l'architecture du modèle, les hyperparamètres, les ensembles de données, les métriques d'évaluation, et plus encore. Elle assure la transparence, aidant les membres de l'équipe et les parties prenantes à comprendre ce qui a été fait et pourquoi. La documentation facilite également le dépannage, la maintenance et les améliorations futures en fournissant une référence claire des décisions et des méthodes passées.

Éléments clés à documenter

Voici quelques-uns des éléments clés qui devraient être inclus dans la documentation du projet :

Aperçu du projet : Fournissez un résumé de haut niveau du projet, y compris l'énoncé du problème, l'approche de la solution, les résultats attendus et la portée du projet. Expliquez le rôle de la vision par ordinateur dans la résolution du problème et décrivez les étapes et les livrables.
Architecture du modèle: Détaillez la structure et la conception du modèle, y compris ses composants, ses couches et ses connexions. Expliquez les hyperparamètres choisis et la justification de ces choix.
Préparation des données : Décrivez les sources de données, les types, les formats, les tailles et les étapes de prétraitement. Discutez de la qualité des données, de la fiabilité et de toutes les transformations appliquées avant l'entraînement du modèle.
Processus d’entraînement : Documentez la procédure d’entraînement, y compris les jeux de données utilisés, les paramètres d’entraînement et les fonctions de perte. Expliquez comment le modèle a été entraîné et tous les défis rencontrés au cours de l’entraînement.
Métriques d'évaluation : Spécifiez les métriques utilisées pour évaluer les performances du modèle, telles que la précision (accuracy), la précision (precision), le rappel (recall) et le score F1. Incluez les résultats de performance et une analyse de ces métriques.
Étapes de déploiement : Décrivez les étapes suivies pour déployer le modèle, y compris les outils et les plateformes utilisés, les configurations de déploiement et tous les défis ou considérations spécifiques.
Procédure de surveillance et de maintenance : Fournissez un plan détaillé pour surveiller les performances du modèle après le déploiement. Incluez des méthodes pour détecter et traiter la dérive des données et du modèle, et décrivez le processus de mises à jour et de réentraînement réguliers.

Outils de documentation

Il existe de nombreuses options pour documenter les projets d'IA, les outils open source étant particulièrement populaires. Deux d'entre eux sont les Jupyter Notebooks et MkDocs. Les Jupyter Notebooks vous permettent de créer des documents interactifs avec du code intégré, des visualisations et du texte, ce qui les rend idéaux pour partager des expériences et des analyses. MkDocs est un générateur de sites statiques facile à configurer et à déployer, parfait pour créer et héberger de la documentation de projet en ligne.

Connectez-vous avec la communauté

Rejoindre une communauté de passionnés de vision par ordinateur peut vous aider à résoudre des problèmes et à apprendre plus rapidement. Voici quelques façons de vous connecter, d'obtenir de l'aide et de partager des idées.

Ressources communautaires

Problèmes GitHub : Consultez le dépôt GitHub de YOLO26 et utilisez l'onglet Problèmes pour poser des questions, signaler des bugs et suggérer de nouvelles fonctionnalités. La communauté et les mainteneurs sont très actifs et solidaires.
Serveur Discord Ultralytics : Rejoignez le serveur Discord Ultralytics pour discuter avec d’autres utilisateurs et développeurs, obtenir de l’aide et partager vos expériences.

Documentation officielle

Documentation Ultralytics YOLO26 : Consultez la documentation officielle de YOLO26 pour des guides détaillés et des conseils utiles sur divers projets de vision par ordinateur.

L'utilisation de ces ressources vous aidera à résoudre les défis et à vous tenir au courant des dernières tendances et pratiques dans la communauté de la vision par ordinateur.

Points clés à retenir

Nous avons abordé les principaux conseils pour la surveillance, la maintenance et la documentation de vos modèles de vision par ordinateur. Des mises à jour régulières et un réentraînement aident le modèle à s'adapter aux nouvelles tendances des données. La détection et la correction de la dérive des données aident votre modèle à rester précis. Une surveillance continue permet de détecter les problèmes rapidement, et une bonne documentation facilite la collaboration et les mises à jour futures. En suivant ces étapes, votre projet de vision par ordinateur restera performant et efficace au fil du temps.

FAQ

Comment surveiller les performances de mon modèle de vision par ordinateur déployé ?

Le suivi des performances de votre modèle de vision par ordinateur déployé est crucial pour garantir sa précision et sa fiabilité au fil du temps. Vous pouvez utiliser des outils comme Prometheus, Grafana et Evidently AI pour suivre les métriques clés, détecter les anomalies et identifier la dérive des données. Surveillez régulièrement les entrées et les sorties, configurez des alertes pour les comportements inhabituels et utilisez diverses sources de données pour obtenir une vue complète des performances de votre modèle. Pour plus de détails, consultez notre section sur le suivi des modèles.

Quelles sont les meilleures pratiques pour la maintenance des modèles de vision par ordinateur après le déploiement ?

La maintenance des modèles de vision par ordinateur implique des mises à jour régulières, un réentraînement et une surveillance pour garantir une précision et une pertinence continues. Les meilleures pratiques incluent :

Surveillance continue : Suivez régulièrement les indicateurs de performance et la qualité des données.
Détection de la dérive des données : Utilisez des techniques statistiques pour identifier les changements dans les distributions de données.
Mises à jour régulières et réentraînement : Mettez en œuvre un apprentissage incrémentiel ou un réentraînement complet périodique en fonction des changements de données.
Documentation : Conservez une documentation détaillée de l'architecture du modèle, des processus d'entraînement et des mesures d'évaluation. Pour plus d'informations, consultez notre section Maintenance du modèle.

Pourquoi la détection de la dérive des données est-elle importante pour les modèles d'IA ?

La détection de la dérive des données est essentielle car elle aide à identifier les changements dans les propriétés statistiques des données d'entrée au fil du temps, ce qui peut dégrader les performances du modèle. Des techniques telles que la surveillance continue, les tests statistiques (par exemple, le test de Kolmogorov-Smirnov) et l'analyse de la dérive des caractéristiques peuvent aider à repérer les problèmes à un stade précoce. La prise en compte de la dérive des données garantit que votre modèle reste précis et pertinent dans des environnements changeants. Pour en savoir plus sur la détection de la dérive des données, consultez notre section Détection de la dérive des données.

Quels outils puis-je utiliser pour la détection d’anomalies dans les modèles de vision par ordinateur ?

Pour la détection d'anomalies dans les modèles de vision par ordinateur, des outils tels que Prometheus, Grafana et Evidently AI sont très efficaces. Ces outils peuvent vous aider à configurer des systèmes d'alerte pour detect des points de données ou des schémas inhabituels qui s'écartent du comportement attendu. Des alertes configurables et des messages standardisés peuvent vous aider à réagir rapidement aux problèmes potentiels. Pour en savoir plus, consultez notre section Détection d'anomalies et systèmes d'alerte.

Comment puis-je documenter efficacement mon projet de vision par ordinateur ?

Une documentation efficace d'un projet de vision par ordinateur doit inclure :

Aperçu du projet : Résumé de haut niveau, énoncé du problème et approche de la solution.
Architecture du modèle: Détails de la structure du modèle, des composants et des hyperparamètres.
Préparation des données : Informations sur les sources de données, les étapes de prétraitement et les transformations.
Processus d’entraînement: Description de la procédure d’entraînement, des jeux de données utilisés et des difficultés rencontrées.
Métriques d'Évaluation : Métriques utilisées pour l'évaluation et l'analyse des performances.
Étapes de déploiement : Étapes suivies pour le déploiement du modèle et tous les défis spécifiques.
Procédure de surveillance et de maintenance : Planifiez une surveillance et une maintenance continues. Pour des directives plus complètes, consultez notre section Documentation.

📅 Créé il y a 1 an ✍️ Mis à jour il y a 3 mois