Passer au contenu

Ensemble de données de pilules médicales

Ouvrir l'ensemble de données sur les pilules médicales dans Colab

L'ensemble de données de détection medical-pills est un ensemble de données de validation de concept (POC), soigneusement organisé pour démontrer le potentiel de l'IA dans les applications pharmaceutiques. Il contient des images étiquetées spécialement conçues pour entraîner des modèles de vision par ordinateur pour l'identification des pilules médicales.



Regarder : Comment entraîner le modèle Ultralytics YOLO11 sur l'ensemble de données de détection de pilules médicales dans Google Colab

Cet ensemble de données sert de ressource fondamentale pour l'automatisation des tâches essentielles telles que le contrôle de la qualité, l'automatisation de l'emballage et le tri efficace dans les flux de travail pharmaceutiques. En intégrant cet ensemble de données dans les projets, les chercheurs et les développeurs peuvent explorer des solutions innovantes qui améliorent la précision, rationalisent les opérations et contribuent en fin de compte à l'amélioration des résultats en matière de soins de santé.

Structure du jeu de données

L'ensemble de données medical-pills est divisé en deux sous-ensembles :

  • Ensemble d'entraînement: Composé de 92 images, chacune annotée avec la classe pill.
  • Ensemble de validation : Comprenant 23 images avec les annotations correspondantes.

Applications

L'utilisation de la vision par ordinateur pour la détection de pilules médicales permet l'automatisation dans l'industrie pharmaceutique, soutenant des tâches telles que :

  • Tri pharmaceutique : Automatisation du tri des pilules en fonction de leur taille, de leur forme ou de leur couleur afin d'améliorer l'efficacité de la production.
  • Recherche et développement en IA : Sert de référence pour le développement et le test d'algorithmes de vision par ordinateur dans des cas d'utilisation pharmaceutiques.
  • Systèmes d'inventaire numérique : Alimenter des solutions d'inventaire intelligentes en intégrant la reconnaissance automatisée de pilules pour la surveillance des stocks en temps réel et la planification du réapprovisionnement.
  • Contrôle qualité: Assurer la cohérence dans la production de pilules en identifiant les défauts, les irrégularités ou la contamination.
  • Détection de contrefaçons : Aide à identifier les médicaments potentiellement contrefaits en analysant les caractéristiques visuelles par rapport aux normes connues.

YAML du jeu de données

Un fichier de configuration YAML est fourni pour définir la structure de l'ensemble de données, y compris les chemins d'accès et les classes. Pour l'ensemble de données medical-pills, le medical-pills.yaml fichier est accessible à l'adresse https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.

ultralytics/cfg/datasets/medical-pills.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── medical-pills ← downloads here (8.19 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images

# Classes
names:
  0: pill

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip

Utilisation

Pour entraîner un modèle YOLO11n sur l'ensemble de données medical-pills pendant 100 epochs avec une taille d'image de 640, utilisez les exemples suivants. Pour des arguments détaillés, consultez la page Formation du modèle.

Exemple d'entraînement

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=medical-pills.yaml model=yolo11n.pt epochs=100 imgsz=640

Exemple d'inférence

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")
# Start prediction with a fine-tuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/medical-pills-sample.jpg"

Images et annotations d'exemple

L'ensemble de données medical-pills présente des images étiquetées illustrant la diversité des pilules. Voici un exemple d'image étiquetée de l'ensemble de données :

Exemple d'image de l'ensemble de données Medical-pills

  • Image en mosaïque : L’image affichée est un lot d’entraînement comprenant des images d’ensemble de données en mosaïque. La mosaïque améliore la diversité de l’entraînement en consolidant plusieurs images en une seule, améliorant ainsi la généralisation du modèle.

Intégration avec d'autres jeux de données

Pour une analyse pharmaceutique plus complète, envisagez de combiner l'ensemble de données medical-pills avec d'autres ensembles de données connexes comme package-seg pour l'identification des emballages ou des ensembles de données d'imagerie médicale comme brain-tumor afin de développer des solutions d'IA de santé de bout en bout.

Citations et remerciements

L'ensemble de données est disponible sous la licence AGPL-3.0.

Si vous utilisez l'ensemble de données Medical-pills dans vos travaux de recherche ou de développement, veuillez le citer en utilisant les détails mentionnés :

@dataset{Jocher_Ultralytics_Datasets_2024,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {Dec},
    title = {Ultralytics Datasets: Medical-pills Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
    version = {1.0.0},
    year = {2024}
}

FAQ

Quelle est la structure du jeu de données medical-pills ?

L'ensemble de données comprend 92 images pour l'entraînement et 23 images pour la validation. Chaque image est annotée avec la classe pill, permettant une formation et une évaluation efficaces des modèles pour les applications pharmaceutiques.

Comment puis-je entraîner un modèle YOLO11 sur l'ensemble de données medical-pills ?

Vous pouvez entraîner un modèle YOLO11 pendant 100 epochs avec une taille d'image de 640px en utilisant les méthodes Python ou CLI fournies. Consultez la section Exemple d'entraînement pour des instructions détaillées et consultez la documentation YOLO11 pour plus d'informations sur les capacités du modèle.

Quels sont les avantages de l'utilisation du jeu de données medical-pills dans les projets d'IA ?

L'ensemble de données permet l'automatisation de la détection des pilules, contribuant à la prévention de la contrefaçon, à l'assurance qualité et à l'optimisation des processus pharmaceutiques. Il constitue également une ressource précieuse pour le développement de solutions d'IA capables d'améliorer la sécurité des médicaments et l'efficacité de la chaîne d'approvisionnement.

Comment effectuer une inférence sur l'ensemble de données medical-pills ?

L'inférence peut être réalisée à l'aide de méthodes python ou CLI avec un modèle YOLO11 affiné. Consultez la section Exemple d'inférence pour des extraits de code et la documentation du mode Predict pour des options supplémentaires.

Où puis-je trouver le fichier de configuration YAML pour l'ensemble de données medical-pills ?

Le fichier YAML est disponible sur medical-pills.yaml, contenant les chemins d'accès aux ensembles de données, les classes et les détails de configuration supplémentaires essentiels pour l'entraînement des modèles sur cet ensemble de données.



📅 Créé il y a 8 mois ✏️ Mis à jour il y a 5 mois

Commentaires