Conjunto de datos de píldoras médicas

Open Medical Pills Dataset In Colab

The medical-pills detection dataset is a proof-of-concept (POC) dataset, carefully curated to demonstrate the potential of AI in pharmaceutical applications. It contains labeled images specifically designed to train computer vision models for identifying medical-pills.



Watch: How to train Ultralytics YOLO26 Model on Medical Pills Detection Dataset in Google Colab

Este conjunto de datos sirve como recurso fundamental para automatizar tareas esenciales como el control de calidad, la automatización del empaquetado y la clasificación eficiente en los flujos de trabajo farmacéuticos. Al integrar este conjunto de datos en sus proyectos, los investigadores y desarrolladores pueden explorar soluciones innovadoras que mejoren la precisión, agilicen las operaciones y contribuyan, en última instancia, a mejorar los resultados sanitarios.

Estructura del conjunto de datos

El conjunto de datos medical-pills se divide en dos subconjuntos:

  • Conjunto de entrenamiento: Consta de 92 imágenes, cada una anotada con la clase pill.
  • Conjunto de validación: Compuesto por 23 imágenes con sus correspondientes anotaciones.

Aplicaciones

El uso de visión artificial para la detección de píldoras médicas permite la automatización en la industria farmacéutica, apoyando tareas como:

  • Clasificación farmacéutica: Automatizar la clasificación de píldoras en función de su tamaño, forma o color para mejorar la eficiencia de la producción.
  • Investigación y desarrollo de IA: Servir como referencia para desarrollar y probar algoritmos de visión artificial en casos de uso farmacéuticos.
  • Sistemas de inventario digital: Impulsar soluciones de inventario inteligentes integrando el reconocimiento automatizado de píldoras para el control de existencias en tiempo real y la planificación del reabastecimiento.
  • Control de calidad: Garantizar la consistencia en la producción de píldoras identificando defectos, irregularidades o contaminación.
  • Detección de falsificaciones: Ayudar a identificar medicamentos potencialmente falsificados analizando las características visuales frente a estándares conocidos.

YAML del conjunto de datos

Se proporciona un archivo de configuración YAML para definir la estructura del conjunto de datos, incluidos los caminos y las clases. Para el conjunto de datos medical-pills, el archivo medical-pills.yaml se puede consultar en https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.

ultralytics/cfg/datasets/medical-pills.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── medical-pills ← downloads here (8.19 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images

# Classes
names:
  0: pill

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip

Uso

Para entrenar un modelo YOLO26n con el conjunto de datos medical-pills durante 100 épocas con un tamaño de imagen de 640, usa los siguientes ejemplos. Para obtener argumentos detallados, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
Ejemplo de inferencia
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")

Imágenes y anotaciones de muestra

El conjunto de datos medical-pills incluye imágenes etiquetadas que muestran la diversidad de las píldoras. A continuación se muestra un ejemplo de una imagen etiquetada del conjunto de datos:

Imagen de muestra del conjunto de datos Medical-pills

  • Imagen en mosaico: Se muestra un lote de entrenamiento que comprende imágenes del conjunto de datos en mosaico. El mosaico mejora la diversidad del entrenamiento al consolidar varias imágenes en una sola, mejorando la generalización del modelo.

Integración con otros conjuntos de datos

Para un análisis farmacéutico más exhaustivo, considera combinar el conjunto de datos medical-pills con otros conjuntos de datos relacionados como package-seg para la identificación de embalajes o conjuntos de datos de imágenes médicas como brain-tumor para desarrollar soluciones integrales de IA sanitaria.

Citas y reconocimientos

El conjunto de datos está disponible bajo la licencia AGPL-3.0.

Si utilizas el conjunto de datos Medical-pills en tu trabajo de investigación o desarrollo, cítalo utilizando los detalles mencionados:

Cita
@dataset{Jocher_Ultralytics_Datasets_2024,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {Dec},
    title = {Ultralytics Datasets: Medical-pills Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
    version = {1.0.0},
    year = {2024}
}

Preguntas frecuentes

¿Cuál es la estructura del conjunto de datos medical-pills?

El conjunto de datos incluye 92 imágenes para entrenamiento y 23 imágenes para validación. Cada imagen está anotada con la clase pill, lo que permite un entrenamiento y una evaluación eficaces de modelos para aplicaciones farmacéuticas.

¿Cómo puedo entrenar un modelo YOLO26 con el conjunto de datos medical-pills?

Puedes entrenar un modelo YOLO26 durante 100 épocas con un tamaño de imagen de 640px usando los métodos de Python o CLI proporcionados. Consulta la sección Ejemplo de entrenamiento para obtener instrucciones detalladas y revisa la documentación de YOLO26 para obtener más información sobre las capacidades del modelo.

¿Cuáles son los beneficios de utilizar el conjunto de datos medical-pills en proyectos de IA?

El conjunto de datos permite la automatización en la detección de píldoras, contribuyendo a la prevención de falsificaciones, al aseguramiento de la calidad y a la optimización de los procesos farmacéuticos. También sirve como un recurso valioso para desarrollar soluciones de IA que pueden mejorar la seguridad de los medicamentos y la eficiencia de la cadena de suministro.

¿Cómo realizo la inferencia con el conjunto de datos medical-pills?

La inferencia se puede realizar mediante métodos de Python o CLI con un modelo YOLO26 ajustado. Consulta la sección Ejemplo de inferencia para ver fragmentos de código y la documentación del modo Predict para opciones adicionales.

¿Dónde puedo encontrar el archivo de configuración YAML para el conjunto de datos medical-pills?

El archivo YAML está disponible en medical-pills.yaml y contiene los caminos del conjunto de datos, las clases y detalles adicionales de configuración esenciales para entrenar modelos con este conjunto de datos.

Comentarios