Conjunto de Dados de Pílulas Médicas
The medical-pills detection dataset is a proof-of-concept (POC) dataset, carefully curated to demonstrate the potential of AI in pharmaceutical applications. It contains labeled images specifically designed to train computer vision models for identifying medical-pills.
Este conjunto de dados serve como um recurso fundamental para automatizar tarefas essenciais, como controle de qualidade, automação de embalagem e triagem eficiente em fluxos de trabalho farmacêuticos. Ao integrar este conjunto de dados em projetos, pesquisadores e desenvolvedores podem explorar soluções inovadoras que aprimoram a precisão, otimizam operações e, finalmente, contribuem para melhores resultados na área da saúde.
Estrutura do Dataset
O conjunto de dados medical-pills é dividido em dois subconjuntos:
- Conjunto de treinamento: Consiste em 92 imagens, cada uma anotada com a classe
pill. - Conjunto de validação: Composto por 23 imagens com as devidas anotações.
Aplicações
O uso de visão computacional para detecção de pílulas médicas permite a automação na indústria farmacêutica, apoiando tarefas como:
- Triagem Farmacêutica: Automatizar a triagem de pílulas com base em tamanho, forma ou cor para aumentar a eficiência da produção.
- Pesquisa e Desenvolvimento em IA: Servindo como um benchmark para desenvolver e testar algoritmos de visão computacional em casos de uso farmacêutico.
- Sistemas de Inventário Digital: Alimentando soluções inteligentes de inventário ao integrar o reconhecimento automatizado de pílulas para monitoramento de estoque em tempo real e planejamento de reposição.
- Controle de Qualidade: Garantindo a consistência na produção de pílulas ao identificar defeitos, irregularidades ou contaminação.
- Detecção de Contrafação: Ajudando a identificar medicamentos potencialmente falsificados ao analisar características visuais em relação a padrões conhecidos.
YAML do Dataset
Um arquivo de configuração YAML é fornecido para definir a estrutura do conjunto de dados, incluindo caminhos e classes. Para o conjunto de dados medical-pills, o arquivo medical-pills.yaml pode ser acessado em https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
# └── medical-pills ← downloads here (8.19 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images
# Classes
names:
0: pill
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zipUtilização
Para treinar um modelo YOLO26n no conjunto de dados medical-pills por 100 épocas com um tamanho de imagem de 640, utilize os exemplos a seguir. Para argumentos detalhados, consulte a página de Treinamento do modelo.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")Amostra de Imagens e Anotações
O conjunto de dados medical-pills apresenta imagens rotuladas que mostram a diversidade de pílulas. Abaixo está um exemplo de uma imagem rotulada do conjunto de dados:

- Imagem em Mosaico: Exibido está um lote de treinamento composto por imagens do conjunto de dados em mosaico. A técnica de mosaico aumenta a diversidade do treinamento ao consolidar várias imagens em uma só, melhorando a generalização do modelo.
Integração com Outros Conjuntos de Dados
Para uma análise farmacêutica mais abrangente, considere combinar o conjunto de dados medical-pills com outros conjuntos de dados relacionados, como o package-seg para identificação de embalagens ou conjuntos de dados de imagens médicas como brain-tumor para desenvolver soluções de IA de ponta a ponta na área da saúde.
Citações e Agradecimentos
O conjunto de dados está disponível sob a Licença AGPL-3.0.
Se você utilizar o conjunto de dados Medical-pills em seu trabalho de pesquisa ou desenvolvimento, cite-o usando os detalhes mencionados:
@dataset{Jocher_Ultralytics_Datasets_2024,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {Dec},
title = {Ultralytics Datasets: Medical-pills Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
version = {1.0.0},
year = {2024}
}FAQ
Qual é a estrutura do conjunto de dados medical-pills?
O conjunto de dados inclui 92 imagens para treinamento e 23 imagens para validação. Cada imagem é anotada com a classe pill, permitindo o treinamento e a avaliação eficazes de modelos para aplicações farmacêuticas.
Como posso treinar um modelo YOLO26 no conjunto de dados medical-pills?
Você pode treinar um modelo YOLO26 por 100 épocas com um tamanho de imagem de 640px usando os métodos Python ou CLI fornecidos. Consulte a seção Exemplo de Treinamento para instruções detalhadas e verifique a documentação do YOLO26 para mais informações sobre as capacidades do modelo.
Quais são os benefícios de usar o conjunto de dados medical-pills em projetos de IA?
O conjunto de dados permite a automação na detecção de pílulas, contribuindo para a prevenção de contrafações, garantia de qualidade e otimização de processos farmacêuticos. Ele também serve como um recurso valioso para o desenvolvimento de soluções de IA que podem melhorar a segurança da medicação e a eficiência da cadeia de suprimentos.
Como realizo a inferência no conjunto de dados medical-pills?
A inferência pode ser feita usando métodos Python ou CLI com um modelo YOLO26 ajustado. Consulte a seção Exemplo de Inferência para trechos de código e a documentação do modo Predict para opções adicionais.
Onde posso encontrar o arquivo de configuração YAML para o conjunto de dados medical-pills?
O arquivo YAML está disponível em medical-pills.yaml, contendo caminhos do conjunto de dados, classes e detalhes de configuração adicionais essenciais para treinar modelos neste conjunto de dados.