Набор данных медицинских таблеток
Набор данных medical-pills для обнаружения — это демонстрационный набор данных (POC), тщательно отобранный для демонстрации потенциала ИИ в фармацевтических приложениях. Он содержит размеченные изображения, специально разработанные для обучения моделей компьютерного зрения для идентификации медицинских таблеток.
Смотреть: Как обучить модель Ultralytics YOLO11 на наборе данных обнаружения медицинских таблеток в Google Colab
Этот набор данных служит основополагающим ресурсом для автоматизации основных задач, таких как контроль качества, автоматизация упаковки и эффективная сортировка в фармацевтических рабочих процессах. Интегрируя этот набор данных в проекты, исследователи и разработчики могут изучать инновационные решения, которые повышают точность, оптимизируют операции и, в конечном итоге, способствуют улучшению результатов здравоохранения.
Структура набора данных
Набор данных medical-pills разделен на два подмножества:
- Обучающий набор: Состоит из 92 изображений, каждое из которых аннотировано классом
pill
. - Набор для валидации: Состоит из 23 изображений с соответствующими аннотациями.
Приложения
Использование компьютерного зрения для обнаружения медицинских таблеток обеспечивает автоматизацию в фармацевтической промышленности, поддерживая такие задачи, как:
- Фармацевтическая сортировка: Автоматизация сортировки таблеток по размеру, форме или цвету для повышения эффективности производства.
- Исследования и разработки в области ИИ: Служит эталоном для разработки и тестирования алгоритмов компьютерного зрения в фармацевтических целях.
- Цифровые системы инвентаризации: Обеспечение интеллектуальных решений для инвентаризации путем интеграции автоматизированного распознавания таблеток для мониторинга запасов в реальном времени и планирования пополнения.
- Контроль качества: Обеспечение однородности производства таблеток путем выявления дефектов, неровностей или загрязнений.
- Обнаружение подделок: Помогает выявлять потенциально контрафактные лекарства путем анализа визуальных характеристик по известным стандартам.
YAML-файл набора данных
Предоставляется YAML-файл конфигурации для определения структуры набора данных, включая пути и классы. Для набора данных medical-pills, medical-pills.yaml
файл можно получить по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.
ultralytics/cfg/datasets/medical-pills.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
# └── medical-pills ← downloads here (8.19 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images
# Classes
names:
0: pill
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip
Использование
Чтобы обучить модель YOLO11n на наборе данных medical-pills в течение 100 эпох с размером изображения 640, используйте следующие примеры. Подробные аргументы см. на странице Обучение модели.
Пример обучения
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=medical-pills.yaml model=yolo11n.pt epochs=100 imgsz=640
Пример инференса
from ultralytics import YOLO
# Load a model
model = YOLO("path/to/best.pt") # load a fine-tuned model
# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")
# Start prediction with a fine-tuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/medical-pills-sample.jpg"
Примеры изображений и аннотации
Набор данных medical-pills содержит размеченные изображения, демонстрирующие разнообразие таблеток. Ниже приведен пример размеченного изображения из набора данных:
- Мозаичное изображение: Здесь представлен обучающий пакет, состоящий из мозаичных изображений набора данных. Мозаичность повышает разнообразие обучения, объединяя несколько изображений в одно, улучшая обобщающую способность модели.
Интеграция с другими наборами данных
Для более полного фармацевтического анализа рассмотрите возможность объединения набора данных medical-pills с другими связанными наборами данных, такими как package-seg для идентификации упаковки, или наборами данных медицинской визуализации, такими как brain-tumor, для разработки комплексных AI-решений для здравоохранения.
Цитирование и благодарности
Набор данных доступен под лицензией AGPL-3.0.
Если вы используете набор данных Medical-pills в своих исследованиях или разработках, пожалуйста, сошлитесь на него, используя указанные данные:
@dataset{Jocher_Ultralytics_Datasets_2024,
author = {Jocher, Glenn and Rizwan, Muhammad},
license = {AGPL-3.0},
month = {Dec},
title = {Ultralytics Datasets: Medical-pills Detection Dataset},
url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
version = {1.0.0},
year = {2024}
}
Часто задаваемые вопросы
Какова структура набора данных medical-pills?
Набор данных включает 92 изображения для обучения и 23 изображения для валидации. Каждое изображение аннотировано классом pill
, обеспечивая эффективное обучение и оценку моделей для фармацевтических приложений.
Как я могу обучить модель YOLO11 на наборе данных medical-pills?
Вы можете обучить модель YOLO11 в течение 100 эпох с размером изображения 640px, используя методы Python или CLI. Подробные инструкции см. в разделе Пример обучения, а дополнительную информацию о возможностях модели — в документации YOLO11.
Каковы преимущества использования набора данных medical-pills в проектах ИИ?
Набор данных позволяет автоматизировать обнаружение таблеток, способствуя предотвращению подделок, обеспечению качества и оптимизации фармацевтических процессов. Он также служит ценным ресурсом для разработки решений на основе искусственного интеллекта, которые могут повысить безопасность лекарств и эффективность цепочки поставок.
Как выполнить логический вывод на наборе данных medical-pills?
Инференс можно выполнить с помощью методов Python или CLI с точно настроенной моделью YOLO11. Обратитесь к разделу Пример инференса для получения фрагментов кода и к документации по режиму прогнозирования для получения дополнительных параметров.
Где я могу найти YAML-файл конфигурации для набора данных medical-pills?
YAML-файл доступен по адресу medical-pills.yaml, он содержит пути к набору данных, классы и дополнительные детали конфигурации, необходимые для обучения моделей на этом наборе данных.