Набор данных о медицинских таблетках
Набор данных для обнаружения медицинских таблеток - это набор данных для доказательства концепции (POC), тщательно подобранный для демонстрации потенциала ИИ в фармацевтических приложениях. Он содержит маркированные изображения, специально разработанные для обучения моделей компьютерного зрения для идентификации медицинских таблеток.
Смотреть: Как обучить модель Ultralytics YOLO11 на наборе данных для обнаружения медицинских таблеток в Google Colab
Этот набор данных служит основополагающим ресурсом для автоматизации таких важных задач, как контроль качества, автоматизация упаковки и эффективная сортировка в фармацевтических рабочих процессах. Интегрируя этот набор данных в проекты, исследователи и разработчики могут изучать инновационные решения, которые повышают точность, оптимизируют операции и в конечном итоге способствуют улучшению результатов в здравоохранении.
Структура набора данных
Набор данных о медицинских препаратах разделен на два подмножества:
- Обучающий набор: Состоит из 92 изображений, каждое из которых аннотировано классом
pill
. - Валидационный набор: Состоит из 23 изображений с соответствующими аннотациями.
Приложения
Использование компьютерного зрения для распознавания медицинских препаратов позволяет автоматизировать фармацевтическую промышленность, поддерживая такие задачи, как:
- Фармацевтическая сортировка: Автоматизация сортировки таблеток по размеру, форме или цвету для повышения эффективности производства.
- Исследования и разработки в области искусственного интеллекта: Служит эталоном для разработки и тестирования алгоритмов компьютерного зрения в фармацевтике.
- Цифровые системы инвентаризации: Интеллектуальные решения для инвентаризации, включающие автоматическое распознавание таблеток для контроля запасов и планирования пополнения запасов в режиме реального времени.
- Контроль качества: Обеспечение постоянства в производстве таблеток путем выявления дефектов, нарушений или загрязнений.
- Обнаружение подделок: Помощь в выявлении потенциально поддельных лекарств путем анализа визуальных характеристик в сравнении с известными стандартами.
Набор данных YAML
Для определения структуры набора данных, включая пути и классы, предоставляется конфигурационный файл YAML. Для набора данных medical-pills файл конфигурации medical-pills.yaml
файл можно получить по адресу https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.
ultralytics/cfg/datasets/medical-pills.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
# └── medical-pills ← downloads here (8.19 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/medical-pills # dataset root dir
train: train/images # train images (relative to 'path') 92 images
val: valid/images # val images (relative to 'path') 23 images
test: # test images (relative to 'path')
# Classes
names:
0: pill
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip
Использование
Чтобы обучить модель YOLO11n на наборе данных medical-pills в течение 100 эпох при размере изображения 640, используйте следующие примеры. Подробные аргументы см. на странице обучения модели.
Пример поезда
Пример вывода
Образцы изображений и аннотаций
В наборе данных medical-pills представлены маркированные изображения, демонстрирующие разнообразие таблеток. Ниже приведен пример маркированного изображения из этого набора:
- Мозаичное изображение: Отображается обучающая партия, состоящая из мозаичных изображений набора данных. Мозаичное изображение повышает разнообразие обучения за счет объединения нескольких изображений в одно, что улучшает обобщение модели.
Интеграция с другими наборами данных
Для более комплексного фармацевтического анализа можно объединить набор данных medical-pills с другими смежными наборами данных, такими как package-seg для идентификации упаковки или наборы данных медицинской визуализации, такие как brain-tumor, для разработки комплексных решений ИИ в области здравоохранения.
Цитаты и благодарности
Набор данных доступен по лицензииAGPL-3.0 .
Если вы используете набор данных Medical-pills в своих исследованиях или разработках, пожалуйста, ссылайтесь на него, используя указанные данные:
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Какова структура набора данных "Лекарственные препараты"?
Набор данных включает 92 изображения для обучения и 23 изображения для проверки. Каждое изображение аннотировано классом pill
Это позволяет эффективно обучать и оценивать модели для применения в фармацевтике.
Как обучить модель YOLO11 на наборе данных "Лекарственные препараты"?
Вы можете обучить модель YOLO11 в течение 100 эпох с размером изображения 640px, используя методы Python или CLI . Обратитесь к разделу " Пример обучения" за подробными инструкциями и ознакомьтесь с документациейYOLO11 для получения дополнительной информации о возможностях модели.
Каковы преимущества использования набора данных о медицинских таблетках в проектах искусственного интеллекта?
Набор данных позволяет автоматизировать процесс обнаружения таблеток, способствуя предотвращению подделок, обеспечению качества и оптимизации фармацевтических процессов. Она также служит ценным ресурсом для разработки ИИ-решений, которые могут повысить безопасность лекарств и эффективность цепочки поставок.
Как сделать вывод на наборе данных "Лекарственные препараты"?
Выводы могут быть сделаны с помощью методов Python или CLI с использованием точно настроенной модели YOLO11 . Обратитесь к разделу Примеры выводов для получения фрагментов кода и к документации по режиму Predict для получения дополнительных опций.
Где найти файл конфигурации YAML для набора данных medical-pills?
YAML-файл доступен по адресу medical-pills.yaml и содержит пути к набору данных, классы и дополнительные сведения о конфигурации, необходимые для обучения моделей на этом наборе данных.