医疗药片数据集

在 Colab 中打开医疗药片数据集

medical-pills 检测数据集是一个概念验证 (POC) 数据集,经过精心策划,旨在展示 AI 在制药应用中的潜力。它包含专门用于训练 计算机视觉 模型 以识别医疗药片的标注图像。



Watch: How to train Ultralytics YOLO26 Model on Medical Pills Detection Dataset in Google Colab

该数据集是实现制药工作流程中质量控制、包装自动化和高效分拣等关键 任务 的基础资源。通过将此数据集集成到项目中,研究人员和开发人员可以探索创新的 解决方案,从而提高 准确性、精简操作,并最终改善医疗保健成果。

数据集结构

medical-pills 数据集分为两个子集:

  • 训练集:包含 92 张图像,每张图像都标注有 pill 类。
  • 验证集:包含 23 张具有相应标注的图像。

应用场景

使用计算机视觉进行 medical-pills 检测可实现制药行业的自动化,支持以下任务:

  • 医药分拣:根据大小、形状或颜色自动分拣药片,以提高生产效率。
  • AI 研究与开发:作为在制药用例中开发和测试计算机视觉算法的基准。
  • 数字库存系统:通过集成自动药片识别功能,实现实时库存监控和补货规划,助力智能库存解决方案。
  • 质量控制:通过识别缺陷、异常或污染,确保药片生产的一致性。
  • 伪劣检测:通过根据已知标准分析视觉特征,帮助识别潜在的伪劣药物。

数据集 YAML

我们提供了一个 YAML 配置文件来定义数据集的结构,包括路径和类别。对于 medical-pills 数据集,medical-pills.yaml 文件可通过 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml 访问。

ultralytics/cfg/datasets/medical-pills.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── medical-pills ← downloads here (8.19 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images

# Classes
names:
  0: pill

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip

使用方法

若要使用图像大小为 640 的 YOLO26n 模型在 medical-pills 数据集上训练 100 个 epoch,请参考以下示例。有关详细参数,请参阅模型的 训练 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
推理示例
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")

样本图像和标注

medical-pills 数据集展示了各种各样的药片标注图像。以下是数据集中标注图像的示例:

Medical-pills 数据集样本图像

  • 马赛克增强图像:展示的是包含马赛克处理后的数据集图像的训练批次。马赛克增强通过将多张图像合并为一张,提升了训练的多样性,从而改进了模型的泛化能力。

与其他数据集的集成

为了进行更全面的药物分析,可以考虑将 medical-pills 数据集与其他相关数据集结合使用,例如用于包装识别的 package-seg,或像 brain-tumor 这样的医学影像数据集,以开发端到端的医疗保健 AI 解决方案。

引文与致谢

该数据集采用 AGPL-3.0 许可证 发布。

如果你在研究或开发工作中使用 Medical-pills 数据集,请使用提到的详细信息引用它:

引用
@dataset{Jocher_Ultralytics_Datasets_2024,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {Dec},
    title = {Ultralytics Datasets: Medical-pills Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
    version = {1.0.0},
    year = {2024}
}

常见问题 (FAQ)

medical-pills 数据集的结构是什么?

该数据集包含 92 张训练图像和 23 张验证图像。每张图像都标注了 pill 类,从而能够有效地训练和评估用于制药应用的模型。

我该如何在 medical-pills 数据集上训练 YOLO26 模型?

你可以使用提供的 Python 或 CLI 方法,以 640px 的图像大小训练 YOLO26 模型 100 个 epoch。请参阅 训练示例 部分了解详细说明,并查看 YOLO26 文档 以获取有关模型功能的更多信息。

在 AI 项目中使用 medical-pills 数据集有哪些好处?

该数据集实现了药片检测的自动化,有助于预防伪劣产品、保证质量以及优化制药流程。它也是开发能够提高用药安全和供应链效率的 AI 解决方案的宝贵资源。

如何对 medical-pills 数据集执行推理?

可以使用 Python 或 CLI 方法,结合经过微调的 YOLO26 模型进行推理。请参阅 推理示例 部分获取代码片段,并参考 预测模式文档 了解更多选项。

在哪里可以找到 medical-pills 数据集的 YAML 配置文件?

YAML 文件可在 medical-pills.yaml 找到,其中包含了在该数据集上训练模型所必需的数据集路径、类别和其他配置细节。

评论