跳至内容

医用药片数据集

在 Colab 中开放医用药片数据集

药片检测数据集是一个概念验证(POC)数据集,经过精心设计,旨在展示人工智能在制药应用中的潜力。该数据集包含标签图像,专门用于训练识别药片的计算机视觉 模型



观看: 如何在Ultralytics YOLO11 中的医疗药片检测数据集上训练模型? Google Colab

该数据集是制药工作流程中质量控制、包装自动化和高效分拣等基本任务自动化的基础资源。通过将该数据集整合到项目中,研究人员和开发人员可以探索创新的解决方案,从而提高准确性、简化操作并最终改善医疗效果。

数据集结构

医用药片数据集分为两个子集:

  • 训练集:由 92 幅图像组成,每幅图像都标注了类别 pill.
  • 验证集:包括 23 幅图像和相应的注释。

应用

利用计算机视觉进行医用药片检测可实现制药业的自动化,为以下任务提供支持:

  • 药品分拣:根据大小、形状或颜色自动分拣药丸,提高生产效率。
  • 人工智能研发:作为开发和测试制药用计算机视觉算法的基准。
  • 数字库存系统:通过集成自动药丸识别功能,实现实时库存监控和补货计划,为智能库存解决方案提供动力。

数据集 YAML

我们提供了一个 YAML 配置文件来定义数据集的结构,包括路径和类。对于医用药片数据集,YAML 配置文件中的 medical-pills.yaml 文件可在 https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.

ultralytics/cfg/datasets/medical-pills.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── medical-pills  ← downloads here (8.19 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/medical-pills # dataset root dir
train: train/images # train images (relative to 'path') 92 images
val: valid/images # val images (relative to 'path') 23 images
test: # test images (relative to 'path')

# Classes
names:
  0: pill

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip

使用方法

要在图像大小为 640 的医用药片数据集上训练 YOLO11n 模型 100,请使用以下示例。有关详细参数,请参阅模型的训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=medical-pills.yaml model=yolo11n.pt epochs=100 imgsz=640

推理示例

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")
# Start prediction with a fine-tuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/medical-pills-sample.jpg"

图片和注释示例

医用药片数据集以标注图像为特色,展示了药片的多样性。下面是该数据集中的标签图像示例:

医用药片数据集样本图像

  • 镶嵌图像:显示的是由镶嵌数据集图像组成的训练批次。马赛克图像通过将多幅图像合并为一幅图像来增强训练的多样性,从而提高模型的泛化能力。

引文和致谢

该数据集根据AGPL-3.0 许可提供。

如果您在研究或开发工作中使用 Medical-pills 数据集,请使用上述详细信息进行引用:

@dataset{Jocher_Ultralytics_Datasets_2024,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {Dec},
    title = {Ultralytics Datasets: Medical-pills Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
    version = {1.0.0},
    year = {2024}
}

常见问题

医用药片数据集的结构是什么?

数据集包括 92 幅用于训练的图像和 23 幅用于验证的图像。每张图像都标注了 pill这样就能对模型进行有效的培训和评估。

如何在医用药片数据集上训练YOLO11 模型?

您可以使用Python 或CLI 方法对YOLO11 模型进行 100 次历时训练,图像大小为 640px。详细说明请参阅 "训练示例"部分。

在人工智能项目中使用医用药片数据集有什么好处?

该数据集实现了药片检测的自动化,有助于防伪、质量保证和制药流程优化。

如何对医用药片数据集进行推理?

推理可使用Python 或CLI 方法和微调后的YOLO11 模型进行。有关代码片段,请参阅推理示例部分。

在哪里可以找到医用药片数据集的 YAML 配置文件?

YAML 文件位于medical-pills.yml,其中包含数据集路径、类和其他配置细节。

📅创建于 1 个月前 ✏️已更新 19 天前

评论