Dataset Medical Pills

Mở Dataset Medical Pills trong Colab

The medical-pills detection dataset is a proof-of-concept (POC) dataset, carefully curated to demonstrate the potential of AI in pharmaceutical applications. It contains labeled images specifically designed to train computer vision models for identifying medical-pills.



Watch: How to train Ultralytics YOLO26 Model on Medical Pills Detection Dataset in Google Colab

Dataset này đóng vai trò là tài nguyên nền tảng để tự động hóa các tasks thiết yếu như kiểm soát chất lượng, tự động hóa đóng gói và phân loại hiệu quả trong các quy trình dược phẩm. Bằng cách tích hợp dataset này vào các dự án, các nhà nghiên cứu và lập trình viên có thể khám phá các solutions sáng tạo nhằm nâng cao accuracy, tinh giản hoạt động và cuối cùng là góp phần cải thiện kết quả chăm sóc sức khỏe.

Cấu trúc tập dữ liệu

Dataset medical-pills được chia thành hai tập con:

  • Tập huấn luyện (Training set): Bao gồm 92 hình ảnh, mỗi ảnh đều được gắn nhãn với lớp pill.
  • Tập kiểm thử (Validation set): Bao gồm 23 hình ảnh với các nhãn tương ứng.

Ứng dụng

Việc sử dụng computer vision để phát hiện medical-pills cho phép tự động hóa trong ngành dược phẩm, hỗ trợ các tác vụ như:

  • Phân loại dược phẩm: Tự động hóa việc phân loại thuốc dựa trên kích thước, hình dạng hoặc màu sắc để nâng cao hiệu quả sản xuất.
  • Nghiên cứu và Phát triển AI: Đóng vai trò là chuẩn đánh giá (benchmark) để phát triển và thử nghiệm các thuật toán computer vision trong các trường hợp sử dụng ngành dược.
  • Hệ thống kiểm kê kỹ thuật số: Cung cấp năng lượng cho các giải pháp kiểm kê thông minh bằng cách tích hợp tính năng nhận diện thuốc tự động để giám sát kho theo thời gian thực và lập kế hoạch bổ sung hàng hóa.
  • Kiểm soát chất lượng: Đảm bảo tính nhất quán trong sản xuất thuốc bằng cách xác định các lỗi, điểm bất thường hoặc ô nhiễm.
  • Phát hiện hàng giả: Hỗ trợ xác định các loại thuốc có khả năng là hàng giả bằng cách phân tích các đặc điểm trực quan so với các tiêu chuẩn đã biết.

Dataset YAML

Một file cấu hình YAML được cung cấp để xác định cấu trúc của dataset, bao gồm các đường dẫn và lớp. Đối với dataset medical-pills, file medical-pills.yaml có thể được truy cập tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.

ultralytics/cfg/datasets/medical-pills.yaml
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── medical-pills ← downloads here (8.19 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images

# Classes
names:
  0: pill

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip

Cách sử dụng

Để huấn luyện model YOLO26n trên dataset medical-pills trong 100 epochs với kích thước ảnh là 640, hãy sử dụng các ví dụ sau. Để biết các tham số chi tiết, hãy tham khảo trang Training của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
Ví dụ suy luận
from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")

Hình ảnh và chú thích mẫu

Dataset medical-pills có các hình ảnh đã được gắn nhãn thể hiện sự đa dạng của các loại thuốc. Dưới đây là ví dụ về một hình ảnh đã được gắn nhãn từ dataset:

Hình ảnh mẫu từ dataset Medical-pills

  • Hình ảnh Mosaiced: Hiển thị một batch huấn luyện bao gồm các hình ảnh dataset được mosaic. Kỹ thuật Mosaic giúp tăng cường sự đa dạng trong huấn luyện bằng cách hợp nhất nhiều hình ảnh thành một, giúp cải thiện khả năng tổng quát hóa của model.

Tích hợp với các Dataset khác

Để phân tích dược phẩm toàn diện hơn, hãy cân nhắc kết hợp dataset medical-pills với các dataset liên quan khác như package-seg để nhận diện bao bì hoặc các dataset hình ảnh y tế như brain-tumor nhằm phát triển các giải pháp AI chăm sóc sức khỏe end-to-end.

Trích dẫn và Ghi nhận

Dataset này khả dụng theo Giấy phép AGPL-3.0.

Nếu bạn sử dụng dataset Medical-pills trong nghiên cứu hoặc công việc phát triển của mình, vui lòng trích dẫn theo các chi tiết được đề cập:

Trích dẫn
@dataset{Jocher_Ultralytics_Datasets_2024,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {Dec},
    title = {Ultralytics Datasets: Medical-pills Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
    version = {1.0.0},
    year = {2024}
}

Câu hỏi thường gặp (FAQ)

Cấu trúc của dataset medical-pills là gì?

Dataset bao gồm 92 hình ảnh để huấn luyện và 23 hình ảnh để kiểm thử. Mỗi hình ảnh được gắn nhãn với lớp pill, cho phép huấn luyện và đánh giá hiệu quả các model cho các ứng dụng dược phẩm.

Làm thế nào để tôi huấn luyện model YOLO26 trên dataset medical-pills?

Bạn có thể huấn luyện model YOLO26 trong 100 epoch với kích thước ảnh 640px sử dụng các phương thức Python hoặc CLI được cung cấp. Tham khảo phần Ví dụ huấn luyện để biết hướng dẫn chi tiết và kiểm tra tài liệu YOLO26 để biết thêm thông tin về các khả năng của model.

Lợi ích của việc sử dụng dataset medical-pills trong các dự án AI là gì?

Dataset này cho phép tự động hóa trong việc phát hiện thuốc, góp phần vào công tác phòng chống hàng giả, đảm bảo chất lượng và tối ưu hóa quy trình dược phẩm. Nó cũng là một nguồn tài nguyên quý giá để phát triển các giải pháp AI có thể cải thiện độ an toàn của thuốc và hiệu quả chuỗi cung ứng.

Làm thế nào để thực hiện inference trên dataset medical-pills?

Inference có thể được thực hiện bằng cách sử dụng các phương thức Python hoặc CLI với model YOLO26 đã được tinh chỉnh (fine-tuned). Tham khảo phần Ví dụ Inference để xem các đoạn mã và tài liệu Predict mode để biết thêm các tùy chọn bổ sung.

Tôi có thể tìm file cấu hình YAML cho dataset medical-pills ở đâu?

File YAML khả dụng tại medical-pills.yaml, chứa các đường dẫn dataset, các lớp và thông tin cấu hình bổ sung cần thiết để huấn luyện model trên dataset này.

Bình luận