Chuyển đến nội dung

Bộ dữ liệu Medical Pills

Mở Bộ Dữ Liệu Thuốc Y Tế Trong Colab

Bộ dữ liệu phát hiện medical-pills là một bộ dữ liệu chứng minh khái niệm (POC), được tuyển chọn cẩn thận để chứng minh tiềm năng của AI trong các ứng dụng dược phẩm. Nó chứa các hình ảnh được gắn nhãn được thiết kế đặc biệt để huấn luyện các mô hình thị giác máy tính để xác định medical-pills.



Xem: Cách huấn luyện mô hình Ultralytics YOLO11 trên bộ dữ liệu Medical Pills Detection trong Google Colab

Tập dữ liệu này đóng vai trò là tài nguyên cơ bản để tự động hóa các tác vụ thiết yếu như kiểm soát chất lượng, tự động hóa đóng gói và sắp xếp hiệu quả trong quy trình làm việc dược phẩm. Bằng cách tích hợp tập dữ liệu này vào các dự án, các nhà nghiên cứu và nhà phát triển có thể khám phá các giải pháp sáng tạo giúp nâng cao độ chính xác, hợp lý hóa các hoạt động và cuối cùng là đóng góp vào việc cải thiện kết quả chăm sóc sức khỏe.

Cấu trúc bộ dữ liệu

Bộ dữ liệu medical-pills được chia thành hai tập hợp con:

  • Bộ huấn luyện: Bao gồm 92 hình ảnh, mỗi hình ảnh được chú thích với class (lớp) pill.
  • Tập dữ liệu kiểm định (Validation set): Bao gồm 23 ảnh với các chú thích tương ứng.

Các ứng dụng

Sử dụng thị giác máy tính để phát hiện thuốc viên y tế cho phép tự động hóa trong ngành dược phẩm, hỗ trợ các tác vụ như:

  • Phân loại dược phẩm: Tự động hóa việc phân loại thuốc dựa trên kích thước, hình dạng hoặc màu sắc để nâng cao hiệu quả sản xuất.
  • Nghiên cứu và Phát triển AI: Đóng vai trò là chuẩn mực để phát triển và thử nghiệm các thuật toán thị giác máy tính trong các trường hợp sử dụng dược phẩm.
  • Hệ thống Quản lý Kho hàng Kỹ thuật số: Cung cấp các giải pháp quản lý kho hàng thông minh bằng cách tích hợp nhận dạng thuốc tự động để theo dõi hàng tồn kho theo thời gian thực và lập kế hoạch bổ sung.
  • Kiểm soát chất lượng: Đảm bảo tính nhất quán trong sản xuất thuốc viên bằng cách xác định các khuyết tật, bất thường hoặc ô nhiễm.
  • Phát hiện hàng giả: Giúp xác định các loại thuốc có khả năng là hàng giả bằng cách phân tích các đặc điểm trực quan so với các tiêu chuẩn đã biết.

YAML bộ dữ liệu

Một tệp cấu hình YAML được cung cấp để xác định cấu trúc của bộ dữ liệu, bao gồm đường dẫn và các lớp. Đối với bộ dữ liệu medical-pills, medical-pills.yaml tệp có thể được truy cập tại https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/medical-pills.yaml.

ultralytics/cfg/datasets/medical-pills.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# Medical-pills dataset by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/medical-pills/
# Example usage: yolo train data=medical-pills.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── medical-pills ← downloads here (8.19 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: medical-pills # dataset root dir
train: images/train # train images (relative to 'path') 92 images
val: images/val # val images (relative to 'path') 23 images

# Classes
names:
  0: pill

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/medical-pills.zip

Cách sử dụng

Để huấn luyện mô hình YOLO11n trên bộ dữ liệu medical-pills trong 100 epochs với kích thước ảnh 640, hãy sử dụng các ví dụ sau. Để biết các đối số chi tiết, hãy tham khảo trang Huấn luyện của mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="medical-pills.yaml", epochs=100, imgsz=640)
# Start training from a pretrained *.pt model
yolo detect train data=medical-pills.yaml model=yolo11n.pt epochs=100 imgsz=640

Ví dụ về suy luận

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/best.pt")  # load a fine-tuned model

# Inference using the model
results = model.predict("https://ultralytics.com/assets/medical-pills-sample.jpg")
# Start prediction with a fine-tuned *.pt model
yolo detect predict model='path/to/best.pt' imgsz=640 source="https://ultralytics.com/assets/medical-pills-sample.jpg"

Ảnh và Chú thích mẫu

Bộ dữ liệu medical-pills có các hình ảnh được gắn nhãn thể hiện sự đa dạng của các loại thuốc viên. Dưới đây là một ví dụ về hình ảnh được gắn nhãn từ bộ dữ liệu:

Ảnh mẫu bộ dữ liệu Medical-pills

  • Hình ảnh ghép ô: Hình ảnh hiển thị là một lô huấn luyện bao gồm các hình ảnh tập dữ liệu được ghép ô. Ghép ô giúp tăng cường tính đa dạng của quá trình huấn luyện bằng cách hợp nhất nhiều hình ảnh thành một, cải thiện khả năng tổng quát hóa của mô hình.

Tích hợp với các bộ dữ liệu khác

Để phân tích dược phẩm toàn diện hơn, hãy cân nhắc kết hợp bộ dữ liệu medical-pills với các bộ dữ liệu liên quan khác như package-seg để xác định bao bì hoặc các bộ dữ liệu hình ảnh y tế như brain-tumor để phát triển các giải pháp AI chăm sóc sức khỏe toàn diện.

Trích dẫn và Lời cảm ơn

Bộ dữ liệu có sẵn theo giấy phép AGPL-3.0.

Nếu bạn sử dụng bộ dữ liệu Medical-pills trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn nó bằng cách sử dụng các chi tiết đã đề cập:

@dataset{Jocher_Ultralytics_Datasets_2024,
    author = {Jocher, Glenn and Rizwan, Muhammad},
    license = {AGPL-3.0},
    month = {Dec},
    title = {Ultralytics Datasets: Medical-pills Detection Dataset},
    url = {https://docs.ultralytics.com/datasets/detect/medical-pills/},
    version = {1.0.0},
    year = {2024}
}

Câu hỏi thường gặp

Cấu trúc của tập dữ liệu medical-pills là gì?

Bộ dữ liệu bao gồm 92 ảnh để huấn luyện và 23 ảnh để xác thực. Mỗi ảnh được chú thích với lớp pill, cho phép huấn luyện và đánh giá mô hình hiệu quả cho các ứng dụng dược phẩm.

Làm thế nào để huấn luyện một mô hình YOLO11 trên bộ dữ liệu medical-pills?

Bạn có thể huấn luyện mô hình YOLO11 trong 100 epochs với kích thước ảnh 640px bằng phương pháp Python hoặc CLI được cung cấp. Tham khảo phần Training Example để biết hướng dẫn chi tiết và xem tài liệu YOLO11 để biết thêm thông tin về khả năng của mô hình.

Những lợi ích khi sử dụng bộ dữ liệu medical-pills trong các dự án AI là gì?

Bộ dữ liệu cho phép tự động hóa trong việc phát hiện thuốc viên, góp phần vào việc ngăn chặn hàng giả, đảm bảo chất lượng và tối ưu hóa quy trình dược phẩm. Nó cũng đóng vai trò là một nguồn tài nguyên có giá trị để phát triển các giải pháp AI có thể cải thiện sự an toàn của thuốc và hiệu quả của chuỗi cung ứng.

Làm cách nào để thực hiện suy luận trên bộ dữ liệu medical-pills?

Suy luận có thể được thực hiện bằng các phương pháp Python hoặc CLI với một mô hình YOLO11 đã được tinh chỉnh. Tham khảo phần Ví dụ về Suy luận để biết các đoạn mã và tài liệu về chế độ Dự đoán để biết thêm các tùy chọn.

Tôi có thể tìm thấy tệp cấu hình YAML cho tập dữ liệu medical-pills ở đâu?

Tệp YAML có sẵn tại medical-pills.yaml, chứa đường dẫn bộ dữ liệu, các lớp và các chi tiết cấu hình bổ sung cần thiết để huấn luyện mô hình trên bộ dữ liệu này.



📅 Đã tạo 8 tháng trước ✏️ Cập nhật 5 tháng trước

Bình luận