Bỏ để qua phần nội dung

Bộ dữ liệu thời trang-MNIST

Bộ dữ liệu Fashion-MNIST là một cơ sở dữ liệu về hình ảnh bài viết của Zalando — bao gồm một bộ đào tạo gồm 60.000 ví dụ và một bộ thử nghiệm gồm 10.000 ví dụ. Mỗi ví dụ là một hình ảnh thang độ xám 28x28, được liên kết với nhãn từ 10 lớp. Fashion-MNIST được thiết kế để phục vụ như một sự thay thế trực tiếp cho bộ dữ liệu MNIST ban đầu để đo điểm chuẩn các thuật toán học máy.

Các tính năng chính

  • Fashion-MNIST chứa 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm các hình ảnh bài viết của Zalando.
  • Tập dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
  • Mỗi pixel có một giá trị pixel duy nhất được liên kết với nó, cho biết độ sáng hoặc tối của pixel đó, với các số cao hơn có nghĩa là tối hơn. Giá trị pixel này là một số nguyên từ 0 đến 255.
  • Fashion-MNIST được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại hình ảnh.

Cấu trúc tập dữ liệu

Bộ dữ liệu Fashion-MNIST được chia thành hai tập hợp con:

  1. Bộ đào tạo: Tập hợp con này chứa 60.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm: Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để kiểm tra và đo điểm chuẩn cho các mô hình được đào tạo.

Nhãn

Mỗi ví dụ đào tạo và kiểm tra được gán cho một trong các nhãn sau:

  1. Áo phông/áo trên
  2. Quần tây
  3. Áo chui đầu
  4. Ăn mặc
  5. Áo
  6. Dép
  7. Áo sơ mi
  8. Sneaker
  9. Túi
  10. Khởi động mắt cá chân

Ứng dụng

Bộ dữ liệu Fashion-MNIST được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Định dạng đơn giản và có cấu trúc tốt của tập dữ liệu làm cho nó trở thành một nguồn tài nguyên thiết yếu cho các nhà nghiên cứu và các học viên trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để đào tạo mô hình CNN trên bộ dữ liệu Thời trang-MNIST cho 100 kỷ nguyên với kích thước hình ảnh 28x28, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo detect train data=fashion-mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Hình ảnh mẫu và chú thích

Bộ dữ liệu Fashion-MNIST chứa hình ảnh thang độ xám của hình ảnh bài viết của Zalando, cung cấp một bộ dữ liệu có cấu trúc tốt cho các nhiệm vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Fashion-MNIST, làm nổi bật tầm quan trọng của bộ dữ liệu đa dạng để đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

Lời cảm ơn

Nếu bạn sử dụng tập dữ liệu Fashion-MNIST trong công việc nghiên cứu hoặc phát triển của mình, vui lòng xác nhận tập dữ liệu bằng cách liên kết đến kho lưu trữ GitHub. Bộ dữ liệu này được cung cấp bởi Zalando Research.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (4)

Ý kiến