Bộ dữ liệu Fashion-MNIST

Bộ dữ liệu Fashion-MNIST là cơ sở dữ liệu gồm các hình ảnh sản phẩm thời trang của Zalando—bao gồm một tập huấn luyện gồm 60.000 ví dụ và một tập kiểm tra gồm 10.000 ví dụ. Mỗi ví dụ là một ảnh thang độ xám 28x28, được liên kết với một nhãn từ 10 lớp. Fashion-MNIST được thiết kế để thay thế trực tiếp cho bộ dữ liệu MNIST gốc nhằm đánh giá các thuật toán machine learning.



Watch: How to do Image Classification on Fashion MNIST Dataset using Ultralytics YOLO26

Các tính năng chính

  • Fashion-MNIST chứa 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra các sản phẩm thời trang của Zalando.
  • Bộ dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
  • Mỗi pixel có một giá trị pixel đơn lẻ đi kèm, cho biết độ sáng hoặc tối của pixel đó, với các số lớn hơn nghĩa là tối hơn. Giá trị pixel này là một số nguyên từ 0 đến 255.
  • Fashion-MNIST được sử dụng rộng rãi cho việc huấn luyện và kiểm thử trong lĩnh vực machine learning, đặc biệt là đối với các tác vụ phân loại hình ảnh.

Cấu trúc bộ dữ liệu

Bộ dữ liệu Fashion-MNIST được chia thành hai tập con:

  1. Tập huấn luyện (Training Set): Tập con này chứa 60.000 hình ảnh được sử dụng để huấn luyện các mô hình machine learning.
  2. Tập kiểm tra (Testing Set): Tập con này bao gồm 10.000 hình ảnh được sử dụng để kiểm thử và đánh giá các mô hình đã được huấn luyện.

Nhãn

Mỗi ví dụ huấn luyện và kiểm tra được gán cho một trong các nhãn sau:

0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot

Các ứng dụng

Bộ dữ liệu Fashion-MNIST được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình deep learning trong các tác vụ phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNN), Support Vector Machines (SVM) và nhiều thuật toán machine learning khác. Định dạng đơn giản và có cấu trúc tốt của bộ dữ liệu này làm cho nó trở thành một tài nguyên thiết yếu cho các nhà nghiên cứu và kỹ sư trong lĩnh vực machine learning và computer vision.

Cách sử dụng

Để huấn luyện một mô hình CNN trên bộ dữ liệu Fashion-MNIST trong 100 epochs với kích thước ảnh 28x28, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training của mô hình.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

Hình ảnh mẫu và chú thích

Bộ dữ liệu Fashion-MNIST chứa các hình ảnh thang độ xám về các sản phẩm thời trang của Zalando, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Fashion-MNIST clothing classification dataset samples

Ví dụ này thể hiện sự đa dạng và độ phức tạp của các hình ảnh trong bộ dữ liệu Fashion-MNIST, làm nổi bật tầm quan trọng của một bộ dữ liệu đa dạng để huấn luyện các mô hình phân loại hình ảnh mạnh mẽ.

Ghi nhận nguồn

Nếu bạn sử dụng bộ dữ liệu Fashion-MNIST trong công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi nhận bộ dữ liệu bằng cách liên kết tới GitHub repository. Bộ dữ liệu này được Zalando Research cung cấp.

Câu hỏi thường gặp (FAQ)

Bộ dữ liệu Fashion-MNIST là gì và nó khác gì so với MNIST?

Bộ dữ liệu Fashion-MNIST là tập hợp 70.000 hình ảnh thang độ xám các sản phẩm thời trang của Zalando, được thiết kế như một sự thay thế hiện đại cho bộ dữ liệu MNIST gốc. Nó đóng vai trò là điểm chuẩn cho các mô hình machine learning trong bối cảnh các tác vụ phân loại hình ảnh. Không giống như MNIST, vốn chứa các chữ số viết tay, Fashion-MNIST bao gồm các hình ảnh 28x28 pixel được phân loại thành 10 lớp liên quan đến thời trang, chẳng hạn như áo phông/áo top, quần dài và bốt cổ ngắn.

Làm thế nào để huấn luyện một mô hình YOLO trên bộ dữ liệu Fashion-MNIST?

Để huấn luyện một mô hình Ultralytics YOLO trên bộ dữ liệu Fashion-MNIST, bạn có thể sử dụng cả lệnh Python và CLI. Đây là ví dụ nhanh để bạn bắt đầu:

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)

Để biết các tham số huấn luyện chi tiết hơn, hãy tham khảo trang Training.

Tại sao tôi nên sử dụng bộ dữ liệu Fashion-MNIST để đánh giá các mô hình machine learning của mình?

Bộ dữ liệu Fashion-MNIST được cộng đồng deep learning công nhận rộng rãi như một giải pháp thay thế mạnh mẽ cho MNIST. Nó cung cấp một tập hợp hình ảnh phức tạp và đa dạng hơn, làm cho nó trở thành lựa chọn tuyệt vời để đánh giá các mô hình phân loại hình ảnh. Cấu trúc của bộ dữ liệu, bao gồm 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra, mỗi hình ảnh được dán nhãn với một trong 10 lớp, khiến nó trở nên lý tưởng để đánh giá hiệu suất của các thuật toán machine learning khác nhau trong một bối cảnh thử thách hơn.

Tôi có thể sử dụng Ultralytics YOLO cho các tác vụ phân loại hình ảnh như Fashion-MNIST không?

Có, các mô hình Ultralytics YOLO có thể được sử dụng cho các tác vụ phân loại hình ảnh, bao gồm cả những tác vụ liên quan đến bộ dữ liệu Fashion-MNIST. Ví dụ, YOLO26 hỗ trợ nhiều tác vụ thị giác như phát hiện, phân đoạn thực thể, semantic segmentation và phân loại. Để bắt đầu với các tác vụ phân loại hình ảnh, hãy tham khảo trang Classification.

Các tính năng và cấu trúc chính của bộ dữ liệu Fashion-MNIST là gì?

Bộ dữ liệu Fashion-MNIST được chia thành hai tập con chính: 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra. Mỗi hình ảnh là một bức ảnh thang độ xám 28x28 pixel đại diện cho một trong 10 lớp liên quan đến thời trang. Sự đơn giản và định dạng có cấu trúc tốt khiến nó trở nên lý tưởng cho việc huấn luyện và đánh giá các mô hình trong các tác vụ machine learning và computer vision. Để biết thêm chi tiết về cấu trúc bộ dữ liệu, hãy xem phần Dataset Structure.

Làm thế nào để tôi có thể ghi nhận việc sử dụng bộ dữ liệu Fashion-MNIST trong nghiên cứu của mình?

Nếu bạn sử dụng bộ dữ liệu Fashion-MNIST trong các dự án nghiên cứu hoặc phát triển của mình, điều quan trọng là phải ghi nhận bằng cách liên kết tới GitHub repository. Điều này giúp ghi nhận dữ liệu cho Zalando Research, những người đã cung cấp bộ dữ liệu cho mục đích sử dụng công cộng.

Bình luận