Chuyển đến nội dung

Bộ dữ liệu Fashion-MNIST

Bộ dữ liệu Fashion-MNIST là một cơ sở dữ liệu các hình ảnh sản phẩm của Zalando—bao gồm một bộ huấn luyện gồm 60.000 ví dụ và một bộ kiểm thử gồm 10.000 ví dụ. Mỗi ví dụ là một hình ảnh thang độ xám 28x28, được liên kết với một nhãn từ 10 lớp. Fashion-MNIST được dự định để phục vụ như một sự thay thế trực tiếp cho bộ dữ liệu MNIST gốc để đánh giá các thuật toán máy học.



Xem: Cách thực hiện Phân loại hình ảnh trên Bộ dữ liệu Fashion MNIST sử dụng Ultralytics YOLO11

Các tính năng chính

  • Fashion-MNIST chứa 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm thử về hình ảnh sản phẩm của Zalando.
  • Bộ dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
  • Mỗi pixel có một giá trị pixel duy nhất liên kết với nó, cho biết độ sáng hoặc tối của pixel đó, với số càng cao nghĩa là càng tối. Giá trị pixel này là một số nguyên từ 0 đến 255.
  • Fashion-MNIST được sử dụng rộng rãi để huấn luyện và kiểm tra trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại ảnh.

Cấu trúc bộ dữ liệu

Bộ dữ liệu Fashion-MNIST được chia thành hai tập con:

  1. Tập huấn luyện: Tập con này chứa 60.000 hình ảnh được sử dụng để huấn luyện các mô hình học máy.
  2. Tập kiểm thử: Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để kiểm thử và đánh giá các mô hình đã huấn luyện.

Nhãn

Mỗi ví dụ huấn luyện và kiểm tra được gán cho một trong các nhãn sau:

0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot

Các ứng dụng

Bộ dữ liệu Fashion-MNIST được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và các thuật toán máy học khác. Định dạng đơn giản và có cấu trúc tốt của bộ dữ liệu này khiến nó trở thành một nguồn tài nguyên thiết yếu cho các nhà nghiên cứu và người thực hành trong lĩnh vực máy học và thị giác máy tính.

Cách sử dụng

Để huấn luyện mô hình CNN trên bộ dữ liệu Fashion-MNIST trong 100 epochs với kích thước hình ảnh là 28x28, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
# Start training from a pretrained *.pt model
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Ảnh và Chú thích mẫu

Bộ dữ liệu Fashion-MNIST chứa hình ảnh thang độ xám của hình ảnh sản phẩm của Zalando, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Ảnh mẫu bộ dữ liệu

Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu Fashion-MNIST, làm nổi bật tầm quan trọng của một bộ dữ liệu đa dạng để huấn luyện các mô hình phân loại hình ảnh mạnh mẽ.

Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu Fashion-MNIST trong công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi nhận bộ dữ liệu bằng cách liên kết đến kho lưu trữ GitHub. Bộ dữ liệu này được cung cấp bởi Zalando Research.

Câu hỏi thường gặp

Bộ dữ liệu Fashion-MNIST là gì và nó khác với MNIST như thế nào?

Bộ dữ liệu Fashion-MNIST là một tập hợp gồm 70.000 hình ảnh thang độ xám về hình ảnh bài viết của Zalando, được dự định là một sự thay thế hiện đại cho bộ dữ liệu MNIST gốc. Nó đóng vai trò là một chuẩn mực cho các mô hình máy học trong bối cảnh các tác vụ phân loại hình ảnh. Không giống như MNIST, chứa các chữ số viết tay, Fashion-MNIST bao gồm các hình ảnh 28x28 pixel được phân loại thành 10 lớp liên quan đến thời trang, chẳng hạn như áo phông/áo, quần dài và giày ống.

Làm cách nào để huấn luyện mô hình YOLO trên bộ dữ liệu Fashion-MNIST?

Để huấn luyện một mô hình Ultralytics YOLO trên bộ dữ liệu Fashion-MNIST, bạn có thể sử dụng cả lệnh Python và CLI. Dưới đây là một ví dụ nhanh để giúp bạn bắt đầu:

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo11n-cls.pt")

# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)
yolo classify train data=fashion-mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Để biết thêm thông tin chi tiết về các tham số huấn luyện, hãy tham khảo trang Huấn luyện.

Tại sao tôi nên sử dụng bộ dữ liệu Fashion-MNIST để đánh giá các mô hình học máy của mình?

Tập dữ liệu Fashion-MNIST được công nhận rộng rãi trong cộng đồng học sâu như một giải pháp thay thế mạnh mẽ cho MNIST. Nó cung cấp một tập hợp hình ảnh phức tạp và đa dạng hơn, khiến nó trở thành một lựa chọn tuyệt vời để đánh giá các mô hình phân loại hình ảnh. Cấu trúc của tập dữ liệu, bao gồm 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra, mỗi hình ảnh được gắn nhãn với một trong 10 lớp, làm cho nó trở nên lý tưởng để đánh giá hiệu suất của các thuật toán máy học khác nhau trong một bối cảnh đầy thách thức hơn.

Tôi có thể sử dụng Ultralytics YOLO cho các tác vụ phân loại ảnh như Fashion-MNIST không?

Có, các mô hình Ultralytics YOLO có thể được sử dụng cho các tác vụ phân loại hình ảnh, bao gồm cả các tác vụ liên quan đến tập dữ liệu Fashion-MNIST. Ví dụ: YOLO11 hỗ trợ các tác vụ thị giác khác nhau như phát hiện, phân đoạn và phân loại. Để bắt đầu với các tác vụ phân loại hình ảnh, hãy tham khảo trang Phân loại.

Các tính năng và cấu trúc chính của bộ dữ liệu Fashion-MNIST là gì?

Bộ dữ liệu Fashion-MNIST được chia thành hai tập hợp con chính: 60.000 hình ảnh huấn luyện và 10.000 hình ảnh thử nghiệm. Mỗi hình ảnh là một bức tranh thang độ xám 28x28 pixel, đại diện cho một trong 10 lớp liên quan đến thời trang. Sự đơn giản và định dạng có cấu trúc tốt làm cho nó trở nên lý tưởng để huấn luyện và đánh giá các mô hình trong máy học và các tác vụ thị giác máy tính. Để biết thêm chi tiết về cấu trúc bộ dữ liệu, hãy xem phần Cấu trúc bộ dữ liệu.

Làm cách nào tôi có thể ghi nhận việc sử dụng bộ dữ liệu Fashion-MNIST trong nghiên cứu của mình?

Nếu bạn sử dụng bộ dữ liệu Fashion-MNIST trong các dự án nghiên cứu hoặc phát triển của mình, điều quan trọng là phải ghi nhận nó bằng cách liên kết đến kho lưu trữ GitHub. Điều này giúp ghi nhận dữ liệu cho Zalando Research, những người đã cung cấp bộ dữ liệu này để sử dụng công khai.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 8 tháng trước

Bình luận