Link to this sectionTập dữ liệu Fashion-MNIST#
Tập dữ liệu Fashion-MNIST là cơ sở dữ liệu gồm các hình ảnh bài viết của Zalando—bao gồm một tập huấn luyện gồm 60.000 mẫu và một tập kiểm tra gồm 10.000 mẫu. Mỗi mẫu là một hình ảnh thang độ xám 28x28, được liên kết với một nhãn từ 10 lớp. Fashion-MNIST được thiết kế để làm sự thay thế trực tiếp cho tập dữ liệu MNIST gốc để đánh giá các thuật toán học máy.
Link to this sectionCác tính năng chính#
- Fashion-MNIST chứa 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra của các hình ảnh bài viết của Zalando.
- Tập dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
- Mỗi pixel có một giá trị pixel đơn liên kết với nó, cho biết độ sáng hoặc tối của pixel đó, với số càng lớn nghĩa là càng tối. Giá trị pixel này là một số nguyên từ 0 đến 255.
- Fashion-MNIST được sử dụng rộng rãi để huấn luyện và kiểm tra trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại hình ảnh.
Link to this sectionCấu trúc tập dữ liệu#
Tập dữ liệu Fashion-MNIST được chia thành hai tập hợp con:
- Tập huấn luyện (Training Set): Tập hợp con này chứa 60.000 hình ảnh được sử dụng để huấn luyện các mô hình học máy.
- Tập kiểm tra (Testing Set): Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để kiểm tra và đánh giá các mô hình đã được huấn luyện.
Link to this sectionNhãn#
Mỗi mẫu huấn luyện và kiểm tra được gán cho một trong các nhãn sau:
0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle bootLink to this sectionỨng dụng#
Tập dữ liệu Fashion-MNIST được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng thần kinh tích chập (CNNs), Máy vectơ hỗ trợ (SVMs) và nhiều thuật toán học máy khác. Định dạng đơn giản và có cấu trúc tốt của tập dữ liệu làm cho nó trở thành một tài nguyên thiết yếu cho các nhà nghiên cứu và người thực hành trong lĩnh vực học máy và thị giác máy tính.
Link to this sectionCách sử dụng#
Để huấn luyện một mô hình CNN trên tập dữ liệu Fashion-MNIST trong 100 epoch với kích thước hình ảnh là 28x28, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện của mô hình.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)Link to this sectionHình ảnh và chú thích mẫu#
Tập dữ liệu Fashion-MNIST chứa các hình ảnh thang độ xám của các hình ảnh bài viết của Zalando, cung cấp một tập dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Ví dụ này thể hiện sự đa dạng và độ phức tạp của các hình ảnh trong tập dữ liệu Fashion-MNIST, làm nổi bật tầm quan trọng của một tập dữ liệu đa dạng để huấn luyện các mô hình phân loại hình ảnh mạnh mẽ.
Link to this sectionGhi nhận#
Nếu bạn sử dụng tập dữ liệu Fashion-MNIST trong công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi nhận tập dữ liệu bằng cách liên kết đến kho lưu trữ GitHub. Tập dữ liệu này được Zalando Research cung cấp.
Link to this sectionCâu hỏi thường gặp (FAQ)#
Link to this sectionTập dữ liệu Fashion-MNIST là gì và nó khác biệt như thế nào so với MNIST?#
Tập dữ liệu Fashion-MNIST là một bộ sưu tập gồm 70.000 hình ảnh thang độ xám của các hình ảnh bài viết của Zalando, nhằm thay thế hiện đại cho tập dữ liệu MNIST gốc. Nó đóng vai trò là chuẩn mực cho các mô hình học máy trong bối cảnh các tác vụ phân loại hình ảnh. Không giống như MNIST chứa các chữ số viết tay, Fashion-MNIST bao gồm các hình ảnh 28x28 pixel được phân loại thành 10 lớp liên quan đến thời trang, chẳng hạn như áo thun/áo phông, quần tây và bốt cổ ngắn.
Link to this sectionLàm thế nào tôi có thể huấn luyện một mô hình YOLO trên tập dữ liệu Fashion-MNIST?#
Để huấn luyện một mô hình Ultralytics YOLO trên tập dữ liệu Fashion-MNIST, bạn có thể sử dụng cả Python và các lệnh CLI. Đây là một ví dụ nhanh để giúp bạn bắt đầu:
from ultralytics import YOLO
# Load a pretrained model
model = YOLO("yolo26n-cls.pt")
# Train the model on Fashion-MNIST
results = model.train(data="fashion-mnist", epochs=100, imgsz=28)Để biết thêm các tham số huấn luyện chi tiết, hãy tham khảo trang Huấn luyện.
Link to this sectionTại sao tôi nên sử dụng tập dữ liệu Fashion-MNIST để đánh giá các mô hình học máy của mình?#
Tập dữ liệu Fashion-MNIST được công nhận rộng rãi trong cộng đồng học sâu như một sự thay thế mạnh mẽ cho MNIST. Nó cung cấp một tập hợp hình ảnh phức tạp và đa dạng hơn, làm cho nó trở thành một lựa chọn tuyệt vời để đánh giá các mô hình phân loại hình ảnh. Cấu trúc của tập dữ liệu, bao gồm 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra, mỗi hình ảnh được dán nhãn với một trong 10 lớp, khiến nó trở nên lý tưởng để đánh giá hiệu suất của các thuật toán học máy khác nhau trong một bối cảnh thử thách hơn.
Link to this sectionTôi có thể sử dụng Ultralytics YOLO cho các tác vụ phân loại hình ảnh như Fashion-MNIST không?#
Có, các mô hình Ultralytics YOLO có thể được sử dụng cho các tác vụ phân loại hình ảnh, bao gồm cả những tác vụ liên quan đến tập dữ liệu Fashion-MNIST. Ví dụ, YOLO26 hỗ trợ các tác vụ thị giác khác nhau như phát hiện, phân đoạn thực thể, phân đoạn ngữ nghĩa, phân loại, ước tính tư thế và phát hiện đối tượng theo hướng. Để bắt đầu với các tác vụ phân loại hình ảnh, hãy tham khảo trang Phân loại.
Link to this sectionCác tính năng và cấu trúc chính của tập dữ liệu Fashion-MNIST là gì?#
Tập dữ liệu Fashion-MNIST được chia thành hai tập hợp con chính: 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra. Mỗi hình ảnh là một bức tranh thang độ xám 28x28 pixel đại diện cho một trong 10 lớp liên quan đến thời trang. Sự đơn giản và định dạng có cấu trúc tốt làm cho nó trở nên lý tưởng để huấn luyện và đánh giá các mô hình trong các tác vụ học máy và thị giác máy tính. Để biết thêm chi tiết về cấu trúc tập dữ liệu, hãy xem phần Cấu trúc tập dữ liệu.
Link to this sectionLàm thế nào tôi có thể ghi nhận việc sử dụng tập dữ liệu Fashion-MNIST trong nghiên cứu của mình?#
Nếu bạn sử dụng tập dữ liệu Fashion-MNIST trong các dự án nghiên cứu hoặc phát triển của mình, điều quan trọng là phải ghi nhận nó bằng cách liên kết đến kho lưu trữ GitHub. Điều này giúp ghi nhận dữ liệu cho Zalando Research, đơn vị đã cung cấp tập dữ liệu để sử dụng công khai.