Bộ dữ liệu thời trang-MNIST
Bộ dữ liệu Fashion-MNIST là cơ sở dữ liệu về hình ảnh bài viết của Zalando—bao gồm một bộ dữ liệu đào tạo gồm 60.000 ví dụ và một bộ dữ liệu thử nghiệm gồm 10.000 ví dụ. Mỗi ví dụ là một hình ảnh thang độ xám 28x28, được liên kết với một nhãn từ 10 lớp. Fashion-MNIST được thiết kế để thay thế trực tiếp cho bộ dữ liệu MNIST gốc để đánh giá chuẩn các thuật toán học máy .
Đồng hồ: Làm thế nào để làm Phân loại hình ảnh trên Bộ dữ liệu MNIST về thời trang sử dụng Ultralytics YOLO11
Các tính năng chính
- Fashion-MNIST chứa 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm về hình ảnh bài viết của Zalando.
- Bộ dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
- Mỗi pixel có một giá trị pixel duy nhất liên quan đến nó, biểu thị độ sáng hoặc tối của pixel đó, với số cao hơn có nghĩa là tối hơn. Giá trị pixel này là một số nguyên từ 0 đến 255.
- Fashion-MNIST được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là đối với các tác vụ phân loại hình ảnh.
Cấu trúc tập dữ liệu
Bộ dữ liệu Fashion-MNIST được chia thành hai tập hợp con:
- Bộ đào tạo : Tập hợp con này chứa 60.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
- Bộ thử nghiệm : Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để thử nghiệm và đánh giá chuẩn các mô hình đã được đào tạo.
Nhãn
Mỗi ví dụ đào tạo và kiểm tra được gán cho một trong các nhãn sau:
0. T-shirt/top
1. Trouser
2. Pullover
3. Dress
4. Coat
5. Sandal
6. Shirt
7. Sneaker
8. Bag
9. Ankle boot
Ứng dụng
Bộ dữ liệu Fashion-MNIST được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Định dạng đơn giản và có cấu trúc tốt của bộ dữ liệu khiến nó trở thành nguồn tài nguyên thiết yếu cho các nhà nghiên cứu và học viên trong lĩnh vực học máy và thị giác máy tính.
Cách sử dụng
Để đào tạo mô hình CNN trên tập dữ liệu Fashion-MNIST cho 100 kỷ nguyên với kích thước hình ảnh là 28x28, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Bộ dữ liệu Fashion-MNIST chứa hình ảnh thang độ xám của hình ảnh bài viết của Zalando, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:
Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu Fashion-MNIST, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng trong việc đào tạo các mô hình phân loại hình ảnh mạnh mẽ.
Lời cảm ơn
Nếu bạn sử dụng bộ dữ liệu Fashion-MNIST trong công việc nghiên cứu hoặc phát triển của mình, vui lòng xác nhận bộ dữ liệu bằng cách liên kết đến kho lưu trữ GitHub . Bộ dữ liệu này được cung cấp bởi Zalando Research.
CÂU HỎI THƯỜNG GẶP
Bộ dữ liệu Fashion-MNIST là gì và nó khác với MNIST như thế nào?
Bộ dữ liệu Fashion-MNIST là tập hợp 70.000 hình ảnh thang độ xám của các hình ảnh bài viết của Zalando, được dự định là bản thay thế hiện đại cho bộ dữ liệu MNIST gốc. Nó đóng vai trò là chuẩn mực cho các mô hình học máy trong bối cảnh các tác vụ phân loại hình ảnh. Không giống như MNIST, chứa các chữ số viết tay, Fashion-MNIST bao gồm các hình ảnh 28x28 pixel được phân loại thành 10 lớp liên quan đến thời trang, chẳng hạn như áo phông/áo, quần dài và bốt cổ ngắn.
Làm thế nào tôi có thể đào tạo một YOLO mô hình trên tập dữ liệu Fashion-MNIST?
Để đào tạo một Ultralytics YOLO mô hình trên tập dữ liệu Fashion-MNIST, bạn có thể sử dụng cả hai Python Và CLI lệnh. Sau đây là một ví dụ nhanh để bạn bắt đầu:
Ví dụ về tàu hỏa
Để biết thông số đào tạo chi tiết hơn, hãy tham khảo trang Đào tạo .
Tại sao tôi nên sử dụng bộ dữ liệu Fashion-MNIST để đánh giá chuẩn các mô hình học máy của mình?
Bộ dữ liệu Fashion-MNIST được công nhận rộng rãi trong cộng đồng học sâu như một giải pháp thay thế mạnh mẽ cho MNIST. Nó cung cấp một bộ hình ảnh phức tạp và đa dạng hơn, khiến nó trở thành lựa chọn tuyệt vời để đánh giá chuẩn các mô hình phân loại hình ảnh. Cấu trúc của bộ dữ liệu, bao gồm 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm, mỗi hình ảnh được gắn nhãn với một trong 10 lớp, khiến nó trở nên lý tưởng để đánh giá hiệu suất của các thuật toán học máy khác nhau trong bối cảnh đầy thách thức hơn.
Tôi có thể sử dụng Ultralytics YOLO cho các nhiệm vụ phân loại hình ảnh như Fashion-MNIST?
Đúng, Ultralytics YOLO các mô hình có thể được sử dụng cho các nhiệm vụ phân loại hình ảnh, bao gồm các nhiệm vụ liên quan đến tập dữ liệu Fashion-MNIST. YOLO11 , ví dụ, hỗ trợ nhiều tác vụ thị giác khác nhau như phát hiện, phân đoạn và phân loại. Để bắt đầu với các tác vụ phân loại hình ảnh, hãy tham khảo trang Phân loại .
Các tính năng chính và cấu trúc của bộ dữ liệu Fashion-MNIST là gì?
Bộ dữ liệu Fashion-MNIST được chia thành hai tập hợp con chính: 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm. Mỗi hình ảnh là một hình ảnh thang độ xám 28x28 pixel đại diện cho một trong 10 lớp liên quan đến thời trang. Sự đơn giản và định dạng có cấu trúc tốt làm cho nó lý tưởng để đào tạo và đánh giá các mô hình trong các tác vụ học máy và thị giác máy tính . Để biết thêm chi tiết về cấu trúc tập dữ liệu, hãy xem phần Cấu trúc tập dữ liệu .
Làm thế nào tôi có thể ghi nhận việc sử dụng bộ dữ liệu Fashion-MNIST trong nghiên cứu của mình?
Nếu bạn sử dụng tập dữ liệu Fashion-MNIST trong các dự án nghiên cứu hoặc phát triển của mình, điều quan trọng là phải ghi nhận bằng cách liên kết đến kho lưu trữ GitHub . Điều này giúp ghi nhận dữ liệu cho Zalando Research, đơn vị đã công khai tập dữ liệu để sử dụng công khai.