No license

Link to this sectionTập dữ liệu MNIST#

Name: Tập dữ liệu phân loại hình ảnh MNIST
Creator: Yann LeCun
Keywords: MNIST, tập dữ liệu, chữ số viết tay, phân loại hình ảnh, deep learning, machine learning, tập huấn luyện, tập kiểm tra, NIST

Tập dữ liệu MNIST (Viện Tiêu chuẩn và Công nghệ Quốc gia sửa đổi) là một điểm chuẩn phân loại hình ảnh gồm 70.000 hình ảnh thang độ xám kích thước 28x28 của các chữ số viết tay, trải dài qua 10 lớp — các chữ số từ 0 đến 9. Nó đi kèm với một phân tách được xác định trước gồm 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra, và từ lâu đã trở thành tiêu chuẩn để đánh giá các thuật toán học máy và thị giác máy tính. Đối với phiên bản hình ảnh quần áo khó hơn, hãy xem tập dữ liệu Fashion-MNIST liên quan; đối với hình ảnh màu, hãy xem CIFAR-10.

Link to this sectionTính năng chính#

MNIST chứa 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra của các chữ số viết tay, với tổng cộng 70.000 hình ảnh.
Mỗi hình ảnh là một bức ảnh thang độ xám 28x28 của một chữ số duy nhất, được chuẩn hóa và khử răng cưa vào một khung bao 28x28 cố định.
10 lớp bao gồm các chữ số 0–9, với số lượng hình ảnh mỗi lớp gần như cân bằng.
Nó đi kèm với một phân tách train/test được xác định trước, vì vậy không cần phải phân tách thủ công hoặc tự động.
MNIST là một điểm chuẩn tiêu chuẩn cho nghiên cứu về phân loại hình ảnh và học sâu.

Link to this sectionCấu trúc tập dữ liệu#

MNIST đi kèm với một phân tách chính thức được xác định trước, vì vậy không cần phân vùng tự động hoặc thủ công:

Lớp: 10 (chữ số viết tay 0–9)
Tổng số ảnh: 70.000 (28x28 thang độ xám)
Tập huấn luyện: 60.000 hình ảnh
Tập kiểm tra: 10.000 hình ảnh

Tập xác thực

MNIST không có thư mục xác thực riêng biệt, vì vậy Ultralytics sử dụng tập kiểm tra gồm 10.000 hình ảnh làm tập xác thực trong quá trình huấn luyện theo mặc định.

Mỗi hình ảnh được dán nhãn với chữ số tương ứng của nó (0–9), khiến MNIST trở thành một tập dữ liệu có giám sát lý tưởng cho các tác vụ phân loại.

Link to this sectionỨng dụng#

MNIST được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình phân loại hình ảnh, từ các Mạng thần kinh tích chập (CNN) và Máy vector hỗ trợ (SVM) cổ điển cho đến các kiến trúc học sâu hiện đại. Các hình ảnh thang độ xám nhỏ và 10 lớp chữ số của nó làm cho nó trở thành một điểm chuẩn nhanh, có thể tái lập để so sánh thuật toán và thử nghiệm thị giác máy tính.

Một số ứng dụng phổ biến bao gồm:

Đánh giá các thuật toán phân loại mới
Mục đích giáo dục để giảng dạy các khái niệm học máy
Tạo mẫu nhanh cho các hệ thống nhận diện ảnh
Kiểm tra các kỹ thuật tối ưu hóa model

Link to this sectionCách sử dụng#

Huấn luyện một mô hình phân loại YOLO trên MNIST trong 100 epoch với kích thước hình ảnh là 28. Tập dữ liệu sẽ tự động tải xuống và lưu vào bộ nhớ đệm trong lần sử dụng đầu tiên; nếu bạn thích kiểm soát hoàn toàn quá trình tiền xử lý, các tệp lưu trữ gzip gốc cũng có sẵn từ cơ sở dữ liệu MNIST. Để có danh sách đầy đủ các đối số khả dụng, hãy xem trang Huấn luyện và hướng dẫn tác vụ phân loại hình ảnh.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Các thử nghiệm nhanh với MNIST160

Ultralytics cũng cung cấp data="mnist160", một lát cắt gồm 160 hình ảnh chứa tám hình ảnh đầu tiên của mỗi chữ số (0–9) từ cả tập huấn luyện và tập kiểm tra. Nó phản ánh cấu trúc thư mục của MNIST, vì vậy bạn có thể hoán đổi các tập dữ liệu mà không cần thay đổi bất kỳ đối số nào khác — lý tưởng cho các quy trình CI hoặc kiểm tra tính hợp lệ trước khi cam kết với toàn bộ tập dữ liệu 70.000 hình ảnh.

yolo classify train data=mnist160 model=yolo26n-cls.pt epochs=5 imgsz=28

Link to this sectionHình ảnh mẫu và chú thích#

Hình ảnh mẫu từ tập dữ liệu MNIST:

Các mẫu tập dữ liệu phân loại chữ số viết tay MNIST

Các mẫu hiển thị phạm vi phong cách chữ viết tay mà tập dữ liệu thu thập được trên 10 lớp chữ số.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu MNIST trong nghiên cứu hoặc công việc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]},
         volume={2},
         year={2010}
}

Chúng tôi muốn ghi nhận Yann LeCun, Corinna Cortes và Christopher J.C. Burges vì đã tạo và duy trì tập dữ liệu MNIST như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu học máy và thị giác máy tính. Để biết thêm thông tin về tập dữ liệu MNIST và những người tạo ra nó, hãy truy cập trang web tập dữ liệu MNIST.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu MNIST là gì và tại sao nó quan trọng trong học máy?#

Tập dữ liệu MNIST là một điểm chuẩn gồm 70.000 hình ảnh thang độ xám 28x28 của các chữ số viết tay, được chia thành 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra trên 10 lớp từ 0–9. Đây là tài liệu tham khảo tiêu chuẩn để đánh giá các thuật toán phân loại hình ảnh — định dạng nhỏ, đồng nhất của nó cho phép các nhà nghiên cứu và kỹ sư so sánh các phương pháp và theo dõi tiến độ với thiết lập tối thiểu, đó là lý do tại sao nó vẫn là một điểm chuẩn đầu tiên phổ biến trong học máy.

Link to this sectionTập dữ liệu MNIST có bao nhiêu lớp và bao nhiêu hình ảnh?#

MNIST có 10 lớp — các chữ số viết tay từ 0 đến 9 — và tổng cộng 70.000 hình ảnh thang độ xám, mỗi hình ảnh có kích thước 28x28 pixel. Nó đi kèm với một phân tách được xác định trước gồm 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra, với số lượng ví dụ gần như bằng nhau cho mỗi chữ số.

Link to this sectionLàm thế nào tôi có thể sử dụng Ultralytics YOLO để huấn luyện model trên tập dữ liệu MNIST?#

Để huấn luyện một mô hình Ultralytics YOLO trên MNIST, hãy sử dụng các đoạn mã bên dưới. Tập dữ liệu tự động tải xuống trong lần sử dụng đầu tiên. Để có danh sách chi tiết các đối số huấn luyện khả dụng, hãy tham khảo trang Huấn luyện.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=28)

Link to this sectionTập dữ liệu MNIST được phân tách thành tập huấn luyện và tập kiểm tra như thế nào?#

MNIST đi kèm với một phân tách được xác định trước gồm 60.000 hình ảnh huấn luyện và 10.000 hình ảnh kiểm tra. Không giống như các tập dữ liệu phân loại dựa trên thư mục mà Ultralytics tự động phân tách, phân vùng chính thức của MNIST được sử dụng nguyên trạng và tập kiểm tra đóng vai trò là tập xác thực trong quá trình huấn luyện theo mặc định.

Link to this sectionSự khác biệt giữa tập dữ liệu MNIST và EMNIST là gì?#

Tập dữ liệu MNIST chỉ chứa các chữ số viết tay, trong khi tập dữ liệu EMNIST (Extended MNIST) bao gồm cả chữ số và chữ cái viết hoa và viết thường. EMNIST được phát triển như một phiên bản kế nhiệm của MNIST và sử dụng cùng định dạng 28x28 pixel, giúp nó tương thích với các công cụ và mô hình được thiết kế cho tập dữ liệu MNIST gốc. Phạm vi ký tự rộng hơn này làm cho EMNIST hữu ích cho nhiều ứng dụng học máy hơn.

Link to this sectionTôi có thể sử dụng Nền tảng Ultralytics để huấn luyện các mô hình trên các tập dữ liệu như MNIST không?#

Có. Nền tảng Ultralytics cho phép bạn tải lên các tập dữ liệu, huấn luyện các mô hình phân loại hình ảnh và triển khai chúng mà không cần lập trình chuyên sâu. Đây là một cách thuận tiện để chạy các thử nghiệm MNIST trên đám mây — hãy xem tổng quan về các tập dữ liệu phân loại để biết các tùy chọn liên quan.

Link to this sectionMNIST so sánh thế nào với các tập dữ liệu phân loại ảnh khác?#

MNIST đơn giản hơn nhiều tập dữ liệu hiện đại như CIFAR-10 hoặc ImageNet, khiến nó trở nên lý tưởng cho người mới bắt đầu và thử nghiệm nhanh. Mặc dù các tập dữ liệu phức tạp hơn mang lại nhiều thách thức hơn với hình ảnh màu và các danh mục đối tượng đa dạng, MNIST vẫn có giá trị nhờ sự đơn giản, kích thước tệp nhỏ và ý nghĩa lịch sử trong quá trình phát triển các thuật toán học máy. Đối với một sự thay thế khó hơn với cùng cấu trúc, hãy xem Fashion-MNIST, trong đó có các mặt hàng quần áo thay vì các chữ số.

Người đóng góp

GLglenn-jocher¹⁸ RAraimbekovm² PDpderrenger¹ MAMatthewNoyce¹ JKjk4e¹

Đã tạo 12 thg 11, 2023Đã cập nhật 12 giờ trước