Bỏ qua nội dung

Bộ dữ liệu MNIST

Bộ dữ liệu MNIST (Viện Tiêu chuẩn và Công nghệ Quốc gia đã sửa đổi) là một cơ sở dữ liệu lớn về các chữ số viết tay thường được sử dụng để đào tạo nhiều hệ thống xử lý hình ảnh và mô hình học máy. Nó được tạo ra bằng cách "trộn lại" các mẫu từ các bộ dữ liệu gốc của NIST và đã trở thành chuẩn mực để đánh giá hiệu suất của các thuật toán phân loại hình ảnh.

Các tính năng chính

  • MNIST chứa 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm chữ số viết tay.
  • Bộ dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
  • Hình ảnh được chuẩn hóa để phù hợp với hộp giới hạn 28x28 pixel và khử răng cưa, tạo ra các mức độ thang độ xám.
  • MNIST được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại hình ảnh.

Cấu trúc tập dữ liệu

Bộ dữ liệu MNIST được chia thành hai tập hợp con:

  1. Bộ đào tạo : Tập hợp con này chứa 60.000 hình ảnh chữ số viết tay được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm : Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để thử nghiệm và đánh giá chuẩn các mô hình đã được đào tạo.

MNIST mở rộng (EMNIST)

Extended MNIST (EMNIST) là một tập dữ liệu mới hơn do NIST phát triển và phát hành để kế thừa MNIST. Trong khi MNIST chỉ bao gồm hình ảnh chữ số viết tay, EMNIST bao gồm tất cả hình ảnh từ Cơ sở dữ liệu đặc biệt 19 của NIST, đây là một cơ sở dữ liệu lớn gồm chữ hoa và chữ thường viết tay cũng như chữ số. Các hình ảnh trong EMNIST đã được chuyển đổi thành cùng một định dạng pixel 28x28, bằng cùng một quy trình, giống như hình ảnh MNIST. Theo đó, các công cụ hoạt động với tập dữ liệu MNIST cũ hơn, nhỏ hơn có khả năng sẽ hoạt động mà không cần sửa đổi với EMNIST.

Ứng dụng

Bộ dữ liệu MNIST được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Định dạng đơn giản và có cấu trúc tốt của bộ dữ liệu khiến nó trở thành nguồn tài nguyên thiết yếu cho các nhà nghiên cứu và học viên trong lĩnh vực học máy và thị giác máy tính.

Cách sử dụng

Để đào tạo mô hình CNN trên tập dữ liệu MNIST trong 100 kỷ nguyên với kích thước hình ảnh là 32x32, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Hình ảnh mẫu và chú thích

Bộ dữ liệu MNIST chứa hình ảnh thang độ xám của chữ số viết tay, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh . Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Hình ảnh mẫu của bộ dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các chữ số viết tay trong tập dữ liệu MNIST, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng tập dữ liệu MNIST trong

công trình nghiên cứu hoặc phát triển, vui lòng trích dẫn bài báo sau:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Chúng tôi muốn cảm ơn Yann LeCun, Corinna Cortes và Christopher JC Burges vì đã tạo ra và duy trì tập dữ liệu MNIST như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy họcthị giác máy tính . Để biết thêm thông tin về tập dữ liệu MNIST và những người tạo ra nó, hãy truy cập trang web tập dữ liệu MNIST .

CÂU HỎI THƯỜNG GẶP

Bộ dữ liệu MNIST là gì và tại sao nó lại quan trọng trong học máy?

Bộ dữ liệu MNIST , hay bộ dữ liệu Viện Tiêu chuẩn và Công nghệ Quốc gia đã sửa đổi, là một bộ sưu tập các chữ số viết tay được sử dụng rộng rãi được thiết kế để đào tạo và thử nghiệm các hệ thống phân loại hình ảnh. Bộ dữ liệu này bao gồm 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm, tất cả đều là thang độ xám và có kích thước 28x28 pixel. Tầm quan trọng của bộ dữ liệu nằm ở vai trò là chuẩn mực để đánh giá các thuật toán phân loại hình ảnh, giúp các nhà nghiên cứu và kỹ sư so sánh các phương pháp và theo dõi tiến trình trong lĩnh vực này.

Tôi có thể sử dụng như thế nào? Ultralytics YOLO để đào tạo một mô hình trên tập dữ liệu MNIST?

Để đào tạo một mô hình trên tập dữ liệu MNIST bằng cách sử dụng Ultralytics YOLO , bạn có thể làm theo các bước sau:

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolo11n-cls.pt epochs=100 imgsz=28

Để biết danh sách chi tiết các đối số đào tạo có sẵn, hãy tham khảo trang Đào tạo .

Sự khác biệt giữa bộ dữ liệu MNIST và EMNIST là gì?

Bộ dữ liệu MNIST chỉ chứa các chữ số viết tay, trong khi bộ dữ liệu MNIST mở rộng (EMNIST) bao gồm cả chữ số và chữ hoa và chữ thường. EMNIST được phát triển như một phiên bản kế nhiệm của MNIST và sử dụng cùng định dạng pixel 28x28 cho hình ảnh, khiến nó tương thích với các công cụ và mô hình được thiết kế cho bộ dữ liệu MNIST gốc. Phạm vi ký tự rộng hơn này trong EMNIST giúp nó hữu ích cho nhiều ứng dụng học máy hơn.

Tôi có thể sử dụng Ultralytics HUB sẽ đào tạo các mô hình trên các tập dữ liệu tùy chỉnh như MNIST?

Có, bạn có thể sử dụng Ultralytics HUB để đào tạo các mô hình trên các tập dữ liệu tùy chỉnh như MNIST. Ultralytics HUB cung cấp giao diện thân thiện với người dùng để tải lên các tập dữ liệu, mô hình đào tạo và quản lý dự án mà không cần kiến thức lập trình chuyên sâu. Để biết thêm chi tiết về cách bắt đầu, hãy xem trang Bắt đầu nhanh Ultralytics HUB .

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 2 tháng

Bình luận