Bỏ để qua phần nội dung

Tập dữ liệu MNIST

Bộ dữ liệu MNIST (Viện Tiêu chuẩn và Công nghệ Quốc gia Sửa đổi) là một cơ sở dữ liệu lớn gồm các chữ số viết tay thường được sử dụng để đào tạo các hệ thống xử lý hình ảnh và mô hình học máy khác nhau. Nó được tạo ra bằng cách "trộn lại" các mẫu từ bộ dữ liệu gốc của NIST và đã trở thành một chuẩn mực để đánh giá hiệu suất của các thuật toán phân loại hình ảnh.

Các tính năng chính

  • MNIST chứa 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm của các chữ số viết tay.
  • Tập dữ liệu bao gồm các hình ảnh thang độ xám có kích thước 28x28 pixel.
  • Các hình ảnh được chuẩn hóa để vừa với hộp giới hạn 28x28 pixel và khử răng cưa, giới thiệu các mức thang độ xám.
  • MNIST được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại hình ảnh.

Cấu trúc tập dữ liệu

Tập dữ liệu MNIST được chia thành hai tập con:

  1. Bộ đào tạo: Tập hợp con này chứa 60.000 hình ảnh của các chữ số viết tay được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm: Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để kiểm tra và đo điểm chuẩn cho các mô hình được đào tạo.

MNIST mở rộng (EMNIST)

MNIST mở rộng (EMNIST) là một bộ dữ liệu mới hơn được phát triển và phát hành bởi NIST để kế thừa MNIST. Trong khi MNIST chỉ bao gồm hình ảnh của các chữ số viết tay, EMNIST bao gồm tất cả các hình ảnh từ Cơ sở dữ liệu đặc biệt NIST 19, là một cơ sở dữ liệu lớn về các chữ cái viết hoa và viết thường cũng như các chữ số. Các hình ảnh trong EMNIST đã được chuyển đổi thành cùng định dạng 28x28 pixel, theo quy trình tương tự, cũng như các hình ảnh MNIST. Theo đó, các công cụ hoạt động với bộ dữ liệu MNIST cũ hơn, nhỏ hơn có thể sẽ hoạt động không sửa đổi với EMNIST.

Ứng dụng

Bộ dữ liệu MNIST được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Định dạng đơn giản và có cấu trúc tốt của tập dữ liệu làm cho nó trở thành một nguồn tài nguyên thiết yếu cho các nhà nghiên cứu và các học viên trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để đào tạo mô hình CNN trên tập dữ liệu MNIST cho 100 kỷ nguyên với kích thước hình ảnh 32x32, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Hình ảnh mẫu và chú thích

Bộ dữ liệu MNIST chứa hình ảnh thang độ xám của các chữ số viết tay, cung cấp bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các chữ số viết tay trong tập dữ liệu MNIST, làm nổi bật tầm quan trọng của bộ dữ liệu đa dạng để đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

Trích dẫn và xác nhận

Nếu bạn sử dụng tập dữ liệu MNIST trong

Công việc nghiên cứu hoặc phát triển, vui lòng trích dẫn bài báo sau:

@article{lecun2010mnist,
         title={MNIST handwritten digit database},
         author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
         journal={ATT Labs [Online]. Available: http://yann.lecun.com/exdb/mnist},
         volume={2},
         year={2010}
}

Chúng tôi muốn ghi nhận Yann LeCun, Corinna Cortes và Christopher JC Burges vì đã tạo và duy trì bộ dữ liệu MNIST như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu MNIST và người tạo ra nó, hãy truy cập trang web tập dữ liệu MNIST.

FAQ

Bộ dữ liệu MNIST là gì và tại sao nó lại quan trọng trong học máy?

Bộ dữ liệu MNIST , hoặc bộ dữ liệu của Viện Tiêu chuẩn và Công nghệ Quốc gia Sửa đổi, là một bộ sưu tập các chữ số viết tay được sử dụng rộng rãi được thiết kế để đào tạo và thử nghiệm các hệ thống phân loại hình ảnh. Nó bao gồm 60.000 hình ảnh đào tạo và 10.000 hình ảnh thử nghiệm, tất cả đều có thang độ xám và kích thước 28x28 pixel. Tầm quan trọng của bộ dữ liệu nằm ở vai trò của nó như một điểm chuẩn tiêu chuẩn để đánh giá các thuật toán phân loại hình ảnh, giúp các nhà nghiên cứu và kỹ sư so sánh các phương pháp và theo dõi tiến trình trong lĩnh vực này.

Tôi có thể sử dụng như thế nào Ultralytics YOLO để đào tạo một mô hình trên tập dữ liệu MNIST?

Để đào tạo một mô hình trên tập dữ liệu MNIST bằng cách sử dụng Ultralytics YOLO, bạn có thể làm theo các bước sau:

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="mnist", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=mnist model=yolov8n-cls.pt epochs=100 imgsz=28

Để biết danh sách chi tiết các đối số đào tạo có sẵn, hãy tham khảo trang Đào tạo .

Sự khác biệt giữa bộ dữ liệu MNIST và EMNIST là gì?

Bộ dữ liệu MNIST chỉ chứa các chữ số viết tay, trong khi bộ dữ liệu MNIST mở rộng (EMNIST) bao gồm cả chữ số và chữ hoa và chữ thường. EMNIST được phát triển như một sự kế thừa cho MNIST và sử dụng cùng một định dạng pixel 28x28 cho hình ảnh, làm cho nó tương thích với các công cụ và mô hình được thiết kế cho tập dữ liệu MNIST gốc. Phạm vi ký tự rộng hơn này trong EMNIST làm cho nó hữu ích cho nhiều ứng dụng học máy hơn.

Tôi có thể sử dụng không Ultralytics HUB để đào tạo các mô hình trên các bộ dữ liệu tùy chỉnh như MNIST?

Có, bạn có thể sử dụng Ultralytics HUB để đào tạo các mô hình trên các bộ dữ liệu tùy chỉnh như MNIST. Ultralytics HUB cung cấp giao diện thân thiện với người dùng để tải lên bộ dữ liệu, mô hình đào tạo và quản lý dự án mà không cần kiến thức mã hóa sâu rộng. Để biết thêm chi tiết về cách bắt đầu, hãy xem Ultralytics Trang Bắt đầu nhanh HUB .


📅 Created 10 months ago ✏️ Updated 13 days ago

Ý kiến