No license

Link to this sectionTập dữ liệu CIFAR-10#

Tập dữ liệu CIFAR-10 (Canadian Institute For Advanced Research) là một chuẩn phân loại hình ảnh cổ điển gồm 60.000 hình ảnh màu 32x32 được chia đều cho 10 lớp — máy bay, ô tô, chim, mèo, hươu, chó, ếch, ngựa, tàu thủy và xe tải. Tập dữ liệu này đi kèm với sự phân chia định sẵn gồm 50.000 ảnh huấn luyện và 10.000 ảnh kiểm tra (6.000 ảnh mỗi lớp), tạo nên một điểm khởi đầu nhẹ và cân bằng tốt để huấn luyện và đánh giá các model phân loại. Để có thử thách chi tiết hơn, hãy xem tập dữ liệu CIFAR-100 liên quan.

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this sectionTính năng chính#

CIFAR-10 chứa 60.000 hình ảnh màu có kích thước 32x32 pixel, được chia đều thành 10 lớp.
Mỗi lớp có chính xác 6.000 hình ảnh — 5.000 ảnh để huấn luyện và 1.000 ảnh để kiểm tra — do đó tập dữ liệu này hoàn toàn cân bằng.
10 lớp bao gồm máy bay, ô tô, chim, mèo, hươu, chó, ếch, ngựa, tàu thủy và xe tải.
Tập dữ liệu đi kèm với phân chia train/test định sẵn, vì vậy không cần thực hiện việc chia dữ liệu thủ công hay tự động.
CIFAR-10 là một chuẩn mực cho nghiên cứu về phân loại hình ảnh và nhận diện đối tượng.

Link to this sectionCấu trúc tập dữ liệu#

CIFAR-10 đi kèm với một phân chia chính thức, định sẵn, vì vậy không cần thực hiện phân chia thủ công hay tự động:

Các lớp: 10 (máy bay, ô tô, chim, mèo, hươu, chó, ếch, ngựa, tàu thủy, xe tải)
Tổng số hình ảnh: 60.000 (màu, kích thước 32x32)
Tập huấn luyện: 50.000 hình ảnh (5.000 ảnh mỗi lớp)
Tập kiểm tra: 10.000 hình ảnh (1.000 ảnh mỗi lớp)

Tập xác thực

CIFAR-10 không có thư mục validation riêng biệt, vì vậy Ultralytics sử dụng tập kiểm tra gồm 10.000 ảnh làm tập validation trong quá trình huấn luyện theo mặc định.

Link to this sectionỨng dụng#

CIFAR-10 được sử dụng rộng rãi để huấn luyện và đánh giá các model phân loại hình ảnh, từ Mạng thần kinh tích chập (CNN) cổ điển và Máy hỗ trợ vector (SVM) đến các cấu trúc chuyên sâu hiện đại. Kích thước hình ảnh nhỏ và các lớp cân bằng khiến nó trở nên lý tưởng cho việc thử nghiệm nhanh, đánh giá thuật toán mới và giảng dạy các nguyên lý cơ bản về thị giác máy tính.

Link to this sectionCách sử dụng#

Huấn luyện một model YOLO trên CIFAR-10 trong 100 epoch với kích thước ảnh là 32. Để biết danh sách đầy đủ các đối số khả dụng, hãy xem trang Huấn luyện và hướng dẫn tác vụ phân loại hình ảnh.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionHình ảnh mẫu và chú thích#

Tập dữ liệu CIFAR-10 chứa các hình ảnh màu của nhiều đối tượng khác nhau, cung cấp một tập dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

CIFAR-10 image classification dataset samples

Các mẫu này cho thấy sự đa dạng của các đối tượng trong tập dữ liệu CIFAR-10, nhấn mạnh giá trị của một tập dữ liệu đa dạng trong việc huấn luyện các model phân loại hình ảnh mạnh mẽ.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu CIFAR-10 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau đây:

Trích dẫn

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Chúng tôi muốn gửi lời cảm ơn tới Alex Krizhevsky vì đã tạo ra và duy trì tập dữ liệu CIFAR-10 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu học máy và thị giác máy tính. Để biết thêm thông tin về tập dữ liệu CIFAR-10 và người tạo ra nó, hãy truy cập trang web tập dữ liệu CIFAR-10.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu CIFAR-10 được sử dụng để làm gì trong học máy?#

Tập dữ liệu CIFAR-10 được sử dụng rộng rãi để huấn luyện và đánh giá các model phân loại hình ảnh và nhận diện đối tượng. Nó chứa 60.000 hình ảnh màu 32x32 được chia đều cho 10 lớp, và kích thước nhỏ cùng các lớp cân bằng khiến nó trở thành một chuẩn mực nhanh, đáng tin cậy cho các thuật toán như Mạng thần kinh tích chập (CNN) và Máy hỗ trợ vector (SVM).

Link to this sectionLàm thế nào để huấn luyện một model Ultralytics YOLO trên tập dữ liệu CIFAR-10?#

Để huấn luyện một model Ultralytics YOLO trên CIFAR-10, hãy sử dụng các đoạn mã bên dưới. Tập dữ liệu sẽ tự động tải xuống trong lần sử dụng đầu tiên. Để biết danh sách đầy đủ các đối số, hãy xem trang Huấn luyện của model.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionTập dữ liệu CIFAR-10 có bao nhiêu lớp?#

CIFAR-10 có 10 lớp — máy bay, ô tô, chim, mèo, hươu, chó, ếch, ngựa, tàu thủy và xe tải — mỗi lớp có chính xác 6.000 hình ảnh, tổng cộng là 60.000 hình ảnh. Các lớp này loại trừ lẫn nhau và hoàn toàn cân bằng, không có sự chồng chéo giữa các danh mục.

Link to this sectionTập dữ liệu CIFAR-10 được chia thành tập huấn luyện và tập kiểm tra như thế nào?#

CIFAR-10 đi kèm với phân chia định sẵn gồm 50.000 ảnh huấn luyện và 10.000 ảnh kiểm tra, với chính xác 5.000 ảnh huấn luyện và 1.000 ảnh kiểm tra mỗi lớp. Không giống như các tập dữ liệu phân loại dựa trên thư mục mà Ultralytics tự động chia, phân chia chính thức của CIFAR-10 được sử dụng nguyên trạng và tập kiểm tra đóng vai trò là tập validation trong quá trình huấn luyện theo mặc định.

Link to this sectionTôi có thể sử dụng Ultralytics Platform để huấn luyện các model trên tập dữ liệu CIFAR-10 không?#

Có. Ultralytics Platform cho phép bạn quản lý các tập dữ liệu, huấn luyện các model phân loại hình ảnh và triển khai chúng mà không cần lập trình phức tạp. Đây là một cách thuận tiện để chạy các thử nghiệm CIFAR-10 trên đám mây, và bạn có thể khám phá thêm các tùy chọn trong tổng quan về tập dữ liệu phân loại của chúng tôi.

Người đóng góp

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

Đã tạo 12 thg 11, 2023Đã cập nhật 3 ngày trước