Tập dữ liệu CIFAR-10
Phương thức CIFAR-10 (Canadian Institute For Advanced Research) là một tập dữ liệu gồm các hình ảnh được sử dụng rộng rãi cho machine learning và các thuật toán thị giác máy tính. Nó được phát triển bởi các nhà nghiên cứu tại viện CIFAR và bao gồm 60.000 hình ảnh màu kích thước 32x32 thuộc 10 lớp khác nhau.
Các tính năng chính
- Tập dữ liệu CIFAR-10 bao gồm 60.000 hình ảnh, được chia thành 10 lớp.
- Mỗi lớp chứa 6.000 hình ảnh, được chia thành 5.000 ảnh để huấn luyện và 1.000 ảnh để kiểm thử.
- Các hình ảnh này là ảnh màu và có kích thước 32x32 pixel.
- 10 lớp khác nhau đại diện cho máy bay, ô tô, chim, mèo, hươu, chó, ếch, ngựa, tàu thủy và xe tải.
- CIFAR-10 thường được sử dụng để huấn luyện và kiểm thử trong lĩnh vực học máy và thị giác máy tính.
Cấu trúc bộ dữ liệu
Tập dữ liệu CIFAR-10 được chia thành hai tập con:
- Tập huấn luyện (Training Set): Tập con này chứa 50.000 hình ảnh được sử dụng để huấn luyện các model học máy.
- Tập kiểm thử: Tập con này bao gồm 10.000 hình ảnh được sử dụng để kiểm thử và đánh giá hiệu năng các model đã được huấn luyện.
Ứng dụng
Tập dữ liệu CIFAR-10 được sử dụng rộng rãi để huấn luyện và đánh giá deep learning các model trong các tác vụ phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), và nhiều thuật toán học máy khác. Sự đa dạng của tập dữ liệu về mặt các lớp và sự hiện diện của hình ảnh màu làm cho nó trở thành một tập dữ liệu toàn diện cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.
Sử dụng
Để huấn luyện một model YOLO trên tập dữ liệu CIFAR-10 trong 100 epochs với kích thước ảnh là 32x32, bạn có thể sử dụng các đoạn mã sau đây. Để có danh sách đầy đủ các tham số khả dụng, hãy tham khảo model Training của chúng tôi.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Hình ảnh mẫu và chú thích
Tập dữ liệu CIFAR-10 chứa các hình ảnh màu của nhiều đối tượng khác nhau, cung cấp một tập dữ liệu được cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Ví dụ này minh họa sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu CIFAR-10, làm nổi bật tầm quan trọng của một tập dữ liệu đa dạng để huấn luyện các model phân loại hình ảnh mạnh mẽ.
Trích dẫn và Ghi nhận
Nếu bạn sử dụng tập dữ liệu CIFAR-10 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}Chúng tôi xin gửi lời cảm ơn tới Alex Krizhevsky vì đã tạo và duy trì tập dữ liệu CIFAR-10 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu học máy và computer vision . Để biết thêm thông tin về tập dữ liệu CIFAR-10 và người tạo ra nó, hãy truy cập trang web tập dữ liệu CIFAR-10.
Câu hỏi thường gặp (FAQ)
Làm thế nào để tôi huấn luyện một model YOLO trên tập dữ liệu CIFAR-10?
Để huấn luyện một model YOLO trên tập dữ liệu CIFAR-10 sử dụng Ultralytics, bạn có thể làm theo các ví dụ được cung cấp cho cả Python và CLI. Đây là một ví dụ cơ bản để huấn luyện model của bạn trong 100 epoch với kích thước ảnh 32x32 pixel:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Để biết thêm chi tiết, hãy tham khảo model Training của chúng tôi.
Các tính năng chính của tập dữ liệu CIFAR-10 là gì?
Tập dữ liệu CIFAR-10 bao gồm 60.000 hình ảnh màu được chia thành 10 lớp. Mỗi lớp chứa 6.000 hình ảnh, với 5.000 ảnh để huấn luyện và 1.000 ảnh để kiểm thử. Các hình ảnh có kích thước 32x32 pixel và thay đổi theo các danh mục sau:
- Máy bay
- Ô tô
- Chim
- Mèo
- Hươu
- Chó
- Ếch
- Ngựa
- Tàu thủy
- Xe tải
Tập dữ liệu đa dạng này rất cần thiết cho việc huấn luyện các model phân loại hình ảnh trong các lĩnh vực như học máy và thị giác máy tính. Để biết thêm thông tin, hãy truy cập các phần về CIFAR-10 trên cấu trúc tập dữ liệu và các ứng dụng của chúng tôi.
Tại sao nên sử dụng tập dữ liệu CIFAR-10 cho các tác vụ phân loại hình ảnh?
Tập dữ liệu CIFAR-10 là một benchmark xuất sắc cho phân loại hình ảnh nhờ sự đa dạng và cấu trúc của nó. Nó chứa 60.000 hình ảnh được gán nhãn cân bằng trên 10 danh mục khác nhau, giúp ích cho việc huấn luyện các model mạnh mẽ và tổng quát. Nó được sử dụng rộng rãi để đánh giá các model học sâu, bao gồm Convolutional Neural Networks (CNNs) và các thuật toán học máy khác. Tập dữ liệu này tương đối nhỏ, làm cho nó phù hợp cho thử nghiệm nhanh và phát triển thuật toán. Khám phá vô số ứng dụng của nó trong các ứng dụng của chúng tôi .
Tập dữ liệu CIFAR-10 được cấu trúc như thế nào?
Tập dữ liệu CIFAR-10 được cấu trúc thành hai tập con chính:
- Tập huấn luyện (Training Set): Chứa 50.000 hình ảnh được sử dụng để huấn luyện các model học máy.
- Tập kiểm thử: Bao gồm 10.000 hình ảnh để kiểm thử và đánh giá các model đã được huấn luyện.
Mỗi tập con bao gồm các hình ảnh được phân loại thành 10 lớp, với các chú thích có sẵn để huấn luyện và đánh giá model. Để biết thông tin chi tiết hơn, hãy tham khảo cấu trúc tập dữ liệu .
Làm thế nào để tôi có thể trích dẫn tập dữ liệu CIFAR-10 trong nghiên cứu của mình?
Nếu bạn sử dụng tập dữ liệu CIFAR-10 trong các dự án nghiên cứu hoặc phát triển của mình, hãy đảm bảo trích dẫn bài báo sau:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}Việc ghi nhận những người tạo ra tập dữ liệu giúp hỗ trợ việc nghiên cứu và phát triển liên tục trong lĩnh vực này. Để biết thêm chi tiết, hãy xem phần trích dẫn và ghi nhận .
Một số ví dụ thực tế về việc sử dụng tập dữ liệu CIFAR-10 là gì?
Tập dữ liệu CIFAR-10 thường được sử dụng để huấn luyện các model phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNNs) và Support Vector Machines (SVMs). Những model này có thể được ứng dụng trong nhiều tác vụ thị giác máy tính khác nhau bao gồm object detection, nhận diện hình ảnh, và gắn thẻ tự động. Để xem một số ví dụ thực tế, hãy kiểm tra các đoạn mã trong phần sử dụng .