Bộ dữ liệu CIFAR-10
Bộ dữ liệu CIFAR-10 (Canadian Institute For Advanced Research) là một tập hợp các hình ảnh được sử dụng rộng rãi cho các thuật toán máy học và thị giác máy tính. Nó được phát triển bởi các nhà nghiên cứu tại viện CIFAR và bao gồm 60.000 hình ảnh màu 32x32 trong 10 lớp khác nhau.
Xem: Cách huấn luyện Phân loại hình ảnh Mô hình với bộ dữ liệu CIFAR-10 sử dụng Ultralytics YOLO11
Các tính năng chính
- Bộ dữ liệu CIFAR-10 bao gồm 60.000 hình ảnh, được chia thành 10 lớp.
- Mỗi lớp chứa 6.000 hình ảnh, được chia thành 5.000 cho huấn luyện và 1.000 cho kiểm thử.
- Các hình ảnh có màu và có kích thước 32x32 pixel.
- 10 lớp khác nhau đại diện cho máy bay, ô tô, chim, mèo, nai, chó, ếch, ngựa, tàu và xe tải.
- CIFAR-10 thường được sử dụng để huấn luyện và kiểm thử trong lĩnh vực học máy và thị giác máy tính.
Cấu trúc bộ dữ liệu
Bộ dữ liệu CIFAR-10 được chia thành hai tập con:
- Tập huấn luyện: Tập hợp con này chứa 50.000 hình ảnh được sử dụng để huấn luyện các mô hình học máy.
- Tập kiểm thử: Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để kiểm thử và đánh giá các mô hình đã huấn luyện.
Các ứng dụng
Bộ dữ liệu CIFAR-10 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Sự đa dạng của bộ dữ liệu về các lớp và sự hiện diện của hình ảnh màu làm cho nó trở thành một bộ dữ liệu toàn diện cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.
Cách sử dụng
Để huấn luyện một mô hình YOLO trên bộ dữ liệu CIFAR-10 trong 100 epochs với kích thước ảnh là 32x32, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.
Ví dụ huấn luyện
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Ảnh và Chú thích mẫu
Bộ dữ liệu CIFAR-10 chứa hình ảnh màu của nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một vài ví dụ về hình ảnh từ bộ dữ liệu:
Ví dụ này thể hiện sự đa dạng và phức tạp của các đối tượng trong bộ dữ liệu CIFAR-10, làm nổi bật tầm quan trọng của một bộ dữ liệu đa dạng để huấn luyện các mô hình phân loại hình ảnh mạnh mẽ.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng bộ dữ liệu CIFAR-10 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Chúng tôi xin ghi nhận công lao của Alex Krizhevsky trong việc tạo và duy trì bộ dữ liệu CIFAR-10 như một nguồn tài nguyên giá trị cho cộng đồng nghiên cứu thị giác máy tính và học máy. Để biết thêm thông tin về bộ dữ liệu CIFAR-10 và người tạo ra nó, hãy truy cập trang web bộ dữ liệu CIFAR-10.
Câu hỏi thường gặp
Làm thế nào để huấn luyện mô hình YOLO trên bộ dữ liệu CIFAR-10?
Để huấn luyện một mô hình YOLO trên bộ dữ liệu CIFAR-10 bằng Ultralytics, bạn có thể làm theo các ví dụ được cung cấp cho cả Python và CLI. Dưới đây là một ví dụ cơ bản để huấn luyện mô hình của bạn trong 100 epochs với kích thước ảnh là 32x32 pixel:
Ví dụ
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Để biết thêm chi tiết, hãy tham khảo trang Huấn luyện mô hình.
Các tính năng chính của bộ dữ liệu CIFAR-10 là gì?
Bộ dữ liệu CIFAR-10 bao gồm 60.000 ảnh màu được chia thành 10 lớp. Mỗi lớp chứa 6.000 ảnh, với 5.000 ảnh dùng để huấn luyện và 1.000 ảnh dùng để kiểm tra. Các ảnh có kích thước 32x32 pixel và khác nhau ở các danh mục sau:
- Máy bay
- Ô tô
- Chim
- Mèo
- Hươu
- Chó
- Ếch
- Ngựa
- Tàu thuyền
- Xe tải
Bộ dữ liệu đa dạng này rất cần thiết để huấn luyện các mô hình phân loại hình ảnh trong các lĩnh vực như máy học và thị giác máy tính. Để biết thêm thông tin, hãy truy cập các phần CIFAR-10 về cấu trúc bộ dữ liệu và ứng dụng.
Tại sao nên sử dụng bộ dữ liệu CIFAR-10 cho các tác vụ phân loại ảnh?
Bộ dữ liệu CIFAR-10 là một chuẩn mực tuyệt vời để phân loại hình ảnh do tính đa dạng và cấu trúc của nó. Nó chứa một hỗn hợp cân bằng gồm 60.000 hình ảnh được gắn nhãn trên 10 danh mục khác nhau, giúp huấn luyện các mô hình mạnh mẽ và tổng quát hóa. Nó được sử dụng rộng rãi để đánh giá các mô hình học sâu, bao gồm Mạng nơ-ron tích chập (CNN) và các thuật toán máy học khác. Bộ dữ liệu tương đối nhỏ, làm cho nó phù hợp để thử nghiệm nhanh chóng và phát triển thuật toán. Khám phá nhiều ứng dụng của nó trong phần ứng dụng.
Bộ dữ liệu CIFAR-10 được cấu trúc như thế nào?
Tập dữ liệu CIFAR-10 được cấu trúc thành hai tập hợp con chính:
- Tập huấn luyện: Chứa 50.000 hình ảnh được sử dụng để huấn luyện các mô hình học máy.
- Tập Dữ Liệu Kiểm Thử: Bao gồm 10.000 hình ảnh để kiểm tra và đánh giá các mô hình đã được huấn luyện.
Mỗi tập hợp con bao gồm các hình ảnh được phân loại thành 10 lớp, với các chú thích của chúng có sẵn để huấn luyện và đánh giá mô hình. Để biết thêm thông tin chi tiết, hãy tham khảo phần cấu trúc tập dữ liệu.
Làm cách nào để trích dẫn bộ dữ liệu CIFAR-10 trong nghiên cứu của tôi?
Nếu bạn sử dụng bộ dữ liệu CIFAR-10 trong các dự án nghiên cứu hoặc phát triển của mình, hãy đảm bảo trích dẫn bài báo sau:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Ghi nhận những người tạo ra bộ dữ liệu giúp hỗ trợ nghiên cứu và phát triển liên tục trong lĩnh vực này. Để biết thêm chi tiết, hãy xem phần trích dẫn và ghi nhận.
Một vài ví dụ thực tế về việc sử dụng bộ dữ liệu CIFAR-10 là gì?
Bộ dữ liệu CIFAR-10 thường được sử dụng để huấn luyện các mô hình phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN) và Máy vectơ hỗ trợ (SVM). Các mô hình này có thể được sử dụng trong nhiều tác vụ thị giác máy tính khác nhau, bao gồm phát hiện đối tượng, nhận dạng hình ảnh và gắn thẻ tự động. Để xem một số ví dụ thực tế, hãy xem các đoạn mã trong phần sử dụng.