Tập dữ liệu CIFAR-100

Tập dữ liệu CIFAR-100 (Canadian Institute For Advanced Research) là một phần mở rộng đáng kể của tập dữ liệu CIFAR-10, bao gồm 60.000 hình ảnh màu 32x32 trong 100 lớp khác nhau. Tập dữ liệu này được phát triển bởi các nhà nghiên cứu tại viện CIFAR, cung cấp một tập dữ liệu thách thức hơn cho các tác vụ học máy và thị giác máy tính phức tạp hơn.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Các tính năng chính

  • Tập dữ liệu CIFAR-100 bao gồm 60.000 hình ảnh, được chia thành 100 lớp.
  • Mỗi lớp chứa 600 hình ảnh, được chia thành 500 hình ảnh để huấn luyện và 100 hình ảnh để kiểm thử.
  • Các hình ảnh này là ảnh màu và có kích thước 32x32 pixel.
  • 100 lớp khác nhau được nhóm thành 20 danh mục thô để phân loại ở cấp độ cao hơn.
  • CIFAR-100 thường được sử dụng để huấn luyện và kiểm thử trong lĩnh vực học máy và thị giác máy tính.

Cấu trúc tập dữ liệu

Tập dữ liệu CIFAR-100 được chia thành hai tập con:

  1. Training Set: Tập con này chứa 50.000 hình ảnh được sử dụng để huấn luyện các mô hình machine learning.
  2. Testing Set: Tập con này bao gồm 10.000 hình ảnh được sử dụng để kiểm thử và đánh giá các mô hình đã được huấn luyện.

Ứng dụng

Tập dữ liệu CIFAR-100 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng thần kinh tích chập (CNNs), Máy vectơ hỗ trợ (SVMs), và nhiều thuật toán học máy khác. Sự đa dạng của tập dữ liệu về các lớp và sự hiện diện của hình ảnh màu làm cho nó trở thành một tập dữ liệu đầy đủ và thách thức hơn cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Cách sử dụng

Để huấn luyện mô hình YOLO trên tập dữ liệu CIFAR-100 trong 100 epoch với kích thước hình ảnh 32x32, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện mô hình.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Hình ảnh và chú thích mẫu

Tập dữ liệu CIFAR-100 chứa các hình ảnh màu của nhiều đối tượng khác nhau, cung cấp một tập dữ liệu được cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Mẫu tập dữ liệu phân loại hình ảnh CIFAR-100

Ví dụ này minh họa sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu CIFAR-100, nêu bật tầm quan trọng của một tập dữ liệu đa dạng để huấn luyện các mô hình phân loại hình ảnh mạnh mẽ.

Trích dẫn và Ghi nhận

Nếu bạn sử dụng tập dữ liệu CIFAR-100 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau đây:

Trích dẫn
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Chúng tôi xin ghi nhận Alex Krizhevsky vì đã tạo và duy trì tập dữ liệu CIFAR-100 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu học máy và thị giác máy tính. Để biết thêm thông tin về tập dữ liệu CIFAR-100 và người tạo ra nó, hãy truy cập trang web tập dữ liệu CIFAR-100.

Câu hỏi thường gặp (FAQ)

Tập dữ liệu CIFAR-100 là gì và tại sao nó lại quan trọng?

Tập dữ liệu CIFAR-100 là một bộ sưu tập lớn gồm 60.000 hình ảnh màu 32x32 được phân loại thành 100 lớp. Được phát triển bởi Canadian Institute For Advanced Research (CIFAR), nó cung cấp một tập dữ liệu thách thức lý tưởng cho các tác vụ học máy và thị giác máy tính phức tạp. Tầm quan trọng của nó nằm ở sự đa dạng của các lớp và kích thước nhỏ của hình ảnh, làm cho nó trở thành một tài nguyên quý giá để huấn luyện và kiểm thử các mô hình học sâu, như Mạng thần kinh tích chập (CNNs), sử dụng các framework như Ultralytics YOLO.

Làm cách nào để tôi huấn luyện mô hình YOLO trên tập dữ liệu CIFAR-100?

Bạn có thể huấn luyện mô hình YOLO trên tập dữ liệu CIFAR-100 bằng cách sử dụng Python hoặc các lệnh CLI. Dưới đây là cách thực hiện:

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Để có danh sách đầy đủ các đối số khả dụng, vui lòng tham khảo trang Huấn luyện mô hình.

Các ứng dụng chính của tập dữ liệu CIFAR-100 là gì?

Tập dữ liệu CIFAR-100 được sử dụng rộng rãi trong việc huấn luyện và đánh giá các mô hình học sâu cho phân loại hình ảnh. Tập hợp đa dạng gồm 100 lớp, được nhóm thành 20 danh mục thô, cung cấp một môi trường thách thức để kiểm thử các thuật toán như Mạng thần kinh tích chập (CNNs), Máy vectơ hỗ trợ (SVMs), và nhiều phương pháp học máy khác. Tập dữ liệu này là một nguồn tài nguyên quan trọng trong nghiên cứu và phát triển trong các lĩnh vực học máy và thị giác máy tính, đặc biệt là cho các tác vụ nhận diện đối tượng và phân loại.

Tập dữ liệu CIFAR-100 được cấu trúc như thế nào?

Tập dữ liệu CIFAR-100 được chia thành hai tập con chính:

  1. Training Set: Chứa 50.000 hình ảnh được sử dụng để huấn luyện các mô hình machine learning.
  2. Tập kiểm thử: Bao gồm 10.000 hình ảnh được sử dụng để kiểm thử và đánh giá hiệu năng các mô hình đã huấn luyện.

Mỗi lớp trong số 100 lớp chứa 600 hình ảnh, với 500 hình ảnh để huấn luyện và 100 hình ảnh để kiểm thử, khiến nó trở nên độc đáo và phù hợp cho các nghiên cứu học thuật và công nghiệp khắt khe.

Tôi có thể tìm thấy các hình ảnh mẫu và chú thích từ tập dữ liệu CIFAR-100 ở đâu?

Tập dữ liệu CIFAR-100 bao gồm nhiều hình ảnh màu của các đối tượng khác nhau, làm cho nó trở thành một tập dữ liệu có cấu trúc cho các tác vụ phân loại hình ảnh. Bạn có thể tham khảo trang tài liệu để xem các hình ảnh mẫu và chú thích. Các ví dụ này nêu bật sự đa dạng và phức tạp của tập dữ liệu, rất quan trọng để huấn luyện các mô hình phân loại hình ảnh mạnh mẽ. Để có thêm các tập dữ liệu phù hợp cho các tác vụ phân loại, hãy xem tổng quan về các tập dữ liệu phân loại của Ultralytics.

Bình luận