Bỏ để qua phần nội dung

Tập dữ liệu CIFAR-100

Bộ dữ liệu CIFAR-100 (Viện Nghiên cứu Cao cấp Canada) là một phần mở rộng đáng kể của bộ dữ liệu CIFAR-10, bao gồm 60.000 hình ảnh màu 32x32 trong 100 lớp khác nhau. Nó được phát triển bởi các nhà nghiên cứu tại viện CIFAR, cung cấp một bộ dữ liệu thách thức hơn cho các nhiệm vụ học máy và thị giác máy tính phức tạp hơn.

Các tính năng chính

  • Bộ dữ liệu CIFAR-100 bao gồm 60.000 hình ảnh, được chia thành 100 lớp.
  • Mỗi lớp chứa 600 hình ảnh, được chia thành 500 hình ảnh để đào tạo và 100 để thử nghiệm.
  • Các hình ảnh được tô màu và có kích thước 32x32 pixel.
  • 100 lớp khác nhau được nhóm thành 20 loại thô để phân loại cấp cao hơn.
  • CIFAR-100 thường được sử dụng để đào tạo và thử nghiệm trong lĩnh vực học máy và thị giác máy tính.

Cấu trúc tập dữ liệu

Tập dữ liệu CIFAR-100 được chia thành hai tập hợp con:

  1. Training Set: Tập hợp con này chứa 50.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm: Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để kiểm tra và đo điểm chuẩn cho các mô hình được đào tạo.

Ứng dụng

Bộ dữ liệu CIFAR-100 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Sự đa dạng của tập dữ liệu về các lớp và sự hiện diện của hình ảnh màu làm cho nó trở thành một bộ dữ liệu toàn diện và đầy thách thức hơn cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-100 cho 100 kỷ nguyên với kích thước hình ảnh 32x32, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Hình ảnh mẫu và chú thích

Bộ dữ liệu CIFAR-100 chứa hình ảnh màu của các đối tượng khác nhau, cung cấp bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu CIFAR-100, làm nổi bật tầm quan trọng của bộ dữ liệu đa dạng để đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

Trích dẫn và xác nhận

Nếu bạn sử dụng bộ dữ liệu CIFAR-100 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Chúng tôi muốn ghi nhận Alex Krizhevsky vì đã tạo và duy trì bộ dữ liệu CIFAR-100 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu CIFAR-100 và người tạo ra nó, hãy truy cập trang web tập dữ liệu CIFAR-100.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Ý kiến