Bỏ qua nội dung

Bộ dữ liệu CIFAR-100

Bộ dữ liệu CIFAR-100 (Viện nghiên cứu nâng cao Canada) là phần mở rộng đáng kể của bộ dữ liệu CIFAR-10, bao gồm 60.000 hình ảnh màu 32x32 trong 100 lớp khác nhau. Bộ dữ liệu này được phát triển bởi các nhà nghiên cứu tại viện CIFAR, cung cấp một bộ dữ liệu đầy thử thách hơn cho các tác vụ học máy và thị giác máy tính phức tạp hơn.



Đồng hồ: How to Train Ultralytics YOLO11 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Các tính năng chính

  • Bộ dữ liệu CIFAR-100 bao gồm 60.000 hình ảnh, được chia thành 100 lớp.
  • Mỗi lớp chứa 600 hình ảnh, chia thành 500 hình ảnh để đào tạo và 100 hình ảnh để thử nghiệm.
  • Hình ảnh được tô màu và có kích thước 32x32 pixel.
  • 100 lớp khác nhau được nhóm thành 20 loại thô để phân loại ở cấp độ cao hơn.
  • CIFAR-100 thường được sử dụng để đào tạo và thử nghiệm trong lĩnh vực học máy và thị giác máy tính.

Cấu trúc tập dữ liệu

Bộ dữ liệu CIFAR-100 được chia thành hai tập hợp con:

  1. Bộ đào tạo : Tập hợp con này chứa 50.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm : Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để thử nghiệm và đánh giá chuẩn các mô hình đã được đào tạo.

Ứng dụng

Bộ dữ liệu CIFAR-100 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNN), Support Vector Machines (SVM) và nhiều thuật toán học máy khác. Sự đa dạng của bộ dữ liệu về mặt lớp và sự hiện diện của hình ảnh màu khiến nó trở thành một bộ dữ liệu đầy thách thức và toàn diện hơn cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Cách sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-100 cho 100 kỷ nguyên với kích thước hình ảnh là 32x32, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Hình ảnh mẫu và chú thích

Bộ dữ liệu CIFAR-100 chứa hình ảnh màu của nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh . Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Hình ảnh mẫu của bộ dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu CIFAR-100, nhấn mạnh tầm quan trọng của tập dữ liệu đa dạng trong việc đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu CIFAR-100 trong công tác nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Chúng tôi muốn cảm ơn Alex Krizhevsky vì đã tạo ra và duy trì bộ dữ liệu CIFAR-100 như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính. Để biết thêm thông tin về bộ dữ liệu CIFAR-100 và người tạo ra nó, hãy truy cập trang web bộ dữ liệu CIFAR-100 .

CÂU HỎI THƯỜNG GẶP

Bộ dữ liệu CIFAR-100 là gì và tại sao nó lại quan trọng?

Bộ dữ liệu CIFAR-100 là một bộ sưu tập lớn gồm 60.000 hình ảnh màu 32x32 được phân loại thành 100 lớp. Được phát triển bởi Viện nghiên cứu tiên tiến Canada (CIFAR), bộ dữ liệu này cung cấp một bộ dữ liệu đầy thách thức, lý tưởng cho các tác vụ học máy phức tạp và thị giác máy tính. Tầm quan trọng của bộ dữ liệu này nằm ở sự đa dạng của các lớp và kích thước nhỏ của hình ảnh, khiến nó trở thành một nguồn tài nguyên có giá trị để đào tạo và thử nghiệm các mô hình học sâu, như Mạng nơ-ron tích chập (CNN), bằng cách sử dụng các khuôn khổ như Ultralytics YOLO .

Làm thế nào để tôi đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-100?

Bạn có thể đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-100 sử dụng Python hoặc CLI lệnh. Đây là cách thực hiện:

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Để biết danh sách đầy đủ các đối số có sẵn, vui lòng tham khảo trang Đào tạo mô hình.

Ứng dụng chính của bộ dữ liệu CIFAR-100 là gì?

Bộ dữ liệu CIFAR-100 được sử dụng rộng rãi trong đào tạo và đánh giá các mô hình học sâu để phân loại hình ảnh. Bộ dữ liệu đa dạng gồm 100 lớp, được nhóm thành 20 danh mục thô, cung cấp một môi trường đầy thách thức để thử nghiệm các thuật toán như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều phương pháp học máy khác. Bộ dữ liệu này là một nguồn tài nguyên quan trọng trong nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Bộ dữ liệu CIFAR-100 được cấu trúc như thế nào?

Bộ dữ liệu CIFAR-100 được chia thành hai tập hợp con chính:

  1. Bộ đào tạo : Bao gồm 50.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm : Bao gồm 10.000 hình ảnh được sử dụng để thử nghiệm và đánh giá chuẩn các mô hình đã được đào tạo.

Mỗi lớp trong số 100 lớp chứa 600 hình ảnh, với 500 hình ảnh dùng để đào tạo và 100 hình ảnh dùng để thử nghiệm, khiến nó trở nên phù hợp cho nghiên cứu học thuật và công nghiệp nghiêm ngặt.

Tôi có thể tìm thấy hình ảnh mẫu và chú thích từ bộ dữ liệu CIFAR-100 ở đâu?

Bộ dữ liệu CIFAR-100 bao gồm nhiều hình ảnh màu của nhiều đối tượng khác nhau, khiến nó trở thành một bộ dữ liệu có cấu trúc cho các tác vụ phân loại hình ảnh. Bạn có thể tham khảo trang tài liệu để xem các hình ảnh mẫu và chú thích . Các ví dụ này làm nổi bật tính đa dạng và phức tạp của bộ dữ liệu, rất quan trọng để đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

📅 Được tạo cách đây 1 năm ✏️ Đã cập nhật cách đây 25 ngày

Bình luận