No license

Link to this sectionTập dữ liệu CIFAR-100#

Tập dữ liệu CIFAR-100 (Canadian Institute For Advanced Research) là một benchmark phân loại hình ảnh gồm 60.000 hình ảnh màu 32x32 được phân bổ đều trên 100 lớp chi tiết (mỗi lớp 600 hình ảnh), sau đó được nhóm thành 20 siêu lớp (superclasses). Được tạo bởi Alex Krizhevsky, tập dữ liệu này đi kèm với một cấu trúc phân tách mặc định gồm 50.000 ảnh huấn luyện và 10.000 ảnh kiểm thử, khiến nó trở thành phiên bản khó hơn và chi tiết hơn của tập dữ liệu CIFAR-10.

Watch: How to Train an Image Classification Model on CIFAR-100 using Ultralytics YOLO

Link to this sectionTính năng chính#

CIFAR-100 chứa 60.000 hình ảnh màu kích thước 32x32 pixel, được chia đều thành 100 lớp.
Mỗi lớp chứa chính xác 600 hình ảnh — 500 ảnh cho huấn luyện và 100 ảnh cho kiểm thử — vì vậy tập dữ liệu này hoàn toàn cân bằng.
100 lớp chi tiết được nhóm thành 20 siêu lớp để phân loại ở cấp độ cao hơn.
Tập dữ liệu đi kèm với phân chia train/test định sẵn, vì vậy không cần thực hiện việc chia dữ liệu thủ công hay tự động.
CIFAR-100 là một benchmark tiêu chuẩn cho các nghiên cứu về phân loại hình ảnh chi tiết và nhận diện đối tượng.

Link to this sectionCấu trúc tập dữ liệu#

CIFAR-100 đi kèm với cấu trúc phân tách chính thức được xác định trước, vì vậy không cần phân chia tự động hay thủ công:

Lớp: 100 lớp chi tiết, được nhóm thành 20 siêu lớp
Tổng số hình ảnh: 60.000 (màu, kích thước 32x32)
Tập huấn luyện: 50.000 hình ảnh (500 ảnh mỗi lớp)
Tập kiểm thử: 10.000 hình ảnh (100 ảnh mỗi lớp)

Tập xác thực

CIFAR-100 không có thư mục validation riêng, vì vậy Ultralytics sử dụng tập kiểm thử gồm 10.000 hình ảnh làm tập phân tách validation trong quá trình huấn luyện theo mặc định. Việc huấn luyện với data="cifar100" sẽ học 100 lớp chi tiết.

Link to this sectionỨng dụng#

CIFAR-100 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình phân loại hình ảnh, từ các Mạng thần kinh tích chập (CNN) cổ điển và Máy hỗ trợ vector (SVM) đến các kiến trúc deep learning hiện đại. 100 lớp chi tiết và kích thước ảnh nhỏ khiến nó trở thành một benchmark đòi hỏi khắt khe cho nghiên cứu machine learning, so sánh thuật toán và thực nghiệm thị giác máy tính.

Link to this sectionCách sử dụng#

Huấn luyện một mô hình YOLO trên CIFAR-100 trong 100 epochs với kích thước ảnh là 32. Để xem danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Huấn luyện và hướng dẫn về tác vụ phân loại hình ảnh.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionHình ảnh mẫu và chú thích#

Các hình ảnh mẫu từ tập dữ liệu CIFAR-100:

Mẫu tập dữ liệu phân loại hình ảnh CIFAR-100

Các mẫu này cho thấy sự đa dạng của các đối tượng trong tập dữ liệu CIFAR-100, nhấn mạnh giá trị của một tập dữ liệu đa dạng đối với việc huấn luyện các mô hình phân loại hình ảnh mạnh mẽ.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu CIFAR-100 trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Chúng tôi xin ghi nhận đóng góp của Alex Krizhevsky trong việc tạo và duy trì tập dữ liệu CIFAR-100 như một nguồn tài nguyên giá trị cho cộng đồng nghiên cứu machine learning và thị giác máy tính. Để biết thêm thông tin về tập dữ liệu CIFAR-100 và tác giả, hãy truy cập trang web tập dữ liệu CIFAR-100.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu CIFAR-100 được sử dụng để làm gì trong machine learning?#

Tập dữ liệu CIFAR-100 được sử dụng rộng rãi để huấn luyện và benchmark các mô hình phân loại hình ảnh chi tiết và nhận diện đối tượng. Nó chứa 60.000 hình ảnh màu 32x32 trên 100 lớp được nhóm thành 20 siêu lớp, khiến nó trở thành một benchmark thách thức hơn CIFAR-10 đối với các thuật toán như Mạng thần kinh Tích chập (CNN) và Máy hỗ trợ vector (SVM), cũng như để đánh giá các mô hình deep learning được xây dựng với Ultralytics YOLO.

Link to this sectionLàm thế nào để huấn luyện mô hình Ultralytics YOLO trên tập dữ liệu CIFAR-100?#

Để huấn luyện mô hình Ultralytics YOLO trên CIFAR-100, hãy sử dụng các đoạn mã dưới đây. Tập dữ liệu sẽ tự động tải xuống trong lần đầu sử dụng. Để có danh sách đầy đủ các đối số, hãy xem trang Huấn luyện mô hình.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionTập dữ liệu CIFAR-100 có bao nhiêu lớp?#

CIFAR-100 có 100 lớp chi tiết — ví dụ như táo, cá heo, cây phong, xe máy và tên lửa — với chính xác 600 hình ảnh mỗi lớp, tổng cộng là 60.000 hình ảnh. 100 lớp này được nhóm thêm thành 20 siêu lớp (ví dụ, siêu lớp cây bao gồm phong, sồi, cọ, thông và liễu). Huấn luyện với data="cifar100" sử dụng 100 lớp chi tiết.

Link to this sectionTập dữ liệu CIFAR-100 được phân chia thành tập huấn luyện và tập kiểm thử như thế nào?#

CIFAR-100 đi kèm với cấu trúc phân tách được xác định trước gồm 50.000 ảnh huấn luyện và 10.000 ảnh kiểm thử, với chính xác 500 ảnh huấn luyện và 100 ảnh kiểm thử mỗi lớp. Không giống như các tập dữ liệu phân loại dựa trên thư mục mà Ultralytics tự động phân tách, cấu trúc phân tách chính thức của CIFAR-100 được sử dụng nguyên trạng, và tập kiểm thử đóng vai trò là tập validation trong quá trình huấn luyện theo mặc định.

Link to this sectionTôi có thể sử dụng Ultralytics Platform để huấn luyện các mô hình trên tập dữ liệu CIFAR-100 không?#

Có. Ultralytics Platform cho phép bạn quản lý tập dữ liệu, huấn luyện các mô hình phân loại hình ảnh và triển khai chúng mà không cần lập trình phức tạp. Đây là một cách thuận tiện để chạy các thử nghiệm CIFAR-100 trên đám mây, và bạn có thể khám phá thêm các tùy chọn trong tổng quan về tập dữ liệu phân loại của chúng tôi.

Người đóng góp

GLglenn-jocher¹⁵ RAraimbekovm² RIRizwanMunawar² MAMatthewNoyce¹ JKjk4e¹

Đã tạo 12 thg 11, 2023Đã cập nhật 3 ngày trước