Bỏ qua nội dung

Bộ dữ liệu CIFAR-10

Bộ dữ liệu CIFAR-10 (Viện nghiên cứu nâng cao Canada) là tập hợp các hình ảnh được sử dụng rộng rãi cho các thuật toán học máy và thị giác máy tính. Nó được phát triển bởi các nhà nghiên cứu tại viện CIFAR và bao gồm 60.000 hình ảnh màu 32x32 trong 10 lớp khác nhau.



Đồng hồ: Làm thế nào để đào tạo một Phân loại hình ảnh Mô hình với Bộ dữ liệu CIFAR-10 sử dụng Ultralytics YOLO11

Các tính năng chính

  • Bộ dữ liệu CIFAR-10 bao gồm 60.000 hình ảnh, được chia thành 10 lớp.
  • Mỗi lớp chứa 6.000 hình ảnh, chia thành 5.000 hình ảnh để đào tạo và 1.000 hình ảnh để thử nghiệm.
  • Hình ảnh được tô màu và có kích thước 32x32 pixel.
  • 10 lớp khác nhau đại diện cho máy bay, ô tô, chim, mèo, hươu, chó, ếch, ngựa, tàu thủy và xe tải.
  • CIFAR-10 thường được sử dụng để đào tạo và thử nghiệm trong lĩnh vực học máy và thị giác máy tính.

Cấu trúc tập dữ liệu

Bộ dữ liệu CIFAR-10 được chia thành hai tập hợp con:

  1. Bộ đào tạo : Tập hợp con này chứa 50.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm : Tập hợp con này bao gồm 10.000 hình ảnh được sử dụng để thử nghiệm và đánh giá chuẩn các mô hình đã được đào tạo.

Ứng dụng

Bộ dữ liệu CIFAR-10 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNN), Support Vector Machines (SVM) và nhiều thuật toán học máy khác. Sự đa dạng của bộ dữ liệu về mặt lớp và sự hiện diện của hình ảnh màu làm cho nó trở thành một bộ dữ liệu toàn diện cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Cách sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-10 cho 100 kỷ nguyên với kích thước hình ảnh là 32x32, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Hình ảnh mẫu và chú thích

Bộ dữ liệu CIFAR-10 chứa hình ảnh màu của nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Hình ảnh mẫu của bộ dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu CIFAR-10, nhấn mạnh tầm quan trọng của tập dữ liệu đa dạng trong việc đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu CIFAR-10 trong công tác nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Chúng tôi muốn cảm ơn Alex Krizhevsky vì đã tạo ra và duy trì bộ dữ liệu CIFAR-10 như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính . Để biết thêm thông tin về bộ dữ liệu CIFAR-10 và người tạo ra nó, hãy truy cập trang web bộ dữ liệu CIFAR-10 .

CÂU HỎI THƯỜNG GẶP

Làm thế nào tôi có thể đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-10?

Để đào tạo một YOLO mô hình trên tập dữ liệu CIFAR-10 sử dụng Ultralytics , bạn có thể làm theo các ví dụ được cung cấp cho cả hai Python Và CLI . Sau đây là một ví dụ cơ bản để đào tạo mô hình của bạn trong 100 kỷ nguyên với kích thước hình ảnh là 32x32 pixel:

Ví dụ

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Để biết thêm chi tiết, hãy tham khảo trang Đào tạo mô hình.

Những tính năng chính của bộ dữ liệu CIFAR-10 là gì?

Bộ dữ liệu CIFAR-10 bao gồm 60.000 hình ảnh màu được chia thành 10 lớp. Mỗi lớp chứa 6.000 hình ảnh, với 5.000 hình ảnh để đào tạo và 1.000 hình ảnh để thử nghiệm. Các hình ảnh có kích thước 32x32 pixel và thay đổi theo các danh mục sau:

  • Máy bay
  • Xe ô tô
  • Chim
  • Mèo
  • Con nai
  • Chó
  • Ếch
  • Ngựa
  • Tàu thuyền
  • Xe tải

Bộ dữ liệu đa dạng này rất cần thiết để đào tạo các mô hình phân loại hình ảnh trong các lĩnh vực như học máy và thị giác máy tính. Để biết thêm thông tin, hãy truy cập các phần CIFAR-10 về cấu trúc và ứng dụng của bộ dữ liệu .

Tại sao nên sử dụng bộ dữ liệu CIFAR-10 cho nhiệm vụ phân loại hình ảnh?

Bộ dữ liệu CIFAR-10 là chuẩn mực tuyệt vời cho phân loại hình ảnh do tính đa dạng và cấu trúc của nó. Nó chứa hỗn hợp cân bằng gồm 60.000 hình ảnh được gắn nhãn trên 10 danh mục khác nhau, giúp đào tạo các mô hình mạnh mẽ và tổng quát. Nó được sử dụng rộng rãi để đánh giá các mô hình học sâu, bao gồm Mạng nơ-ron tích chập (CNN) và các thuật toán học máy khác. Bộ dữ liệu tương đối nhỏ, phù hợp để thử nghiệm nhanh và phát triển thuật toán. Khám phá nhiều ứng dụng của nó trong phần ứng dụng .

Bộ dữ liệu CIFAR-10 được cấu trúc như thế nào?

Bộ dữ liệu CIFAR-10 được cấu trúc thành hai tập hợp con chính:

  1. Bộ đào tạo : Bao gồm 50.000 hình ảnh được sử dụng để đào tạo các mô hình học máy.
  2. Bộ thử nghiệm : Bao gồm 10.000 hình ảnh để thử nghiệm và đánh giá chuẩn các mô hình đã được đào tạo.

Mỗi tập hợp con bao gồm các hình ảnh được phân loại thành 10 lớp, với chú thích của chúng có sẵn để đào tạo và đánh giá mô hình. Để biết thông tin chi tiết hơn, hãy tham khảo phần cấu trúc tập dữ liệu .

Làm thế nào tôi có thể trích dẫn bộ dữ liệu CIFAR-10 trong nghiên cứu của mình?

Nếu bạn sử dụng bộ dữ liệu CIFAR-10 trong các dự án nghiên cứu hoặc phát triển của mình, hãy đảm bảo trích dẫn bài báo sau:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Việc ghi nhận những người tạo ra tập dữ liệu giúp hỗ trợ cho việc tiếp tục nghiên cứu và phát triển trong lĩnh vực này. Để biết thêm chi tiết, hãy xem phần trích dẫn và ghi nhận .

Một số ví dụ thực tế về việc sử dụng bộ dữ liệu CIFAR-10 là gì?

Bộ dữ liệu CIFAR-10 thường được sử dụng để đào tạo các mô hình phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNN) và Support Vector Machines (SVM). Các mô hình này có thể được sử dụng trong nhiều tác vụ thị giác máy tính khác nhau bao gồm phát hiện đối tượng , nhận dạng hình ảnh và gắn thẻ tự động. Để xem một số ví dụ thực tế, hãy kiểm tra các đoạn mã trong phần sử dụng .

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 2 tháng

Bình luận