Bộ dữ liệu Caltech-256

Bộ dữ liệu Caltech-256 là một tập hợp hình ảnh phong phú được sử dụng cho các tác vụ phân loại đối tượng. Nó bao gồm khoảng 30.000 hình ảnh được chia thành 257 danh mục (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được chọn lọc và gắn nhãn kỹ lưỡng nhằm cung cấp một tiêu chuẩn đánh giá đầy thách thức và đa dạng cho các thuật toán nhận dạng đối tượng.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
Tự động phân tách dữ liệu

Bộ dữ liệu Caltech-256 như được cung cấp không đi kèm với các tập chia train/validation định sẵn. Tuy nhiên, khi bạn sử dụng các lệnh huấn luyện trong các ví dụ sử dụng dưới đây, framework Ultralytics sẽ tự động chia bộ dữ liệu cho bạn. Tỷ lệ chia mặc định là 80% cho tập huấn luyện và 20% cho tập kiểm thử.

Các tính năng chính

  • Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 danh mục.
  • Mỗi danh mục chứa tối thiểu 80 hình ảnh.
  • Các danh mục bao gồm nhiều loại đối tượng thực tế, bao gồm động vật, phương tiện, đồ gia dụng và con người.
  • Hình ảnh có kích thước và độ phân giải đa dạng.
  • Caltech-256 được sử dụng rộng rãi để huấn luyện và kiểm thử trong lĩnh vực học máy, đặc biệt là cho các tác vụ nhận dạng đối tượng.

Cấu trúc tập dữ liệu

Giống như Caltech-101, bộ dữ liệu Caltech-256 không có sự phân chia chính thức giữa tập huấn luyện và tập kiểm thử. Người dùng thường tự tạo các tập chia theo nhu cầu cụ thể của mình. Một cách thực hành phổ biến là sử dụng một tập con ngẫu nhiên các hình ảnh để huấn luyện và các hình ảnh còn lại để kiểm thử.

Ứng dụng

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình deep learning trong các tác vụ nhận dạng đối tượng, chẳng hạn như Convolutional Neural Networks (CNN), Support Vector Machines (SVM) và nhiều thuật toán học máy khác. Tập hợp các danh mục đa dạng và hình ảnh chất lượng cao của nó khiến đây trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và computer vision.

Cách sử dụng

Để huấn luyện một mô hình YOLO trên bộ dữ liệu Caltech-256 trong 100 epochs, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training của mô hình.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Hình ảnh và chú thích mẫu

Bộ dữ liệu Caltech-256 chứa các hình ảnh màu chất lượng cao về nhiều loại đối tượng, cung cấp một bộ dữ liệu toàn diện cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu (credit):

Caltech-256 image classification dataset samples

Ví dụ này thể hiện sự đa dạng và phức tạp của các đối tượng trong bộ dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một bộ dữ liệu đa dạng để huấn luyện các mô hình nhận dạng đối tượng mạnh mẽ.

Trích dẫn và Ghi nhận

Nếu bạn sử dụng bộ dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Chúng tôi xin ghi nhận đóng góp của Gregory Griffin, Alex Holub và Pietro Perona vì đã tạo ra và duy trì bộ dữ liệu Caltech-256 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu machine learning và computer vision. Để biết thêm thông tin về bộ dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập website bộ dữ liệu Caltech-256.

Câu hỏi thường gặp (FAQ)

Bộ dữ liệu Caltech-256 là gì và tại sao nó lại quan trọng đối với học máy?

Bộ dữ liệu Caltech-256 là một bộ dữ liệu hình ảnh lớn được sử dụng chủ yếu cho các tác vụ phân loại đối tượng trong học máy và computer vision. Nó bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 danh mục, bao phủ một loạt các đối tượng thực tế. Hình ảnh đa dạng và chất lượng cao của bộ dữ liệu khiến nó trở thành một tiêu chuẩn tuyệt vời để đánh giá các thuật toán nhận dạng đối tượng, điều này rất quan trọng để phát triển các mô hình học máy mạnh mẽ.

Làm thế nào để tôi huấn luyện mô hình YOLO trên bộ dữ liệu Caltech-256 bằng Python hoặc CLI?

Để huấn luyện mô hình YOLO trên bộ dữ liệu Caltech-256 trong 100 epochs, bạn có thể sử dụng các đoạn mã sau. Tham khảo trang Training của mô hình để biết thêm các tùy chọn bổ sung.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Các trường hợp sử dụng phổ biến nhất cho bộ dữ liệu Caltech-256 là gì?

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi cho nhiều tác vụ nhận dạng đối tượng như:

  • Huấn luyện Convolutional Neural Networks (CNNs)
  • Đánh giá hiệu suất của Support Vector Machines (SVMs)
  • Đánh giá các thuật toán deep learning mới
  • Phát triển các mô hình object detection sử dụng các framework như Ultralytics YOLO

Tính đa dạng và các chú thích toàn diện của nó làm cho nó trở nên lý tưởng cho nghiên cứu và phát triển trong lĩnh vực học máy và computer vision.

Bộ dữ liệu Caltech-256 được cấu trúc và phân chia như thế nào để huấn luyện và kiểm thử?

Bộ dữ liệu Caltech-256 không đi kèm với tập chia định sẵn cho việc huấn luyện và kiểm thử. Người dùng thường tạo các tập chia riêng theo nhu cầu cụ thể. Một cách tiếp cận phổ biến là chọn ngẫu nhiên một tập con hình ảnh để huấn luyện và sử dụng các hình ảnh còn lại để kiểm thử. Sự linh hoạt này cho phép người dùng tùy chỉnh bộ dữ liệu theo yêu cầu dự án và thiết lập thử nghiệm cụ thể của họ.

Tại sao tôi nên sử dụng Ultralytics YOLO để huấn luyện các mô hình trên bộ dữ liệu Caltech-256?

Các mô hình Ultralytics YOLO mang lại một số lợi thế khi huấn luyện trên bộ dữ liệu Caltech-256:

  • Độ chính xác cao: Các mô hình YOLO được biết đến với hiệu suất hiện đại trong các tác vụ nhận dạng đối tượng.
  • Tốc độ: Chúng cung cấp khả năng suy luận thời gian thực, giúp chúng phù hợp với các ứng dụng yêu cầu dự đoán nhanh.
  • Dễ sử dụng: Với Ultralytics Platform, người dùng có thể huấn luyện, xác thực và triển khai mô hình mà không cần viết quá nhiều mã.
  • Mô hình tiền huấn luyện: Bắt đầu từ các mô hình tiền huấn luyện, như yolo26n-cls.pt, có thể giảm đáng kể thời gian huấn luyện và cải thiện độ chính xác của mô hình.

Để biết thêm chi tiết, hãy khám phá hướng dẫn huấn luyện toàn diện của chúng tôi và tìm hiểu về phân loại hình ảnh với Ultralytics YOLO.

Bình luận