Link to this sectionTập dữ liệu Caltech-256#

Tập dữ liệu Caltech-256 là một chuẩn mực phân loại hình ảnh cổ điển gồm 30.607 hình ảnh trải dài trên 256 danh mục đối tượng cùng một lớp nền. Mỗi danh mục chứa ít nhất 80 hình ảnh về các đối tượng trong thế giới thực — động vật, phương tiện, vật dụng gia đình và con người — khiến nó trở thành phiên bản lớn hơn và thách thức hơn của Caltech-101 đối với các model nhận diện đối tượng.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

Tự động phân chia dữ liệu

Caltech-256 được phân phối mà không có sẵn cấu trúc tách train/validation. Các lệnh huấn luyện bên dưới sẽ tự động tách tập dữ liệu theo tỷ lệ 80% train / 20% validation, vì vậy bạn không cần chuẩn bị thủ công.

Link to this sectionTính năng chính#

Caltech-256 chứa 30.607 hình ảnh màu thuộc 256 danh mục đối tượng cùng một lớp nền 257.clutter (tổng cộng 257 thư mục lớp).
Các danh mục bao gồm nhiều đối tượng thực tế đa dạng, bao gồm động vật, phương tiện, đồ gia dụng và con người.
Mỗi danh mục chứa ít nhất 80 hình ảnh, với danh mục lớn nhất chứa khoảng 800 hình ảnh, vì vậy kích thước các lớp bị mất cân bằng.
Hình ảnh có kích thước và độ phân giải không đồng nhất.
Caltech-256 được sử dụng rộng rãi để đánh giá các thuật toán phân loại hình ảnh và nhận diện đối tượng.

Link to this sectionCấu trúc tập dữ liệu#

Caltech-256 được phân phối dưới dạng 257 thư mục — mỗi thư mục cho một lớp, bao gồm 256 danh mục đối tượng cùng một lớp nền 257.clutter — mà không có cấu trúc tách train/validation định sẵn. Khi bạn khởi chạy huấn luyện, Ultralytics sẽ tự động phân chia các hình ảnh để các model huấn luyện trên tất cả 257 lớp mà không cần thiết lập thủ công:

Các lớp: 257 (256 danh mục đối tượng + 1 lớp nền)
Tổng số hình ảnh: 30.607
Tỷ lệ train/validation: tự động 80% / 20% (≈24.385 train, ≈6.222 validation)
Số lượng hình ảnh mỗi lớp: ít nhất 80 (không cân bằng, lên đến khoảng 800)

Link to this sectionỨng dụng#

Tập dữ liệu Caltech-256 được sử dụng rộng rãi để huấn luyện và đánh giá các model phân loại hình ảnh và nhận diện đối tượng, bao gồm Convolutional Neural Networks (CNNs) và Support Vector Machines (SVMs). Số lượng danh mục lớn và hình ảnh chất lượng cao khiến nó trở thành một chuẩn mực phổ biến cho nghiên cứu và tạo mẫu machine learning và computer vision.

Link to this sectionCách sử dụng#

Huấn luyện một model YOLO trên Caltech-256 trong 100 epochs với kích thước ảnh là 416. Để xem danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training và hướng dẫn về tác vụ phân loại hình ảnh.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionHình ảnh mẫu và chú thích#

Tập dữ liệu Caltech-256 chứa các hình ảnh màu chất lượng cao về nhiều đối tượng khác nhau, cung cấp một tập dữ liệu được cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu (nguồn):

Mẫu tập dữ liệu phân loại hình ảnh Caltech-256

Các mẫu này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-256, làm nổi bật giá trị của một tập dữ liệu đa dạng để huấn luyện các model nhận diện đối tượng mạnh mẽ.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng tập dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Chúng tôi muốn gửi lời cảm ơn đến Gregory Griffin, Alex Holub và Pietro Perona vì đã tạo ra và duy trì tập dữ liệu Caltech-256 như một tài nguyên quý giá cho cộng đồng nghiên cứu machine learning và computer vision. Để biết thêm thông tin về tập dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-256.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionTập dữ liệu Caltech-256 được sử dụng để làm gì trong machine learning?#

Tập dữ liệu Caltech-256 được sử dụng rộng rãi để huấn luyện và đánh giá các model phân loại hình ảnh và nhận diện đối tượng. Nó chứa 30.607 hình ảnh trên 256 danh mục đối tượng cộng với một lớp nền, cung cấp một chuẩn mực lớn hơn và thách thức hơn Caltech-101 cho các thuật toán như Convolutional Neural Networks (CNNs) và Support Vector Machines (SVMs).

Link to this sectionLàm thế nào để tôi có thể huấn luyện một model Ultralytics YOLO trên tập dữ liệu Caltech-256?#

Để huấn luyện một model Ultralytics YOLO trên Caltech-256, hãy sử dụng các đoạn mã dưới đây. Tập dữ liệu sẽ tự động tải xuống trong lần sử dụng đầu tiên. Để có danh sách đầy đủ các đối số, hãy xem trang Training của model.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionTập dữ liệu Caltech-256 có bao nhiêu lớp?#

Caltech-256 chứa 256 danh mục đối tượng cộng với một lớp nền 257.clutter, tổng cộng là 257 thư mục lớp và 30.607 hình ảnh. Khi bạn huấn luyện với Ultralytics, model sẽ học tất cả 257 lớp. Mỗi danh mục chứa ít nhất 80 hình ảnh, nhưng kích thước các lớp bị mất cân bằng, với danh mục lớn nhất chứa tới khoảng 800 hình ảnh.

Link to this sectionTập dữ liệu Caltech-256 được chia thành các tập huấn luyện và kiểm định như thế nào?#

Caltech-256 không có sẵn phân chia định sẵn. Lần đầu tiên bạn huấn luyện, Ultralytics sẽ tự động chia nó thành 80% huấn luyện / 20% kiểm định — khoảng 24.385 hình ảnh huấn luyện và 6.222 hình ảnh kiểm định — vì vậy bạn không cần phải tạo các phân chia theo cách thủ công. Để tự kiểm soát việc phân chia, hãy tổ chức các hình ảnh vào các thư mục train/ và val/ trước khi huấn luyện.

Link to this sectionTôi có thể sử dụng Ultralytics Platform để huấn luyện các model trên tập dữ liệu Caltech-256 không?#

Có. Ultralytics Platform cho phép bạn quản lý tập dữ liệu, huấn luyện các model phân loại hình ảnh và triển khai chúng mà không cần viết nhiều code. Đây là một cách thuận tiện để thực hiện các thử nghiệm với Caltech-256 trên nền tảng đám mây, và bạn có thể khám phá thêm các tùy chọn trong tổng quan về tập dữ liệu phân loại của chúng tôi.

Người đóng góp

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Đã tạo 12 thg 11, 2023Đã cập nhật Hôm qua