Link to this sectionBộ dữ liệu Caltech-101#

Tập dữ liệu Caltech-101 là một benchmark image classification kinh điển gồm 9.144 hình ảnh trải dài trên 101 danh mục đối tượng cộng với một lớp nền. Mỗi danh mục chứa khoảng 40 đến 800 hình ảnh của các đối tượng thực tế — động vật, phương tiện, đồ gia dụng và con người — biến nó thành một benchmark nhỏ gọn nhưng đầy thách thức cho các model nhận diện đối tượng.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

Tự động phân chia dữ liệu

Caltech-101 được cung cấp mà không có cấu trúc train/validation split xác định trước. Các lệnh huấn luyện bên dưới sẽ tự động chia dữ liệu theo tỷ lệ 80% train / 20% validation, vì vậy bạn không cần phải chuẩn bị thủ công.

Link to this sectionTính năng chính#

Caltech-101 chứa 9.144 hình ảnh màu thuộc 101 danh mục đối tượng cộng với một lớp BACKGROUND_Google (tổng cộng 102 thư mục lớp).
Các danh mục bao gồm nhiều đối tượng thực tế đa dạng, bao gồm động vật, phương tiện, đồ gia dụng và con người.
Mỗi danh mục chứa khoảng 40 đến 800 hình ảnh, vì vậy kích thước giữa các lớp không đồng đều.
Hình ảnh có kích thước thay đổi, hầu hết ở mức khoảng 300x200 pixel (độ phân giải trung bình).
Caltech-101 được sử dụng rộng rãi để benchmark các thuật toán image classification và nhận diện đối tượng.

Link to this sectionCấu trúc tập dữ liệu#

Caltech-101 được phân phối dưới dạng 102 thư mục — mỗi thư mục một lớp, bao gồm 101 danh mục đối tượng cộng với một lớp BACKGROUND_Google — mà không có train/validation split xác định trước. Khi bạn khởi chạy huấn luyện, Ultralytics sẽ tự động phân vùng các hình ảnh để các model huấn luyện trên tất cả 102 lớp mà không cần bất kỳ thiết lập thủ công nào:

Các lớp: 102 (101 danh mục đối tượng + 1 nền)
Tổng số hình ảnh: 9.144
Train/validation split: tự động 80% / 20% (≈7.280 train, ≈1.864 validation)
Hình ảnh mỗi lớp: khoảng 40 đến 800 (không đồng đều)

Link to this sectionỨng dụng#

Caltech-101 được sử dụng rộng rãi để huấn luyện và đánh giá các model image classification và nhận diện đối tượng, bao gồm Convolutional Neural Networks (CNNs) và Support Vector Machines (SVMs). Độ phủ danh mục rộng và các hình ảnh sạch, được dán nhãn giúp nó trở thành một benchmark phổ biến cho nghiên cứu và tạo mẫu machine learning và computer vision.

Link to this sectionCách sử dụng#

Huấn luyện một model YOLO trên Caltech-101 trong 100 epochs với kích thước hình ảnh là 416. Để xem danh sách đầy đủ các tham số khả dụng, hãy xem trang Training và hướng dẫn về tác vụ image classification.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionHình ảnh mẫu và chú thích#

Bộ dữ liệu Caltech-101 chứa các hình ảnh màu chất lượng cao về nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Mẫu bộ dữ liệu phân loại hình ảnh Caltech-101

Các mẫu hình ảnh cho thấy sự đa dạng của các danh mục và cách lấy khung tự nhiên, tập trung điển hình của Caltech-101, khiến nó trở thành một điểm khởi đầu sạch để huấn luyện các model nhận diện đối tượng mạnh mẽ.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng bộ dữ liệu Caltech-101 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Chúng tôi xin gửi lời cảm ơn tới Li Fei-Fei, Rob Fergus và Pietro Perona vì đã tạo ra và duy trì bộ dữ liệu Caltech-101 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu machine learning và computer vision. Để biết thêm thông tin về bộ dữ liệu Caltech-101 và những người tạo ra nó, hãy truy cập trang web bộ dữ liệu Caltech-101.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionBộ dữ liệu Caltech-101 được sử dụng để làm gì trong machine learning?#

Tập dữ liệu Caltech-101 được sử dụng rộng rãi để huấn luyện và benchmark các model image classification và nhận diện đối tượng. Nó chứa 9.144 hình ảnh thuộc 101 danh mục đối tượng cộng với một lớp nền, cung cấp một benchmark đầy thách thức để đánh giá các thuật toán như Convolutional Neural Networks (CNNs) và Support Vector Machines (SVMs).

Link to this sectionLàm thế nào tôi có thể huấn luyện một mô hình Ultralytics YOLO trên bộ dữ liệu Caltech-101?#

Để huấn luyện một model Ultralytics YOLO trên Caltech-101, hãy sử dụng các đoạn code bên dưới. Tập dữ liệu sẽ tự động tải xuống trong lần sử dụng đầu tiên. Để xem danh sách đầy đủ các tham số, hãy xem trang Training của model.

Ví dụ về Training

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionTập dữ liệu Caltech-101 có bao nhiêu lớp?#

Caltech-101 chứa 101 danh mục đối tượng cộng với một lớp BACKGROUND_Google, với tổng cộng 102 thư mục lớp và 9.144 hình ảnh. Khi bạn huấn luyện với Ultralytics, model sẽ học tất cả 102 lớp. Kích thước danh mục không đồng đều, dao động từ khoảng 40 đến 800 hình ảnh mỗi lớp.

Link to this sectionTập dữ liệu Caltech-101 được chia thành các tập huấn luyện và xác thực như thế nào?#

Caltech-101 không có phân chia định sẵn. Lần đầu tiên bạn huấn luyện, Ultralytics sẽ tự động chia nó thành 80% huấn luyện / 20% xác thực — khoảng 7.280 hình ảnh huấn luyện và 1.864 hình ảnh xác thực — vì vậy bạn không cần phải tạo các phân chia thủ công. Để tự kiểm soát việc phân chia, hãy sắp xếp các hình ảnh vào các thư mục train/ và val/ trước khi huấn luyện.

Link to this sectionTôi có thể sử dụng Ultralytics Platform để huấn luyện các mô hình trên bộ dữ liệu Caltech-101 không?#

Có. Ultralytics Platform cho phép bạn quản lý các tập dữ liệu, huấn luyện các model image classification và triển khai chúng mà không cần viết nhiều code. Đây là một cách thuận tiện để chạy các thử nghiệm Caltech-101 trên đám mây, và bạn có thể khám phá thêm các tùy chọn trong tổng quan về tập dữ liệu classification của chúng tôi.

Người đóng góp

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

Đã tạo 12 thg 11, 2023Đã cập nhật Hôm kia