Bỏ để qua phần nội dung

Tập dữ liệu Caltech-101

Bộ dữ liệu Caltech-101 là một bộ dữ liệu được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng, chứa khoảng 9.000 hình ảnh từ 101 loại đối tượng. Các danh mục được chọn để phản ánh nhiều đối tượng trong thế giới thực và bản thân các hình ảnh đã được lựa chọn và chú thích cẩn thận để cung cấp một điểm chuẩn đầy thách thức cho các thuật toán nhận dạng đối tượng.

Các tính năng chính

  • Bộ dữ liệu Caltech-101 bao gồm khoảng 9.000 hình ảnh màu được chia thành 101 loại.
  • Các danh mục bao gồm nhiều loại đối tượng, bao gồm động vật, xe cộ, đồ gia dụng và con người.
  • Số lượng hình ảnh trên mỗi danh mục khác nhau, với khoảng 40 đến 800 hình ảnh trong mỗi danh mục.
  • Hình ảnh có kích thước thay đổi, với hầu hết các hình ảnh có độ phân giải trung bình.
  • Caltech-101 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.

Cấu trúc tập dữ liệu

Không giống như nhiều bộ dữ liệu khác, bộ dữ liệu Caltech-101 không chính thức được chia thành các bộ đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ dựa trên nhu cầu cụ thể của họ. Tuy nhiên, một thực tế phổ biến là sử dụng một tập hợp con ngẫu nhiên của hình ảnh để đào tạo (ví dụ: 30 hình ảnh cho mỗi danh mục) và các hình ảnh còn lại để thử nghiệm.

Ứng dụng

Bộ dữ liệu Caltech-101 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Nhiều danh mục và hình ảnh chất lượng cao làm cho nó trở thành một bộ dữ liệu tuyệt vời cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-101 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Hình ảnh mẫu và chú thích

Bộ dữ liệu Caltech-101 chứa hình ảnh màu chất lượng cao của các đối tượng khác nhau, cung cấp bộ dữ liệu có cấu trúc tốt cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-101, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.

Trích dẫn và xác nhận

Nếu bạn sử dụng bộ dữ liệu Caltech-101 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Chúng tôi muốn ghi nhận Li Fei-Fei, Rob Fergus và Pietro Perona đã tạo và duy trì bộ dữ liệu Caltech-101 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu Caltech-101 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-101.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Ý kiến