Bỏ để qua phần nội dung

Bộ dữ liệu Caltech-256

Bộ dữ liệu Caltech-256 là một bộ sưu tập hình ảnh phong phú được sử dụng cho các tác vụ phân loại đối tượng. Nó chứa khoảng 30.000 hình ảnh được chia thành 257 loại (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được sắp xếp và chú thích cẩn thận để cung cấp một điểm chuẩn đầy thách thức và đa dạng cho các thuật toán nhận dạng đối tượng.

Các tính năng chính

  • Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 loại.
  • Mỗi danh mục chứa tối thiểu 80 hình ảnh.
  • Các danh mục bao gồm nhiều đối tượng trong thế giới thực, bao gồm động vật, xe cộ, đồ gia dụng và con người.
  • Hình ảnh có kích thước và độ phân giải khác nhau.
  • Caltech-256 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.

Cấu trúc tập dữ liệu

Giống như Caltech-101, bộ dữ liệu Caltech-256 không có sự phân chia chính thức giữa các bộ đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ theo nhu cầu cụ thể của họ. Một thực tế phổ biến là sử dụng một tập hợp con ngẫu nhiên của hình ảnh để đào tạo và các hình ảnh còn lại để thử nghiệm.

Ứng dụng

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Bộ danh mục đa dạng và hình ảnh chất lượng cao của nó làm cho nó trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Hình ảnh mẫu và chú thích

Bộ dữ liệu Caltech-256 chứa hình ảnh màu chất lượng cao của các đối tượng khác nhau, cung cấp bộ dữ liệu toàn diện cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu (tín dụng):

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.

Trích dẫn và xác nhận

Nếu bạn sử dụng bộ dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Chúng tôi muốn ghi nhận Gregory Griffin, Alex Holub và Pietro Perona đã tạo và duy trì bộ dữ liệu Caltech-256 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về

Tập dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-256.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Ý kiến