Bộ dữ liệu Caltech-256
Bộ dữ liệu Caltech-256 là một bộ sưu tập hình ảnh phong phú được sử dụng cho các tác vụ phân loại đối tượng. Nó chứa khoảng 30.000 hình ảnh được chia thành 257 loại (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được sắp xếp và chú thích cẩn thận để cung cấp một điểm chuẩn đầy thách thức và đa dạng cho các thuật toán nhận dạng đối tượng.
Các tính năng chính
- Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 loại.
- Mỗi danh mục chứa tối thiểu 80 hình ảnh.
- Các danh mục bao gồm nhiều đối tượng trong thế giới thực, bao gồm động vật, xe cộ, đồ gia dụng và con người.
- Hình ảnh có kích thước và độ phân giải khác nhau.
- Caltech-256 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.
Cấu trúc tập dữ liệu
Giống như Caltech-101, bộ dữ liệu Caltech-256 không có sự phân chia chính thức giữa các bộ đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ theo nhu cầu cụ thể của họ. Một thực tế phổ biến là sử dụng một tập hợp con ngẫu nhiên của hình ảnh để đào tạo và các hình ảnh còn lại để thử nghiệm.
Ứng dụng
Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Bộ danh mục đa dạng và hình ảnh chất lượng cao của nó làm cho nó trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.
Sử dụng
Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Bộ dữ liệu Caltech-256 chứa hình ảnh màu chất lượng cao của các đối tượng khác nhau, cung cấp bộ dữ liệu toàn diện cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu (tín dụng):
Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.
Trích dẫn và xác nhận
Nếu bạn sử dụng bộ dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
Chúng tôi muốn ghi nhận Gregory Griffin, Alex Holub và Pietro Perona đã tạo và duy trì bộ dữ liệu Caltech-256 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về
Tập dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-256.