Tập dữ liệu Caltech-101
Bộ dữ liệu Caltech-101 là một bộ dữ liệu được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng, chứa khoảng 9.000 hình ảnh từ 101 loại đối tượng. Các danh mục được chọn để phản ánh nhiều đối tượng trong thế giới thực và bản thân các hình ảnh đã được lựa chọn và chú thích cẩn thận để cung cấp một điểm chuẩn đầy thách thức cho các thuật toán nhận dạng đối tượng.
Các tính năng chính
- Bộ dữ liệu Caltech-101 bao gồm khoảng 9.000 hình ảnh màu được chia thành 101 loại.
- Các danh mục bao gồm nhiều loại đối tượng, bao gồm động vật, xe cộ, đồ gia dụng và con người.
- Số lượng hình ảnh trên mỗi danh mục khác nhau, với khoảng 40 đến 800 hình ảnh trong mỗi danh mục.
- Hình ảnh có kích thước thay đổi, với hầu hết các hình ảnh có độ phân giải trung bình.
- Caltech-101 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.
Cấu trúc tập dữ liệu
Không giống như nhiều bộ dữ liệu khác, bộ dữ liệu Caltech-101 không chính thức được chia thành các bộ đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ dựa trên nhu cầu cụ thể của họ. Tuy nhiên, một thực tế phổ biến là sử dụng một tập hợp con ngẫu nhiên của hình ảnh để đào tạo (ví dụ: 30 hình ảnh cho mỗi danh mục) và các hình ảnh còn lại để thử nghiệm.
Ứng dụng
Bộ dữ liệu Caltech-101 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Sự đa dạng về danh mục và hình ảnh chất lượng cao của nó khiến nó trở thành một bộ dữ liệu tuyệt vời cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính .
Sử dụng
Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-101 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Bộ dữ liệu Caltech-101 chứa hình ảnh màu chất lượng cao của các đối tượng khác nhau, cung cấp bộ dữ liệu có cấu trúc tốt cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:
Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-101, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.
Trích dẫn và xác nhận
Nếu bạn sử dụng bộ dữ liệu Caltech-101 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
Chúng tôi muốn ghi nhận Li Fei-Fei, Rob Fergus và Pietro Perona đã tạo và duy trì bộ dữ liệu Caltech-101 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu Caltech-101 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-101.
FAQ
Bộ dữ liệu Caltech-101 được sử dụng để làm gì trong học máy?
Bộ dữ liệu Caltech-101 được sử dụng rộng rãi trong học máy cho các tác vụ nhận dạng đối tượng. Nó chứa khoảng 9.000 hình ảnh trên 101 danh mục, cung cấp một chuẩn mực đầy thách thức để đánh giá các thuật toán nhận dạng đối tượng. Các nhà nghiên cứu tận dụng nó để đào tạo và thử nghiệm các mô hình, đặc biệt là Mạng nơ-ron tích chập (CNN) và Máy vectơ hỗ trợ (SVM), trong thị giác máy tính.
Làm thế nào tôi có thể đào tạo một Ultralytics YOLO mô hình trên tập dữ liệu Caltech-101?
Để đào tạo một Ultralytics YOLO mô hình trên tập dữ liệu Caltech-101, bạn có thể sử dụng các đoạn mã được cung cấp. Ví dụ, để đào tạo cho 100 kỷ nguyên :
Ví dụ về tàu hỏa
Để biết thêm các đối số và tùy chọn chi tiết, hãy tham khảo trang Đào tạo mẫu.
Các tính năng chính của tập dữ liệu Caltech-101 là gì?
Bộ dữ liệu Caltech-101 bao gồm:
- Khoảng 9.000 hình ảnh màu thuộc 101 danh mục.
- Các danh mục bao gồm nhiều loại đối tượng khác nhau, bao gồm động vật, xe cộ và đồ gia dụng.
- Số lượng hình ảnh khác nhau cho mỗi danh mục, thường từ 40 đến 800.
- Kích thước hình ảnh khác nhau, phần lớn có độ phân giải trung bình.
Những tính năng này khiến nó trở thành lựa chọn tuyệt vời cho việc đào tạo và đánh giá các mô hình nhận dạng đối tượng trong học máy và thị giác máy tính.
Tại sao tôi nên trích dẫn bộ dữ liệu Caltech-101 trong nghiên cứu của mình?
Trích dẫn bộ dữ liệu Caltech-101 trong nghiên cứu của bạn thừa nhận những đóng góp của người sáng tạo và cung cấp tài liệu tham khảo cho những người khác có thể sử dụng tập dữ liệu. Trích dẫn được đề xuất là:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}
Trích dẫn giúp duy trì tính toàn vẹn của công việc học tập và hỗ trợ các đồng nghiệp trong việc định vị tài nguyên gốc.
Tôi có thể sử dụng không Ultralytics HUB cho các mô hình đào tạo trên tập dữ liệu Caltech-101?
Có, bạn có thể sử dụng Ultralytics HUB cho các mô hình đào tạo trên tập dữ liệu Caltech-101. Ultralytics HUB cung cấp một nền tảng trực quan để quản lý bộ dữ liệu, mô hình đào tạo và triển khai chúng mà không cần mã hóa rộng rãi. Để biết hướng dẫn chi tiết, hãy tham khảo Cách đào tạo các mô hình tùy chỉnh của bạn với Ultralytics Bài đăng trên blog HUB.