Bộ dữ liệu Caltech-256
Bộ dữ liệu Caltech-256 là một bộ sưu tập hình ảnh phong phú được sử dụng cho các tác vụ phân loại đối tượng. Nó chứa khoảng 30.000 hình ảnh được chia thành 257 loại (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được sắp xếp và chú thích cẩn thận để cung cấp một điểm chuẩn đầy thách thức và đa dạng cho các thuật toán nhận dạng đối tượng.
Xem: Cách luyện tập Phân loại hình ảnh Mô hình sử dụng Bộ dữ liệu Caltech-256 với Ultralytics TRUNG TÂM
Các tính năng chính
- Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 loại.
- Mỗi danh mục chứa tối thiểu 80 hình ảnh.
- Các danh mục bao gồm nhiều đối tượng trong thế giới thực, bao gồm động vật, xe cộ, đồ gia dụng và con người.
- Hình ảnh có kích thước và độ phân giải khác nhau.
- Caltech-256 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.
Cấu trúc tập dữ liệu
Giống như Caltech-101, bộ dữ liệu Caltech-256 không có sự phân chia chính thức giữa các bộ đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ theo nhu cầu cụ thể của họ. Một thực tế phổ biến là sử dụng một tập hợp con ngẫu nhiên của hình ảnh để đào tạo và các hình ảnh còn lại để thử nghiệm.
Ứng dụng
Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Bộ danh mục đa dạng và hình ảnh chất lượng cao của nó khiến nó trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính .
Sử dụng
Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Bộ dữ liệu Caltech-256 chứa hình ảnh màu chất lượng cao của các đối tượng khác nhau, cung cấp bộ dữ liệu toàn diện cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu (tín dụng):
Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.
Trích dẫn và xác nhận
Nếu bạn sử dụng bộ dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
Chúng tôi muốn cảm ơn Gregory Griffin, Alex Holub và Pietro Perona đã tạo ra và duy trì tập dữ liệu Caltech-256 như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính. Để biết thêm thông tin về
Tập dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-256.
FAQ
Bộ dữ liệu Caltech-256 là gì và tại sao nó lại quan trọng đối với học máy?
Bộ dữ liệu Caltech-256 là một tập dữ liệu hình ảnh lớn được sử dụng chủ yếu cho các tác vụ phân loại đối tượng trong học máy và thị giác máy tính. Nó bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 loại, bao gồm một loạt các đối tượng trong thế giới thực. Hình ảnh đa dạng và chất lượng cao của tập dữ liệu làm cho nó trở thành một chuẩn mực tuyệt vời để đánh giá các thuật toán nhận dạng đối tượng, điều này rất quan trọng để phát triển các mô hình học máy mạnh mẽ.
Làm thế nào tôi có thể đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 bằng cách sử dụng Python hoặc CLI?
Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 trong 100 kỷ nguyên , bạn có thể sử dụng các đoạn mã sau. Tham khảo trang Đào tạo mô hình để biết thêm các tùy chọn.
Ví dụ về tàu hỏa
Các trường hợp sử dụng phổ biến nhất cho tập dữ liệu Caltech-256 là gì?
Bộ dữ liệu Caltech-256 được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng khác nhau như:
- Đào tạo mạng nơ-ron tích chập (CNN)
- Đánh giá hiệu suất của Máy vectơ hỗ trợ (SVM)
- Đánh giá các thuật toán deep learning mới
- Phát triển các mô hình phát hiện đối tượng bằng cách sử dụng các khuôn khổ như Ultralytics YOLO
Sự đa dạng và chú thích toàn diện của nó làm cho nó trở nên lý tưởng cho nghiên cứu và phát triển trong học máy và thị giác máy tính.
Bộ dữ liệu Caltech-256 được cấu trúc và phân chia như thế nào để đào tạo và thử nghiệm?
Bộ dữ liệu Caltech-256 không đi kèm với sự phân chia được xác định trước để đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ theo nhu cầu cụ thể của họ. Một cách tiếp cận phổ biến là chọn ngẫu nhiên một tập hợp con các hình ảnh để đào tạo và sử dụng các hình ảnh còn lại để thử nghiệm. Tính linh hoạt này cho phép người dùng điều chỉnh tập dữ liệu theo yêu cầu dự án cụ thể và thiết lập thử nghiệm của họ.
Tại sao tôi nên sử dụng Ultralytics YOLO cho các mô hình đào tạo trên tập dữ liệu Caltech-256?
Ultralytics YOLO các mô hình cung cấp một số lợi thế để đào tạo trên tập dữ liệu Caltech-256:
- Độ chính xác cao: YOLO Các mô hình được biết đến với hiệu suất hiện đại trong các nhiệm vụ phát hiện đối tượng.
- Tốc độ: Chúng cung cấp khả năng suy luận theo thời gian thực, làm cho chúng phù hợp với các ứng dụng yêu cầu dự đoán nhanh.
- Dễ sử dụng: Với Ultralytics HUB, người dùng có thể đào tạo, xác thực và triển khai các mô hình mà không cần mã hóa rộng rãi.
- Mô hình đào tạo trước: Bắt đầu từ các mô hình được đào tạo trước, như
yolo11n-cls.pt
, có thể giảm đáng kể thời gian đào tạo và cải thiện mô hình sự chính xác.
Để biết thêm chi tiết, hãy khám phá hướng dẫn đào tạo toàn diện của chúng tôi.