Bộ dữ liệu Caltech-256
Bộ dữ liệu Caltech-256 là một bộ sưu tập hình ảnh mở rộng được sử dụng cho các nhiệm vụ phân loại đối tượng. Nó chứa khoảng 30.000 hình ảnh được chia thành 257 danh mục (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được tuyển chọn và chú thích cẩn thận để cung cấp một chuẩn mực đầy thử thách và đa dạng cho các thuật toán nhận dạng đối tượng.
Đồng hồ: Cách luyện tập Phân loại hình ảnh Mô hình sử dụng Bộ dữ liệu Caltech-256 với Ultralytics TRUNG TÂM
Các tính năng chính
- Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 danh mục.
- Mỗi danh mục chứa tối thiểu 80 hình ảnh.
- Các danh mục này bao gồm nhiều loại đồ vật trong thế giới thực, trong đó có động vật, xe cộ, đồ gia dụng và con người.
- Hình ảnh có nhiều kích thước và độ phân giải khác nhau.
- Caltech-256 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.
Cấu trúc tập dữ liệu
Giống như Caltech-101, tập dữ liệu Caltech-256 không có sự phân chia chính thức giữa các tập huấn luyện và thử nghiệm. Người dùng thường tạo ra các phân chia của riêng họ theo nhu cầu cụ thể của họ. Một thông lệ phổ biến là sử dụng một tập hợp con ngẫu nhiên các hình ảnh để huấn luyện và các hình ảnh còn lại để thử nghiệm.
Ứng dụng
Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Bộ danh mục đa dạng và hình ảnh chất lượng cao của nó khiến nó trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính .
Cách sử dụng
Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Bộ dữ liệu Caltech-256 chứa các hình ảnh màu chất lượng cao của nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu toàn diện cho các nhiệm vụ nhận dạng đối tượng. Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu ( tín dụng ):
Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng tập dữ liệu Caltech-256 trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:
Chúng tôi muốn cảm ơn Gregory Griffin, Alex Holub và Pietro Perona đã tạo ra và duy trì tập dữ liệu Caltech-256 như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính. Để biết thêm thông tin về
Bộ dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web bộ dữ liệu Caltech-256 .
CÂU HỎI THƯỜNG GẶP
Bộ dữ liệu Caltech-256 là gì và tại sao nó lại quan trọng đối với máy học?
Bộ dữ liệu Caltech-256 là một bộ dữ liệu hình ảnh lớn được sử dụng chủ yếu cho các tác vụ phân loại đối tượng trong học máy và thị giác máy tính. Nó bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 danh mục, bao gồm nhiều đối tượng trong thế giới thực. Các hình ảnh đa dạng và chất lượng cao của bộ dữ liệu khiến nó trở thành chuẩn mực tuyệt vời để đánh giá các thuật toán nhận dạng đối tượng, điều này rất quan trọng để phát triển các mô hình học máy mạnh mẽ.
Làm thế nào tôi có thể đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 sử dụng Python hoặc CLI ?
Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 trong 100 kỷ nguyên , bạn có thể sử dụng các đoạn mã sau. Tham khảo trang Đào tạo mô hình để biết thêm các tùy chọn.
Ví dụ về tàu hỏa
Những trường hợp sử dụng phổ biến nhất của bộ dữ liệu Caltech-256 là gì?
Bộ dữ liệu Caltech-256 được sử dụng rộng rãi cho nhiều nhiệm vụ nhận dạng đối tượng khác nhau như:
- Đào tạo mạng nơ-ron tích chập (CNN)
- Đánh giá hiệu suất của Máy vectơ hỗ trợ (SVM)
- Đánh giá chuẩn các thuật toán học sâu mới
- Phát triển các mô hình phát hiện đối tượng bằng cách sử dụng các khuôn khổ như Ultralytics YOLO
Tính đa dạng và chú thích toàn diện của nó làm cho nó trở nên lý tưởng cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.
Bộ dữ liệu Caltech-256 được cấu trúc và phân chia như thế nào để đào tạo và thử nghiệm?
Bộ dữ liệu Caltech-256 không đi kèm với một phân chia được xác định trước để đào tạo và thử nghiệm. Người dùng thường tạo các phân chia của riêng họ theo nhu cầu cụ thể của họ. Một cách tiếp cận phổ biến là chọn ngẫu nhiên một tập hợp con hình ảnh để đào tạo và sử dụng các hình ảnh còn lại để thử nghiệm. Tính linh hoạt này cho phép người dùng điều chỉnh bộ dữ liệu theo yêu cầu dự án cụ thể và thiết lập thử nghiệm của họ.
Tại sao tôi nên sử dụng Ultralytics YOLO để đào tạo các mô hình trên tập dữ liệu Caltech-256?
Ultralytics YOLO các mô hình cung cấp một số lợi thế cho việc đào tạo trên tập dữ liệu Caltech-256:
- Độ chính xác cao : YOLO Các mô hình này được biết đến với hiệu suất tiên tiến trong các nhiệm vụ phát hiện đối tượng.
- Tốc độ : Chúng cung cấp khả năng suy luận theo thời gian thực, phù hợp với các ứng dụng yêu cầu dự đoán nhanh.
- Dễ sử dụng : Với Ultralytics HUB, người dùng có thể đào tạo, xác thực và triển khai các mô hình mà không cần phải viết mã nhiều.
- Mô hình được đào tạo trước: Bắt đầu từ các mô hình được đào tạo trước, như
yolo11n-cls.pt
, có thể giảm đáng kể thời gian đào tạo và cải thiện mô hình sự chính xác.
Để biết thêm chi tiết, hãy khám phá hướng dẫn đào tạo toàn diện của chúng tôi.