Bỏ để qua phần nội dung

Bộ dữ liệu Caltech-256

Bộ dữ liệu Caltech-256 là một bộ sưu tập hình ảnh phong phú được sử dụng cho các tác vụ phân loại đối tượng. Nó chứa khoảng 30.000 hình ảnh được chia thành 257 loại (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được sắp xếp và chú thích cẩn thận để cung cấp một điểm chuẩn đầy thách thức và đa dạng cho các thuật toán nhận dạng đối tượng.



Xem: Cách đào tạo mô hình phân loại hình ảnh bằng tập dữ liệu Caltech-256 với Ultralytics Trung tâm

Các tính năng chính

  • Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 loại.
  • Mỗi danh mục chứa tối thiểu 80 hình ảnh.
  • Các danh mục bao gồm nhiều đối tượng trong thế giới thực, bao gồm động vật, xe cộ, đồ gia dụng và con người.
  • Hình ảnh có kích thước và độ phân giải khác nhau.
  • Caltech-256 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.

Cấu trúc tập dữ liệu

Giống như Caltech-101, bộ dữ liệu Caltech-256 không có sự phân chia chính thức giữa các bộ đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ theo nhu cầu cụ thể của họ. Một thực tế phổ biến là sử dụng một tập hợp con ngẫu nhiên của hình ảnh để đào tạo và các hình ảnh còn lại để thử nghiệm.

Ứng dụng

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vector hỗ trợ (SVM) và nhiều thuật toán học máy khác. Bộ danh mục đa dạng và hình ảnh chất lượng cao của nó làm cho nó trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Hình ảnh mẫu và chú thích

Bộ dữ liệu Caltech-256 chứa hình ảnh màu chất lượng cao của các đối tượng khác nhau, cung cấp bộ dữ liệu toàn diện cho các tác vụ nhận dạng đối tượng. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu (tín dụng):

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng để đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.

Trích dẫn và xác nhận

Nếu bạn sử dụng bộ dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Chúng tôi muốn ghi nhận Gregory Griffin, Alex Holub và Pietro Perona đã tạo và duy trì bộ dữ liệu Caltech-256 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về

Tập dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-256.

FAQ

Bộ dữ liệu Caltech-256 là gì và tại sao nó lại quan trọng đối với học máy?

Bộ dữ liệu Caltech-256 là một tập dữ liệu hình ảnh lớn được sử dụng chủ yếu cho các tác vụ phân loại đối tượng trong học máy và thị giác máy tính. Nó bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 loại, bao gồm một loạt các đối tượng trong thế giới thực. Hình ảnh đa dạng và chất lượng cao của tập dữ liệu làm cho nó trở thành một chuẩn mực tuyệt vời để đánh giá các thuật toán nhận dạng đối tượng, điều này rất quan trọng để phát triển các mô hình học máy mạnh mẽ.

Làm thế nào tôi có thể đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 bằng cách sử dụng Python hoặc CLI?

Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-256 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Tham khảo trang Đào tạo mô hình để biết các tùy chọn bổ sung.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Các trường hợp sử dụng phổ biến nhất cho tập dữ liệu Caltech-256 là gì?

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng khác nhau như:

  • Đào tạo Mạng nơ-ron tích chập (CNN)
  • Đánh giá hiệu suất của Máy vector hỗ trợ (SVM)
  • Đánh giá các thuật toán deep learning mới
  • Phát triển các mô hình phát hiện đối tượng bằng cách sử dụng các khung như Ultralytics YOLO

Sự đa dạng và chú thích toàn diện của nó làm cho nó trở nên lý tưởng cho nghiên cứu và phát triển trong học máy và thị giác máy tính.

Bộ dữ liệu Caltech-256 được cấu trúc và phân chia như thế nào để đào tạo và thử nghiệm?

Bộ dữ liệu Caltech-256 không đi kèm với sự phân chia được xác định trước để đào tạo và thử nghiệm. Người dùng thường tạo phần tách của riêng họ theo nhu cầu cụ thể của họ. Một cách tiếp cận phổ biến là chọn ngẫu nhiên một tập hợp con các hình ảnh để đào tạo và sử dụng các hình ảnh còn lại để thử nghiệm. Tính linh hoạt này cho phép người dùng điều chỉnh tập dữ liệu theo yêu cầu dự án cụ thể và thiết lập thử nghiệm của họ.

Tại sao tôi nên sử dụng Ultralytics YOLO cho các mô hình đào tạo trên tập dữ liệu Caltech-256?

Ultralytics YOLO các mô hình cung cấp một số lợi thế để đào tạo trên tập dữ liệu Caltech-256:

  • Độ chính xác cao: YOLO Các mô hình được biết đến với hiệu suất hiện đại trong các nhiệm vụ phát hiện đối tượng.
  • Tốc độ: Chúng cung cấp khả năng suy luận theo thời gian thực, làm cho chúng phù hợp với các ứng dụng yêu cầu dự đoán nhanh.
  • Dễ sử dụng: Với Ultralytics HUB, người dùng có thể đào tạo, xác thực và triển khai các mô hình mà không cần mã hóa rộng rãi.
  • Mô hình đào tạo trước: Bắt đầu từ các mô hình được đào tạo trước, như yolov8n-cls.pt, có thể giảm đáng kể thời gian đào tạo và cải thiện độ chính xác của mô hình.

Để biết thêm chi tiết, hãy khám phá hướng dẫn đào tạo toàn diện của chúng tôi.



Đã tạo 2023-11-12, Cập nhật 2024-07-18
Tác giả: RizwanMunawar (1), glenn-jocher (6)

Ý kiến