Skip to content

Bộ dữ liệu Caltech-256

Tập dữ liệu Caltech-256 là một bộ sưu tập lớn các hình ảnh được sử dụng cho các tác vụ phân loại đối tượng. Nó chứa khoảng 30.000 hình ảnh được chia thành 257 danh mục (256 danh mục đối tượng và 1 danh mục nền). Các hình ảnh được tuyển chọn và chú thích cẩn thận để cung cấp một chuẩn mực đầy thách thức và đa dạng cho các thuật toán nhận dạng đối tượng.



Xem: Cách huấn luyện Phân loại hình ảnh Mô hình sử dụng Tập dữ liệu Caltech-256 với Ultralytics HUB

Tự động phân chia dữ liệu

Bộ dữ liệu Caltech-256 được cung cấp không đi kèm với các phân chia train/validation được xác định trước. Tuy nhiên, khi bạn sử dụng các lệnh huấn luyện được cung cấp trong các ví dụ sử dụng bên dưới, framework Ultralytics sẽ tự động phân chia bộ dữ liệu cho bạn. Phân chia mặc định được sử dụng là 80% cho tập huấn luyện và 20% cho tập validation.

Các tính năng chính

  • Bộ dữ liệu Caltech-256 bao gồm khoảng 30.000 ảnh màu được chia thành 257 danh mục.
  • Mỗi danh mục chứa tối thiểu 80 ảnh.
  • Các danh mục bao gồm nhiều đối tượng thực tế khác nhau, bao gồm động vật, phương tiện, đồ gia dụng và con người.
  • Hình ảnh có kích thước và độ phân giải khác nhau.
  • Caltech-256 được sử dụng rộng rãi để huấn luyện và kiểm thử trong lĩnh vực máy học, đặc biệt là cho các tác vụ nhận dạng đối tượng.

Cấu trúc bộ dữ liệu

Tương tự như Caltech-101, bộ dữ liệu Caltech-256 không có sự phân chia chính thức giữa tập huấn luyện và tập kiểm tra. Người dùng thường tự tạo ra các phân chia riêng theo nhu cầu cụ thể của họ. Một thông lệ phổ biến là sử dụng một tập hợp con ngẫu nhiên các hình ảnh để huấn luyện và các hình ảnh còn lại để kiểm tra.

Các ứng dụng

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Tập hợp đa dạng các danh mục và hình ảnh chất lượng cao khiến nó trở thành một bộ dữ liệu vô giá cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính.

Cách sử dụng

Để huấn luyện một mô hình YOLO trên bộ dữ liệu Caltech-256 trong 100 epochs, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Ảnh và Chú thích mẫu

Bộ dữ liệu Caltech-256 chứa các ảnh màu chất lượng cao về nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu toàn diện cho các tác vụ nhận dạng đối tượng. Dưới đây là một vài ví dụ về hình ảnh từ bộ dữ liệu (nguồn):

Ảnh mẫu bộ dữ liệu

Ví dụ này thể hiện sự đa dạng và phức tạp của các đối tượng trong bộ dữ liệu Caltech-256, nhấn mạnh tầm quan trọng của một bộ dữ liệu đa dạng để huấn luyện các mô hình nhận dạng đối tượng mạnh mẽ.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu Caltech-256 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Chúng tôi xin ghi nhận công lao của Gregory Griffin, Alex Holub và Pietro Perona vì đã tạo ra và duy trì bộ dữ liệu Caltech-256 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu học máy và thị giác máy tính. Để biết thêm thông tin về bộ dữ liệu Caltech-256 và những người tạo ra nó, hãy truy cập trang web bộ dữ liệu Caltech-256.

Câu hỏi thường gặp

Bộ dữ liệu Caltech-256 là gì và tại sao nó lại quan trọng đối với máy học?

Bộ dữ liệu Caltech-256 là một bộ dữ liệu hình ảnh lớn được sử dụng chủ yếu cho các tác vụ phân loại đối tượng trong học máy và thị giác máy tính. Nó bao gồm khoảng 30.000 hình ảnh màu được chia thành 257 danh mục, bao gồm nhiều đối tượng thực tế. Hình ảnh đa dạng và chất lượng cao của bộ dữ liệu này làm cho nó trở thành một chuẩn mực tuyệt vời để đánh giá các thuật toán nhận dạng đối tượng, điều này rất quan trọng để phát triển các mô hình học máy mạnh mẽ.

Làm cách nào để huấn luyện mô hình YOLO trên bộ dữ liệu Caltech-256 bằng python hoặc CLI?

Để huấn luyện mô hình YOLO trên bộ dữ liệu Caltech-256 trong 100 epochs, bạn có thể sử dụng các đoạn mã sau. Tham khảo trang Huấn luyện mô hình để biết thêm các tùy chọn.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Các trường hợp sử dụng phổ biến nhất cho bộ dữ liệu Caltech-256 là gì?

Bộ dữ liệu Caltech-256 được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng khác nhau như:

  • Huấn luyện Mạng Nơ-ron Tích chập (CNN)
  • Đánh giá hiệu suất của Máy vectơ hỗ trợ (SVM)
  • Điểm chuẩn các thuật toán học sâu mới
  • Phát triển các mô hình phát hiện đối tượng bằng cách sử dụng các framework như Ultralytics YOLO

Sự đa dạng và các chú thích toàn diện của nó làm cho nó trở nên lý tưởng cho nghiên cứu và phát triển trong học máy và thị giác máy tính.

Bộ dữ liệu Caltech-256 được cấu trúc và chia thành các tập huấn luyện và kiểm tra như thế nào?

Bộ dữ liệu Caltech-256 không đi kèm với một phân chia được xác định trước cho việc huấn luyện và kiểm tra. Người dùng thường tạo các phân chia của riêng họ theo nhu cầu cụ thể của họ. Một cách tiếp cận phổ biến là chọn ngẫu nhiên một tập hợp con các hình ảnh để huấn luyện và sử dụng các hình ảnh còn lại để kiểm tra. Sự linh hoạt này cho phép người dùng điều chỉnh bộ dữ liệu cho các yêu cầu dự án cụ thể và thiết lập thử nghiệm của họ.

Tại sao tôi nên sử dụng Ultralytics YOLO để huấn luyện các mô hình trên bộ dữ liệu Caltech-256?

Các mô hình Ultralytics YOLO mang lại một số lợi thế khi huấn luyện trên bộ dữ liệu Caltech-256:

  • Độ chính xác cao: Các mô hình YOLO được biết đến với hiệu suất hàng đầu trong các tác vụ phát hiện đối tượng.
  • Tốc độ: Chúng cung cấp khả năng suy luận theo thời gian thực, khiến chúng phù hợp cho các ứng dụng yêu cầu dự đoán nhanh chóng.
  • Dễ sử dụng: Với Ultralytics HUB, người dùng có thể huấn luyện, xác thực và triển khai các mô hình mà không cần viết code nhiều.
  • Các mô hình được huấn luyện trước: Bắt đầu từ các mô hình đã được huấn luyện trước, chẳng hạn như yolo11n-cls.pt, có thể giảm đáng kể thời gian huấn luyện và cải thiện mô hình độ chính xác.

Để biết thêm chi tiết, hãy khám phá hướng dẫn huấn luyện toàn diện của chúng tôi và tìm hiểu về phân loại hình ảnh với Ultralytics YOLO.



📅 Đã tạo 1 năm trước ✏️ Cập nhật 4 tháng trước

Bình luận