Link to this sectionBộ dữ liệu Caltech-101#
Bộ dữ liệu Caltech-101 là bộ dữ liệu được sử dụng rộng rãi cho các tác vụ nhận diện đối tượng, chứa khoảng 9.000 hình ảnh thuộc 101 danh mục đối tượng. Các danh mục này được chọn nhằm phản ánh đa dạng các đối tượng trong thế giới thực, và bản thân các hình ảnh cũng được lựa chọn và chú thích cẩn thận để tạo thành một tiêu chuẩn kiểm thử thách thức cho các thuật toán nhận diện đối tượng.
Bộ dữ liệu Caltech-101, theo cách cung cấp ban đầu, không đi kèm với các tập huấn luyện/xác thực được xác định trước. Tuy nhiên, khi bạn sử dụng các lệnh huấn luyện được cung cấp trong các ví dụ sử dụng bên dưới, khung làm việc Ultralytics sẽ tự động phân chia bộ dữ liệu cho bạn. Tỷ lệ phân chia mặc định được sử dụng là 80% cho tập huấn luyện và 20% cho tập xác thực.
Link to this sectionTính năng chính#
- Bộ dữ liệu Caltech-101 bao gồm khoảng 9.000 hình ảnh màu được chia thành 101 danh mục.
- Các danh mục bao gồm nhiều loại đối tượng, bao gồm động vật, phương tiện giao thông, vật dụng gia đình và con người.
- Số lượng hình ảnh mỗi danh mục khác nhau, với khoảng 40 đến 800 hình ảnh trong mỗi danh mục.
- Hình ảnh có kích thước thay đổi, với hầu hết các hình ảnh có độ phân giải trung bình.
- Caltech-101 được sử dụng rộng rãi cho việc huấn luyện và kiểm thử trong lĩnh vực machine learning, đặc biệt là cho các tác vụ nhận diện đối tượng.
Link to this sectionCấu trúc tập dữ liệu#
Không giống như nhiều bộ dữ liệu khác, bộ dữ liệu Caltech-101 không được phân chia chính thức thành các tập huấn luyện và kiểm thử. Người dùng thường tự tạo các tập phân chia dựa trên nhu cầu cụ thể của mình. Tuy nhiên, một cách làm phổ biến là sử dụng một tập hợp con ngẫu nhiên các hình ảnh để huấn luyện (ví dụ: 30 hình ảnh mỗi danh mục) và các hình ảnh còn lại để kiểm thử.
Link to this sectionỨng dụng#
Bộ dữ liệu Caltech-101 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình deep learning trong các tác vụ nhận diện đối tượng, chẳng hạn như Convolutional Neural Networks (CNN), Support Vector Machines (SVM) và nhiều thuật toán machine learning khác. Sự đa dạng về danh mục và hình ảnh chất lượng cao khiến nó trở thành một bộ dữ liệu tuyệt vời cho nghiên cứu và phát triển trong lĩnh vực machine learning và computer vision.
Link to this sectionCách sử dụng#
Để huấn luyện mô hình YOLO trên bộ dữ liệu Caltech-101 trong 100 epochs, bạn có thể sử dụng các đoạn mã sau. Để xem danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training của mô hình.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this sectionHình ảnh mẫu và chú thích#
Bộ dữ liệu Caltech-101 chứa các hình ảnh màu chất lượng cao về nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ image classification. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Ví dụ này minh họa sự đa dạng và phức tạp của các đối tượng trong bộ dữ liệu Caltech-101, nhấn mạnh tầm quan trọng của một bộ dữ liệu phong phú đối với việc huấn luyện các mô hình nhận diện đối tượng mạnh mẽ.
Link to this sectionTrích dẫn và Ghi nhận#
Nếu bạn sử dụng bộ dữ liệu Caltech-101 trong nghiên cứu hoặc công việc phát triển của mình, vui lòng trích dẫn bài báo sau:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Chúng tôi xin gửi lời cảm ơn đến Li Fei-Fei, Rob Fergus và Pietro Perona vì đã tạo ra và duy trì bộ dữ liệu Caltech-101 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu machine learning và computer vision. Để biết thêm thông tin về bộ dữ liệu Caltech-101 và những người sáng tạo ra nó, hãy truy cập trang web bộ dữ liệu Caltech-101.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionBộ dữ liệu Caltech-101 được sử dụng để làm gì trong machine learning?#
Bộ dữ liệu Caltech-101 được sử dụng rộng rãi trong machine learning cho các tác vụ nhận diện đối tượng. Nó chứa khoảng 9.000 hình ảnh thuộc 101 danh mục, cung cấp một tiêu chuẩn kiểm thử thách thức để đánh giá các thuật toán nhận diện đối tượng. Các nhà nghiên cứu tận dụng nó để huấn luyện và kiểm thử các mô hình, đặc biệt là các Convolutional Neural Networks (CNN) và Support Vector Machines (SVM), trong lĩnh vực computer vision.
Link to this sectionLàm cách nào để tôi có thể huấn luyện mô hình Ultralytics YOLO trên bộ dữ liệu Caltech-101?#
Để huấn luyện mô hình Ultralytics YOLO trên bộ dữ liệu Caltech-101, bạn có thể sử dụng các đoạn mã được cung cấp. Ví dụ, để huấn luyện trong 100 epochs:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Để biết thêm các đối số và tùy chọn chi tiết, hãy tham khảo trang Training của mô hình.
Link to this sectionCác tính năng chính của bộ dữ liệu Caltech-101 là gì?#
Bộ dữ liệu Caltech-101 bao gồm:
- Khoảng 9.000 hình ảnh màu thuộc 101 danh mục.
- Các danh mục bao phủ nhiều loại đối tượng đa dạng, bao gồm động vật, phương tiện giao thông và vật dụng gia đình.
- Số lượng hình ảnh mỗi danh mục thay đổi, thường nằm trong khoảng từ 40 đến 800.
- Kích thước hình ảnh thay đổi, với hầu hết có độ phân giải trung bình.
Những tính năng này khiến nó trở thành lựa chọn tuyệt vời để huấn luyện và đánh giá các mô hình nhận diện đối tượng trong machine learning và computer vision.
Link to this sectionTại sao tôi nên trích dẫn bộ dữ liệu Caltech-101 trong nghiên cứu của mình?#
Việc trích dẫn bộ dữ liệu Caltech-101 trong nghiên cứu của bạn là sự ghi nhận những đóng góp của các tác giả và cung cấp tài liệu tham khảo cho những người khác có thể sử dụng bộ dữ liệu này. Trích dẫn được khuyến nghị là:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}Việc trích dẫn giúp duy trì tính toàn vẹn của các công trình học thuật và hỗ trợ đồng nghiệp trong việc tìm kiếm nguồn tài nguyên gốc.
Link to this sectionTôi có thể sử dụng Ultralytics Platform để huấn luyện các mô hình trên bộ dữ liệu Caltech-101 không?#
Có, bạn có thể sử dụng Ultralytics Platform để huấn luyện các mô hình trên bộ dữ liệu Caltech-101. Ultralytics Platform cung cấp một nền tảng trực quan để quản lý các bộ dữ liệu, huấn luyện mô hình và triển khai chúng mà không cần lập trình phức tạp. Để có hướng dẫn chi tiết, hãy tham khảo bài viết blog cách huấn luyện các mô hình tùy chỉnh của bạn với Ultralytics Platform.