Meet YOLO26: next-gen vision AI.

Link to this sectionBộ dữ liệu Caltech-101#

Bộ dữ liệu Caltech-101 là một bộ dữ liệu được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng, chứa khoảng 9.000 hình ảnh từ 101 danh mục đối tượng. Các danh mục này được chọn để phản ánh sự đa dạng của các đối tượng trong thế giới thực, và bản thân các hình ảnh cũng được tuyển chọn cũng như chú thích cẩn thận nhằm cung cấp một chuẩn đo lường thách thức cho các thuật toán nhận dạng đối tượng.



Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform
Tự động phân chia dữ liệu

Bộ dữ liệu Caltech-101 như được cung cấp, không đi kèm các tập huấn luyện/xác thực được xác định trước. Tuy nhiên, khi bạn sử dụng các lệnh huấn luyện được cung cấp trong các ví dụ sử dụng bên dưới, khung làm việc Ultralytics sẽ tự động phân chia bộ dữ liệu cho bạn. Tỷ lệ phân chia mặc định là 80% cho tập huấn luyện và 20% cho tập xác thực.

Link to this sectionTính năng chính#

  • Bộ dữ liệu Caltech-101 bao gồm khoảng 9.000 hình ảnh màu được chia thành 101 danh mục.
  • Các danh mục bao gồm nhiều loại đối tượng, bao gồm động vật, phương tiện, vật dụng gia đình và con người.
  • Số lượng hình ảnh mỗi danh mục khác nhau, với khoảng 40 đến 800 hình ảnh trong mỗi danh mục.
  • Hình ảnh có kích thước thay đổi, hầu hết các hình ảnh có độ phân giải trung bình.
  • Caltech-101 được sử dụng rộng rãi để huấn luyện và kiểm thử trong lĩnh vực machine learning, đặc biệt là cho các tác vụ nhận dạng đối tượng.

Link to this sectionCấu trúc tập dữ liệu#

Không giống như nhiều bộ dữ liệu khác, bộ dữ liệu Caltech-101 không được phân chia chính thức thành tập huấn luyện và tập kiểm thử. Người dùng thường tự tạo các tập chia của riêng mình dựa trên nhu cầu cụ thể. Tuy nhiên, một cách thực hành phổ biến là sử dụng một tập hợp con ngẫu nhiên các hình ảnh để huấn luyện (ví dụ: 30 hình ảnh mỗi danh mục) và các hình ảnh còn lại để kiểm thử.

Link to this sectionỨng dụng#

Bộ dữ liệu Caltech-101 được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình deep learning trong các tác vụ nhận dạng đối tượng, chẳng hạn như Convolutional Neural Networks (CNN), Support Vector Machines (SVM), và nhiều thuật toán machine learning khác. Sự đa dạng về danh mục và hình ảnh chất lượng cao khiến nó trở thành một bộ dữ liệu tuyệt vời cho nghiên cứu và phát triển trong lĩnh vực machine learningcomputer vision.

Link to this sectionCách sử dụng#

Để huấn luyện một mô hình YOLO trên bộ dữ liệu Caltech-101 trong 100 epoch, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các tham số khả dụng, hãy tham khảo trang Huấn luyện mô hình.

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionHình ảnh mẫu và chú thích#

Bộ dữ liệu Caltech-101 chứa các hình ảnh màu chất lượng cao về nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Mẫu bộ dữ liệu phân loại hình ảnh Caltech-101

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong bộ dữ liệu Caltech-101, nhấn mạnh tầm quan trọng của một bộ dữ liệu phong phú để huấn luyện các mô hình nhận dạng đối tượng mạnh mẽ.

Link to this sectionTrích dẫn và Ghi nhận#

Nếu bạn sử dụng bộ dữ liệu Caltech-101 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

Trích dẫn
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Chúng tôi xin gửi lời cảm ơn tới Li Fei-Fei, Rob Fergus và Pietro Perona vì đã tạo ra và duy trì bộ dữ liệu Caltech-101 như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu machine learning và computer vision. Để biết thêm thông tin về bộ dữ liệu Caltech-101 và những người tạo ra nó, hãy truy cập trang web bộ dữ liệu Caltech-101.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionBộ dữ liệu Caltech-101 được sử dụng để làm gì trong machine learning?#

Bộ dữ liệu Caltech-101 được sử dụng rộng rãi trong machine learning cho các tác vụ nhận dạng đối tượng. Nó chứa khoảng 9.000 hình ảnh qua 101 danh mục, cung cấp một chuẩn đo lường thách thức để đánh giá các thuật toán nhận dạng đối tượng. Các nhà nghiên cứu tận dụng nó để huấn luyện và kiểm thử các mô hình, đặc biệt là Convolutional Neural Networks (CNN) và Support Vector Machines (SVM), trong computer vision.

Link to this sectionLàm thế nào tôi có thể huấn luyện một mô hình Ultralytics YOLO trên bộ dữ liệu Caltech-101?#

Để huấn luyện một mô hình Ultralytics YOLO trên bộ dữ liệu Caltech-101, bạn có thể sử dụng các đoạn mã được cung cấp. Ví dụ, để huấn luyện trong 100 epoch:

Ví dụ về Training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Để biết thêm các tham số và tùy chọn chi tiết, hãy tham khảo trang Huấn luyện mô hình.

Link to this sectionCác tính năng chính của bộ dữ liệu Caltech-101 là gì?#

Bộ dữ liệu Caltech-101 bao gồm:

  • Khoảng 9.000 hình ảnh màu qua 101 danh mục.
  • Các danh mục bao gồm một phạm vi đa dạng các đối tượng, bao gồm động vật, phương tiện và vật dụng gia đình.
  • Số lượng hình ảnh mỗi danh mục thay đổi, thường từ 40 đến 800.
  • Kích thước hình ảnh thay đổi, hầu hết là độ phân giải trung bình.

Những tính năng này làm cho nó trở thành một lựa chọn tuyệt vời để huấn luyện và đánh giá các mô hình nhận dạng đối tượng trong machine learning và computer vision.

Link to this sectionTại sao tôi nên trích dẫn bộ dữ liệu Caltech-101 trong nghiên cứu của mình?#

Việc trích dẫn bộ dữ liệu Caltech-101 trong nghiên cứu của bạn giúp ghi nhận những đóng góp của các tác giả và cung cấp tài liệu tham khảo cho những người khác có thể sử dụng bộ dữ liệu này. Trích dẫn được khuyến nghị là:

Trích dẫn
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Việc trích dẫn giúp duy trì tính toàn vẹn của công trình học thuật và hỗ trợ đồng nghiệp trong việc xác định nguồn tài nguyên gốc.

Link to this sectionTôi có thể sử dụng Ultralytics Platform để huấn luyện các mô hình trên bộ dữ liệu Caltech-101 không?#

Có, bạn có thể sử dụng Ultralytics Platform để huấn luyện các mô hình trên bộ dữ liệu Caltech-101. Ultralytics Platform cung cấp một nền tảng trực quan để quản lý các bộ dữ liệu, huấn luyện mô hình và triển khai chúng mà không cần viết mã phức tạp. Để có hướng dẫn chi tiết, hãy tham khảo bài đăng blog cách huấn luyện các mô hình tùy chỉnh của bạn với Ultralytics Platform.

Bình luận