Bỏ qua nội dung

Bộ dữ liệu Caltech-101

Bộ dữ liệu Caltech-101 là bộ dữ liệu được sử dụng rộng rãi cho các tác vụ nhận dạng đối tượng, chứa khoảng 9.000 hình ảnh từ 101 danh mục đối tượng. Các danh mục được chọn để phản ánh nhiều đối tượng trong thế giới thực và bản thân các hình ảnh được lựa chọn và chú thích cẩn thận để cung cấp điểm chuẩn đầy thách thức cho các thuật toán nhận dạng đối tượng.

Các tính năng chính

  • Bộ dữ liệu Caltech-101 bao gồm khoảng 9.000 hình ảnh màu được chia thành 101 danh mục.
  • Các danh mục bao gồm nhiều loại đối tượng khác nhau, trong đó có động vật, xe cộ, đồ gia dụng và con người.
  • Số lượng hình ảnh trong mỗi danh mục khác nhau, khoảng 40 đến 800 hình ảnh trong mỗi danh mục.
  • Hình ảnh có nhiều kích cỡ khác nhau, hầu hết đều có độ phân giải trung bình.
  • Caltech-101 được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các nhiệm vụ nhận dạng đối tượng.

Cấu trúc tập dữ liệu

Không giống như nhiều tập dữ liệu khác, tập dữ liệu Caltech-101 không được chia chính thức thành các tập huấn luyện và thử nghiệm. Người dùng thường tạo các phân chia của riêng họ dựa trên nhu cầu cụ thể của họ. Tuy nhiên, một thông lệ phổ biến là sử dụng một tập hợp con ngẫu nhiên các hình ảnh để huấn luyện (ví dụ: 30 hình ảnh cho mỗi danh mục) và các hình ảnh còn lại để thử nghiệm.

Ứng dụng

Bộ dữ liệu Caltech-101 được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ nhận dạng đối tượng, chẳng hạn như Mạng nơ-ron tích chập (CNN), Máy vectơ hỗ trợ (SVM) và nhiều thuật toán học máy khác. Sự đa dạng về danh mục và hình ảnh chất lượng cao của nó khiến nó trở thành một bộ dữ liệu tuyệt vời cho nghiên cứu và phát triển trong lĩnh vực học máy và thị giác máy tính .

Cách sử dụng

Để đào tạo một YOLO mô hình trên tập dữ liệu Caltech-101 cho 100 kỷ nguyên, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Hình ảnh mẫu và chú thích

Bộ dữ liệu Caltech-101 chứa các hình ảnh màu chất lượng cao của nhiều đối tượng khác nhau, cung cấp một bộ dữ liệu có cấu trúc tốt cho các tác vụ nhận dạng đối tượng. Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Hình ảnh mẫu của bộ dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của các đối tượng trong tập dữ liệu Caltech-101, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng trong việc đào tạo các mô hình nhận dạng đối tượng mạnh mẽ.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng tập dữ liệu Caltech-101 trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo sau:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Chúng tôi muốn cảm ơn Li Fei-Fei, Rob Fergus và Pietro Perona vì đã tạo ra và duy trì tập dữ liệu Caltech-101 như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính. Để biết thêm thông tin về tập dữ liệu Caltech-101 và những người tạo ra nó, hãy truy cập trang web tập dữ liệu Caltech-101 .

CÂU HỎI THƯỜNG GẶP

Bộ dữ liệu Caltech-101 được sử dụng để làm gì trong học máy?

Bộ dữ liệu Caltech-101 được sử dụng rộng rãi trong học máy cho các tác vụ nhận dạng đối tượng. Nó chứa khoảng 9.000 hình ảnh trên 101 danh mục, cung cấp một chuẩn mực đầy thách thức để đánh giá các thuật toán nhận dạng đối tượng. Các nhà nghiên cứu tận dụng nó để đào tạo và thử nghiệm các mô hình, đặc biệt là Mạng nơ-ron tích chập (CNN) và Máy vectơ hỗ trợ (SVM), trong thị giác máy tính.

Làm thế nào tôi có thể đào tạo một Ultralytics YOLO mô hình trên tập dữ liệu Caltech-101?

Để đào tạo một Ultralytics YOLO mô hình trên tập dữ liệu Caltech-101, bạn có thể sử dụng các đoạn mã được cung cấp. Ví dụ, để đào tạo cho 100 kỷ nguyên :

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Để biết thêm thông tin chi tiết và các lựa chọn, hãy tham khảo trang Đào tạo mô hình.

Những đặc điểm chính của tập dữ liệu Caltech-101 là gì?

Bộ dữ liệu Caltech-101 bao gồm:

  • Khoảng 9.000 hình ảnh màu thuộc 101 danh mục.
  • Các danh mục bao gồm nhiều loại đối tượng khác nhau, bao gồm động vật, xe cộ và đồ gia dụng.
  • Số lượng hình ảnh khác nhau cho mỗi danh mục, thường từ 40 đến 800.
  • Kích thước hình ảnh khác nhau, phần lớn có độ phân giải trung bình.

Những tính năng này khiến nó trở thành lựa chọn tuyệt vời cho việc đào tạo và đánh giá các mô hình nhận dạng đối tượng trong học máy và thị giác máy tính.

Tại sao tôi nên trích dẫn tập dữ liệu Caltech-101 trong nghiên cứu của mình?

Trích dẫn tập dữ liệu Caltech-101 trong nghiên cứu của bạn sẽ ghi nhận những đóng góp của người sáng tạo và cung cấp tài liệu tham khảo cho những người khác có thể sử dụng tập dữ liệu. Trích dẫn được khuyến nghị là:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Việc trích dẫn giúp duy trì tính toàn vẹn của công trình học thuật và hỗ trợ bạn bè tìm được nguồn tài liệu gốc.

Tôi có thể sử dụng Ultralytics HUB để đào tạo các mô hình trên tập dữ liệu Caltech-101?

Có, bạn có thể sử dụng Ultralytics HUB để đào tạo các mô hình trên tập dữ liệu Caltech-101. Ultralytics HUB cung cấp một nền tảng trực quan để quản lý các tập dữ liệu, mô hình đào tạo và triển khai chúng mà không cần mã hóa nhiều. Để biết hướng dẫn chi tiết, hãy tham khảo bài đăng trên blog cách đào tạo các mô hình tùy chỉnh của bạn bằng Ultralytics HUB .

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 2 tháng

Bình luận