Tập dữ liệu ImageNet10
Tập dữ liệu ImageNet10 là một tập con quy mô nhỏ của cơ sở dữ liệu ImageNet, được phát triển bởi Ultralytics và được thiết kế cho các bài kiểm tra CI, kiểm tra tính hợp lệ và thử nghiệm nhanh các pipeline huấn luyện. Tập dữ liệu này bao gồm hình ảnh đầu tiên trong tập huấn luyện và hình ảnh đầu tiên từ tập xác thực của 10 lớp đầu tiên trong ImageNet. Mặc dù nhỏ hơn đáng kể, nó vẫn giữ được cấu trúc và tính đa dạng của tập dữ liệu ImageNet gốc.
Các tính năng chính
- ImageNet10 là phiên bản rút gọn của ImageNet, với 20 hình ảnh đại diện cho 10 lớp đầu tiên của tập dữ liệu gốc.
- Tập dữ liệu được tổ chức theo hệ thống phân cấp WordNet, phản ánh cấu trúc của tập dữ liệu ImageNet đầy đủ.
- Nó đặc biệt phù hợp cho các bài kiểm tra CI, kiểm tra tính hợp lệ và thử nghiệm nhanh các pipeline huấn luyện trong các tác vụ computer vision.
- Mặc dù không được thiết kế để đánh giá benchmark model, nó có thể cung cấp dấu hiệu nhanh về chức năng cơ bản và tính chính xác của một model.
Cấu trúc tập dữ liệu
Tập dữ liệu ImageNet10, giống như ImageNet gốc, được tổ chức bằng cách sử dụng hệ thống phân cấp WordNet. Mỗi lớp trong số 10 lớp trong ImageNet10 được mô tả bởi một synset (tập hợp các thuật ngữ đồng nghĩa). Các hình ảnh trong ImageNet10 được chú thích bằng một hoặc nhiều synset, cung cấp một tài nguyên nhỏ gọn để kiểm tra các model nhằm nhận dạng các đối tượng khác nhau và mối quan hệ của chúng.
Ứng dụng
Tập dữ liệu ImageNet10 hữu ích cho việc kiểm tra và gỡ lỗi nhanh các model và pipeline computer vision. Kích thước nhỏ của nó cho phép lặp lại nhanh chóng, làm cho nó trở nên lý tưởng cho các bài kiểm tra continuous integration và kiểm tra tính hợp lệ. Nó cũng có thể được sử dụng để thử nghiệm sơ bộ nhanh các model mới hoặc các thay đổi đối với các model hiện có trước khi chuyển sang thử nghiệm quy mô đầy đủ với toàn bộ tập dữ liệu ImageNet.
Cách sử dụng
Để kiểm tra một deep learning model trên tập dữ liệu ImageNet10 với kích thước ảnh 224x224, bạn có thể sử dụng các đoạn code sau. Để có danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Training của model.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Hình ảnh và chú thích mẫu
Tập dữ liệu ImageNet10 chứa một tập con các hình ảnh từ tập dữ liệu ImageNet gốc. Những hình ảnh này được chọn để đại diện cho 10 lớp đầu tiên trong tập dữ liệu, cung cấp một tập dữ liệu đa dạng nhưng nhỏ gọn để kiểm tra và đánh giá nhanh.

Ví dụ này giới thiệu sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu ImageNet10, làm nổi bật tính hữu dụng của nó đối với các bài kiểm tra tính hợp lệ và thử nghiệm nhanh các model computer vision.
Trích dẫn và Ghi nhận
Nếu bạn sử dụng tập dữ liệu ImageNet10 trong nghiên cứu hoặc công việc phát triển của mình, vui lòng trích dẫn bài báo ImageNet gốc:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}Chúng tôi muốn gửi lời cảm ơn đến nhóm ImageNet, do Olga Russakovsky, Jia Deng và Li Fei-Fei dẫn đầu, vì đã tạo và duy trì tập dữ liệu ImageNet. Tập dữ liệu ImageNet10, mặc dù là một tập con nhỏ gọn, là một tài nguyên có giá trị để kiểm tra và gỡ lỗi nhanh trong cộng đồng nghiên cứu machine learning và computer vision. Để biết thêm thông tin về tập dữ liệu ImageNet và những người tạo ra nó, hãy truy cập trang web ImageNet.
Câu hỏi thường gặp (FAQ)
ImageNet10 là gì và nó khác biệt thế nào so với tập dữ liệu ImageNet đầy đủ?
Tập dữ liệu ImageNet10 là một tập con nhỏ gọn của cơ sở dữ liệu ImageNet gốc, được Ultralytics tạo ra để kiểm tra CI nhanh, kiểm tra tính hợp lệ và đánh giá pipeline huấn luyện. ImageNet10 chỉ bao gồm 20 hình ảnh, đại diện cho hình ảnh đầu tiên trong các tập huấn luyện và xác thực của 10 lớp đầu tiên trong ImageNet. Mặc dù kích thước nhỏ, nó vẫn duy trì cấu trúc và tính đa dạng của tập dữ liệu đầy đủ, giúp nó trở nên lý tưởng cho việc kiểm tra nhanh nhưng không dùng cho việc benchmark các model.
Làm cách nào tôi có thể sử dụng tập dữ liệu ImageNet10 để kiểm tra deep learning model của mình?
Để kiểm tra deep learning model của bạn trên tập dữ liệu ImageNet10 với kích thước ảnh 224x224, hãy sử dụng các đoạn code sau.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Tham khảo trang Training để biết danh sách đầy đủ các tham số khả dụng.
Tại sao tôi nên sử dụng tập dữ liệu ImageNet10 cho các bài kiểm tra CI và kiểm tra tính hợp lệ?
Tập dữ liệu ImageNet10 được thiết kế đặc biệt cho các bài kiểm tra CI, kiểm tra tính hợp lệ và các đánh giá nhanh trong các pipeline deep learning. Kích thước nhỏ của nó cho phép lặp lại và kiểm tra nhanh chóng, làm cho nó trở nên hoàn hảo cho các quy trình continuous integration nơi tốc độ là yếu tố then chốt. Bằng cách duy trì sự phức tạp về cấu trúc và tính đa dạng của tập dữ liệu ImageNet gốc, ImageNet10 cung cấp một dấu hiệu đáng tin cậy về chức năng cơ bản và tính chính xác của model mà không cần gánh nặng xử lý một tập dữ liệu lớn.
Các tính năng chính của tập dữ liệu ImageNet10 là gì?
Tập dữ liệu ImageNet10 có một vài tính năng chính:
- Kích thước nhỏ gọn: Chỉ với 20 hình ảnh, nó cho phép kiểm tra và gỡ lỗi nhanh chóng.
- Tổ chức có cấu trúc: Tuân theo hệ thống phân cấp WordNet, tương tự như tập dữ liệu ImageNet đầy đủ.
- CI và Kiểm tra tính hợp lệ: Đặc biệt phù hợp cho các bài kiểm tra continuous integration và kiểm tra tính hợp lệ.
- Không dùng để Benchmarking: Mặc dù hữu ích cho các đánh giá model nhanh, nó không được thiết kế cho việc benchmark chuyên sâu.
ImageNet10 so sánh thế nào với các tập dữ liệu nhỏ khác như ImageNette?
Mặc dù cả ImageNet10 và ImageNette đều là các tập con của ImageNet, chúng phục vụ các mục đích khác nhau. ImageNet10 chỉ chứa 20 hình ảnh (2 ảnh mỗi lớp) từ 10 lớp đầu tiên của ImageNet, làm cho nó cực kỳ nhẹ để kiểm tra CI và kiểm tra tính hợp lệ nhanh. Ngược lại, ImageNette chứa hàng nghìn hình ảnh trên 10 lớp dễ phân biệt, làm cho nó phù hợp hơn cho việc huấn luyện và phát triển model thực tế. ImageNet10 được thiết kế để xác minh chức năng pipeline, trong khi ImageNette tốt hơn cho các thử nghiệm huấn luyện có ý nghĩa nhưng nhanh hơn so với ImageNet đầy đủ.