Tập dữ liệu ImageNet10

Tập dữ liệu ImageNet10 là một tập hợp con quy mô nhỏ của cơ sở dữ liệu ImageNet , được phát triển bởi Ultralytics và được thiết kế để kiểm tra CI, kiểm tra sự tỉnh táo và kiểm tra nhanh các đường ống đào tạo. Tập dữ liệu này bao gồm hình ảnh đầu tiên trong tập huấn luyện và hình ảnh đầu tiên từ tập hợp xác thực của 10 lớp đầu tiên trong ImageNet. Mặc dù nhỏ hơn đáng kể, nó vẫn giữ được cấu trúc và sự đa dạng của tập dữ liệu ImageNet gốc.

Các tính năng chính

ImageNet10 là một phiên bản nhỏ gọn của ImageNet, với 20 hình ảnh đại diện cho 10 lớp đầu tiên của tập dữ liệu gốc.
Tập dữ liệu được tổ chức theo hệ thống phân cấp WordNet, phản ánh cấu trúc của tập dữ liệu ImageNet đầy đủ.
Nó phù hợp lý tưởng cho các bài kiểm tra CI, kiểm tra sự tỉnh táo và kiểm tra nhanh các đường ống đào tạo trong các tác vụ thị giác máy tính.
Mặc dù không được thiết kế để đo điểm chuẩn mô hình, nhưng nó có thể cung cấp một dấu hiệu nhanh chóng về chức năng cơ bản và tính chính xác của mô hình.

Cấu trúc tập dữ liệu

Tập dữ liệu ImageNet10, giống như ImageNet gốc, được tổ chức bằng cách sử dụng hệ thống phân cấp WordNet. Mỗi lớp trong số 10 lớp trong ImageNet10 được mô tả bởi một synset (một tập hợp các thuật ngữ đồng nghĩa). Các hình ảnh trong ImageNet10 được chú thích bằng một hoặc nhiều synset, cung cấp một tài nguyên nhỏ gọn cho các mô hình thử nghiệm để nhận ra các đối tượng khác nhau và mối quan hệ của chúng.

Ứng dụng

Bộ dữ liệu ImageNet10 rất hữu ích để nhanh chóng kiểm tra và gỡ lỗi các mô hình và đường ống thị giác máy tính. Kích thước nhỏ của nó cho phép lặp lại nhanh chóng, làm cho nó lý tưởng cho các bài kiểm tra tích hợp liên tục và kiểm tra sự tỉnh táo. Nó cũng có thể được sử dụng để thử nghiệm sơ bộ nhanh các mô hình mới hoặc thay đổi các mô hình hiện có trước khi chuyển sang thử nghiệm toàn diện với tập dữ liệu ImageNet hoàn chỉnh.

Sử dụng

Để kiểm tra mô hình deep learning trên tập dữ liệu ImageNet10 với kích thước hình ảnh là 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ kiểm tra

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Hình ảnh mẫu và chú thích

Tập dữ liệu ImageNet10 chứa một tập hợp con các hình ảnh từ tập dữ liệu ImageNet gốc. Những hình ảnh này được chọn để đại diện cho 10 lớp đầu tiên trong tập dữ liệu, cung cấp một bộ dữ liệu đa dạng nhưng nhỏ gọn để kiểm tra và đánh giá nhanh.

Hình ảnh mẫu tập dữ liệu Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong tập dữ liệu ImageNet10, làm nổi bật tính hữu ích của nó để kiểm tra sự tỉnh táo và kiểm tra nhanh các mô hình thị giác máy tính.

Trích dẫn và xác nhận

Nếu bạn sử dụng tập dữ liệu ImageNet10 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo gốc của ImageNet:

BibTeX

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Chúng tôi muốn ghi nhận nhóm ImageNet, dẫn đầu bởi Olga Russakovsky, Jia Deng và Li Fei-Fei, đã tạo và duy trì tập dữ liệu ImageNet. Bộ dữ liệu ImageNet10, trong khi một tập hợp con nhỏ gọn, là một nguồn tài nguyên quý giá để kiểm tra và gỡ lỗi nhanh trong cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu ImageNet và người tạo ra nó, hãy truy cập trang web ImageNet.

FAQ

Tập dữ liệu ImageNet10 là gì và nó khác với tập dữ liệu ImageNet đầy đủ như thế nào?

Tập dữ liệu ImageNet10 là một tập hợp con nhỏ gọn của cơ sở dữ liệu ImageNet gốc, được tạo bởi Ultralytics để xét nghiệm CI nhanh, kiểm tra sự tỉnh táo và đánh giá đường ống đào tạo. ImageNet10 chỉ bao gồm 20 hình ảnh, đại diện cho hình ảnh đầu tiên trong bộ đào tạo và xác nhận của 10 lớp đầu tiên trong ImageNet. Mặc dù kích thước nhỏ, nó duy trì cấu trúc và sự đa dạng của tập dữ liệu đầy đủ, làm cho nó lý tưởng để kiểm tra nhanh nhưng không phải cho các mô hình điểm chuẩn.

Làm thế nào tôi có thể sử dụng tập dữ liệu ImageNet10 để kiểm tra mô hình deep learning của tôi?

Để kiểm tra mô hình deep learning của bạn trên tập dữ liệu ImageNet10 với kích thước hình ảnh là 224x224, hãy sử dụng các đoạn mã sau.

Ví dụ kiểm tra

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Tham khảo trang Đào tạo để biết danh sách đầy đủ các đối số có sẵn.

Tại sao tôi nên sử dụng bộ dữ liệu ImageNet10 để kiểm tra CI và kiểm tra độ tỉnh táo?

Bộ dữ liệu ImageNet10 được thiết kế đặc biệt cho các bài kiểm tra CI, kiểm tra sự tỉnh táo và đánh giá nhanh trong các đường ống học sâu. Kích thước nhỏ của nó cho phép lặp lại và thử nghiệm nhanh chóng, làm cho nó hoàn hảo cho các quá trình tích hợp liên tục trong đó tốc độ là rất quan trọng. Bằng cách duy trì sự phức tạp và đa dạng về cấu trúc của tập dữ liệu ImageNet gốc, ImageNet10 cung cấp một dấu hiệu đáng tin cậy về chức năng cơ bản và tính chính xác của mô hình mà không cần chi phí xử lý một tập dữ liệu lớn.

Các tính năng chính của tập dữ liệu ImageNet10 là gì?

Tập dữ liệu ImageNet10 có một số tính năng chính:

Kích thước nhỏ gọn: Chỉ với 20 hình ảnh, nó cho phép kiểm tra và gỡ lỗi nhanh chóng.
Tổ chức có cấu trúc: Tuân theo hệ thống phân cấp WordNet, tương tự như tập dữ liệu ImageNet đầy đủ.
Kiểm tra CI và Sanity: Lý tưởng cho các bài kiểm tra tích hợp liên tục và kiểm tra sự tỉnh táo.
Không phải để đo điểm chuẩn: Mặc dù hữu ích cho việc đánh giá mô hình nhanh, nhưng nó không được thiết kế để đo điểm chuẩn rộng rãi.

Tôi có thể tải xuống tập dữ liệu ImageNet10 ở đâu?

Bạn có thể tải xuống tập dữ liệu ImageNet10 từ Ultralytics Trang phát hành GitHub. Để biết thêm thông tin chi tiết về cấu trúc và ứng dụng của nó, hãy tham khảo trang Tập dữ liệu ImageNet10 .

Đã tạo 2023-11-12, Cập nhật 2024-07-10
Tác giả: glenn-jocher (8)