Bỏ qua nội dung

Bộ dữ liệu ImageNet10

Bộ dữ liệu ImageNet10 là một tập hợp con quy mô nhỏ của cơ sở dữ liệu ImageNet , được phát triển bởi Ultralytics và được thiết kế cho các bài kiểm tra CI, kiểm tra tính hợp lý và kiểm tra nhanh các đường ống đào tạo. Bộ dữ liệu này bao gồm hình ảnh đầu tiên trong bộ đào tạo và hình ảnh đầu tiên từ bộ xác thực của 10 lớp đầu tiên trong ImageNet. Mặc dù nhỏ hơn đáng kể, nhưng nó vẫn giữ nguyên cấu trúc và tính đa dạng của bộ dữ liệu ImageNet gốc.

Các tính năng chính

  • ImageNet10 là phiên bản rút gọn của ImageNet, với 20 hình ảnh đại diện cho 10 lớp đầu tiên của tập dữ liệu gốc.
  • Bộ dữ liệu được tổ chức theo hệ thống phân cấp WordNet, phản ánh cấu trúc của toàn bộ bộ dữ liệu ImageNet.
  • Nó lý tưởng cho các bài kiểm tra CI, kiểm tra tính hợp lý và thử nghiệm nhanh các đường ống đào tạo trong các tác vụ thị giác máy tính .
  • Mặc dù không được thiết kế để đánh giá chuẩn mô hình, nhưng nó có thể cung cấp chỉ báo nhanh về chức năng cơ bản và tính chính xác của mô hình.

Cấu trúc tập dữ liệu

Bộ dữ liệu ImageNet10, giống như ImageNet gốc, được tổ chức bằng cách sử dụng hệ thống phân cấp WordNet. Mỗi lớp trong số 10 lớp trong ImageNet10 được mô tả bằng một synset (một tập hợp các thuật ngữ đồng nghĩa). Các hình ảnh trong ImageNet10 được chú thích bằng một hoặc nhiều synset, cung cấp một nguồn tài nguyên nhỏ gọn để thử nghiệm các mô hình để nhận dạng các đối tượng khác nhau và mối quan hệ của chúng.

Ứng dụng

Bộ dữ liệu ImageNet10 hữu ích cho việc kiểm tra và gỡ lỗi nhanh chóng các mô hình và đường ống thị giác máy tính. Kích thước nhỏ của nó cho phép lặp lại nhanh chóng, làm cho nó lý tưởng cho các thử nghiệm tích hợp liên tục và kiểm tra tính hợp lý. Nó cũng có thể được sử dụng để kiểm tra sơ bộ nhanh các mô hình mới hoặc thay đổi các mô hình hiện có trước khi chuyển sang thử nghiệm toàn diện với bộ dữ liệu ImageNet hoàn chỉnh.

Cách sử dụng

Để kiểm tra mô hình học sâu trên tập dữ liệu ImageNet10 với kích thước hình ảnh là 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.

Ví dụ kiểm tra

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Hình ảnh mẫu và chú thích

Bộ dữ liệu ImageNet10 chứa một tập hợp con các hình ảnh từ bộ dữ liệu ImageNet gốc. Những hình ảnh này được chọn để đại diện cho 10 lớp đầu tiên trong bộ dữ liệu, cung cấp một bộ dữ liệu đa dạng nhưng nhỏ gọn để kiểm tra và đánh giá nhanh chóng.

Hình ảnh mẫu của bộ dữ liệu Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu ImageNet10, nhấn mạnh tính hữu ích của nó trong việc kiểm tra tính hợp lý và thử nghiệm nhanh các mô hình thị giác máy tính.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu ImageNet10 trong công trình nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn bài báo gốc của ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Chúng tôi muốn cảm ơn nhóm ImageNet, do Olga Russakovsky, Jia Deng và Li Fei-Fei dẫn đầu, đã tạo ra và duy trì tập dữ liệu ImageNet. Tập dữ liệu ImageNet10, mặc dù là một tập hợp con nhỏ gọn, nhưng là một nguồn tài nguyên có giá trị để thử nghiệm và gỡ lỗi nhanh trong cộng đồng nghiên cứu về máy học và thị giác máy tính. Để biết thêm thông tin về tập dữ liệu ImageNet và những người tạo ra nó, hãy truy cập trang web ImageNet .

CÂU HỎI THƯỜNG GẶP

Bộ dữ liệu ImageNet10 là gì và nó khác với bộ dữ liệu ImageNet đầy đủ như thế nào?

Bộ dữ liệu ImageNet10 là một tập hợp con nhỏ gọn của cơ sở dữ liệu ImageNet gốc, được tạo bởi Ultralytics cho các bài kiểm tra CI nhanh, kiểm tra tính hợp lý và đánh giá đường ống đào tạo. ImageNet10 chỉ bao gồm 20 hình ảnh, đại diện cho hình ảnh đầu tiên trong các tập huấn luyện và xác thực của 10 lớp đầu tiên trong ImageNet. Mặc dù có kích thước nhỏ, nhưng nó vẫn duy trì cấu trúc và tính đa dạng của toàn bộ tập dữ liệu, khiến nó trở nên lý tưởng cho việc kiểm tra nhanh nhưng không phải để đánh giá chuẩn cho các mô hình.

Làm thế nào tôi có thể sử dụng bộ dữ liệu ImageNet10 để kiểm tra mô hình học sâu của mình?

Để kiểm tra mô hình học sâu của bạn trên tập dữ liệu ImageNet10 với kích thước hình ảnh là 224x224, hãy sử dụng đoạn mã sau.

Ví dụ kiểm tra

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Tham khảo trang Đào tạo để biết danh sách đầy đủ các đối số có sẵn.

Tại sao tôi nên sử dụng bộ dữ liệu ImageNet10 cho các thử nghiệm CI và kiểm tra tính hợp lý?

Bộ dữ liệu ImageNet10 được thiết kế dành riêng cho các bài kiểm tra CI, kiểm tra tính hợp lý và đánh giá nhanh trong các quy trình học sâu . Kích thước nhỏ của nó cho phép lặp lại và thử nghiệm nhanh chóng, khiến nó trở nên hoàn hảo cho các quy trình tích hợp liên tục trong đó tốc độ là yếu tố quan trọng. Bằng cách duy trì tính phức tạp về mặt cấu trúc và tính đa dạng của bộ dữ liệu ImageNet gốc, ImageNet10 cung cấp chỉ báo đáng tin cậy về chức năng cơ bản và tính chính xác của mô hình mà không cần phải xử lý một bộ dữ liệu lớn.

Những tính năng chính của bộ dữ liệu ImageNet10 là gì?

Bộ dữ liệu ImageNet10 có một số tính năng chính:

  • Kích thước nhỏ gọn : Chỉ với 20 hình ảnh, cho phép kiểm tra và gỡ lỗi nhanh chóng.
  • Tổ chức có cấu trúc : Tuân theo hệ thống phân cấp WordNet, tương tự như bộ dữ liệu ImageNet đầy đủ.
  • Kiểm tra CI và tính hợp lệ : Thích hợp cho các thử nghiệm tích hợp liên tục và kiểm tra tính hợp lệ.
  • Không dùng để đánh giá chuẩn : Mặc dù hữu ích cho việc đánh giá mô hình nhanh chóng, nhưng nó không được thiết kế để đánh giá chuẩn mở rộng.

Tôi có thể tải xuống bộ dữ liệu ImageNet10 ở đâu?

Bạn có thể tải xuống bộ dữ liệu ImageNet10 từ trang phát hành GitHub của Ultralytics . Để biết thông tin chi tiết hơn về cấu trúc và ứng dụng của nó, hãy tham khảo trang Bộ dữ liệu ImageNet10 .

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 2 tháng

Bình luận