Chuyển đến nội dung

Bộ dữ liệu ImageNet10

Bộ dữ liệu ImageNet10 là một tập con quy mô nhỏ của cơ sở dữ liệu ImageNet , được phát triển bởi Ultralytics và được thiết kế cho các bài kiểm tra CI, kiểm tra tính hợp lệ và kiểm tra nhanh các quy trình đào tạo. Bộ dữ liệu này bao gồm ảnh đầu tiên trong tập huấn luyện và ảnh đầu tiên từ tập xác thực của 10 lớp đầu tiên trong ImageNet Mặc dù nhỏ hơn đáng kể, nhưng nó vẫn giữ được cấu trúc và sự đa dạng của bản gốc ImageNet tập dữ liệu.

Các tính năng chính

  • ImageNet10 là phiên bản nhỏ gọn của ImageNet , với 20 hình ảnh đại diện cho 10 lớp đầu tiên của tập dữ liệu gốc.
  • Bộ dữ liệu được tổ chức theo hệ thống phân cấp WordNet, phản ánh cấu trúc của toàn bộ ImageNet tập dữ liệu.
  • Nó lý tưởng phù hợp cho các bài kiểm tra CI, kiểm tra tính hợp lệ và kiểm tra nhanh các quy trình huấn luyện trong các tác vụ thị giác máy tính.
  • Mặc dù không được thiết kế để đo điểm chuẩn mô hình, nhưng nó có thể cung cấp một chỉ báo nhanh về chức năng và tính chính xác cơ bản của mô hình.

Cấu trúc bộ dữ liệu

Bộ dữ liệu ImageNet10, giống như ImageNet gốc, được tổ chức theo hệ thống phân cấp WordNet. Mỗi lớp trong số 10 lớp trong ImageNet10 được mô tả bằng một synset (tập hợp các thuật ngữ đồng nghĩa). Các hình ảnh trong ImageNet10 được chú thích bằng một hoặc nhiều synset, cung cấp một nguồn tài nguyên nhỏ gọn để kiểm tra các mô hình nhằm nhận dạng các đối tượng khác nhau và mối quan hệ của chúng.

Các ứng dụng

Bộ dữ liệu ImageNet10 hữu ích cho việc kiểm tra và gỡ lỗi nhanh chóng các mô hình và quy trình thị giác máy tính. Kích thước nhỏ gọn cho phép lặp lại nhanh chóng, lý tưởng cho các bài kiểm tra tích hợp liên tục và kiểm tra tính hợp lý. Nó cũng có thể được sử dụng để kiểm tra sơ bộ nhanh các mô hình mới hoặc thay đổi các mô hình hiện có trước khi chuyển sang kiểm tra toàn diện với toàn bộ bộ dữ liệu ImageNet .

Cách sử dụng

Để kiểm tra mô hình deep learning trên bộ dữ liệu ImageNet10 với kích thước ảnh 224x224, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện mô hình.

Ví dụ kiểm tra

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Ảnh và Chú thích mẫu

Bộ dữ liệu ImageNet10 chứa một tập hợp con các hình ảnh từ bản gốc ImageNet tập dữ liệu. Những hình ảnh này được chọn để đại diện cho 10 lớp đầu tiên trong tập dữ liệu, cung cấp một tập dữ liệu đa dạng nhưng nhỏ gọn để kiểm tra và đánh giá nhanh chóng.

Hình ảnh mẫu bộ dữ liệu

Ví dụ này thể hiện sự đa dạng và phức tạp của hình ảnh trong bộ dữ liệu ImageNet10, làm nổi bật tính hữu ích của nó trong việc kiểm tra nhanh và kiểm tra tính đúng đắn của các mô hình thị giác máy tính.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng tập dữ liệu ImageNet10 trong công việc nghiên cứu hoặc phát triển của mình, vui lòng trích dẫn nguồn gốc ImageNet giấy:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Chúng tôi muốn ghi nhận ImageNet nhóm, do Olga Russakovsky, Jia Deng và Li Fei-Fei dẫn đầu, để tạo ra và duy trì ImageNet Bộ dữ liệu. Bộ dữ liệu ImageNet10, mặc dù là một tập hợp con nhỏ gọn, nhưng là một nguồn tài nguyên quý giá để kiểm tra và gỡ lỗi nhanh chóng trong cộng đồng nghiên cứu học máy và thị giác máy tính. Để biết thêm thông tin về ImageNet tập dữ liệu và những người tạo ra nó, hãy truy cập trang web ImageNet .

Câu hỏi thường gặp

Bộ dữ liệu ImageNet10 là gì và nó khác với bộ dữ liệu đầy đủ như thế nào? ImageNet tập dữ liệu?

Bộ dữ liệu ImageNet10 là một tập hợp con nhỏ gọn của cơ sở dữ liệu ImageNet gốc, được tạo bởi Ultralytics cho các bài kiểm tra CI nhanh, kiểm tra tính hợp lý và đánh giá quy trình đào tạo. ImageNet10 chỉ bao gồm 20 hình ảnh, đại diện cho hình ảnh đầu tiên trong tập huấn luyện và xác thực của 10 lớp đầu tiên trong ImageNet Mặc dù có kích thước nhỏ, nhưng nó vẫn duy trì được cấu trúc và tính đa dạng của toàn bộ tập dữ liệu, khiến nó trở nên lý tưởng cho việc thử nghiệm nhanh nhưng không phải để đánh giá chuẩn mô hình.

Làm thế nào để sử dụng bộ dữ liệu ImageNet10 để kiểm tra mô hình học sâu của tôi?

Để kiểm tra mô hình deep learning của bạn trên bộ dữ liệu ImageNet10 với kích thước ảnh 224x224, hãy sử dụng các đoạn mã sau.

Ví dụ kiểm tra

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Tham khảo trang Huấn luyện để có danh sách đầy đủ các đối số có sẵn.

Tại sao tôi nên sử dụng bộ dữ liệu ImageNet10 cho các bài kiểm tra CI và kiểm tra tính hợp lệ?

Bộ dữ liệu ImageNet10 được thiết kế đặc biệt cho các bài kiểm tra CI, kiểm tra tính hợp lý và đánh giá nhanh trong các quy trình học sâu . Kích thước nhỏ gọn cho phép lặp lại và kiểm tra nhanh chóng, hoàn hảo cho các quy trình tích hợp liên tục, nơi tốc độ là yếu tố then chốt. Bằng cách duy trì tính phức tạp và đa dạng về cấu trúc của bản gốc, bộ dữ liệu ImageNet10 ImageNet tập dữ liệu, ImageNet10 cung cấp chỉ báo đáng tin cậy về chức năng cơ bản và tính chính xác của mô hình mà không cần phải xử lý một tập dữ liệu lớn.

Các tính năng chính của bộ dữ liệu ImageNet10 là gì?

Bộ dữ liệu ImageNet10 có một số tính năng chính:

  • Kích thước Nhỏ gọn: Chỉ với 20 hình ảnh, nó cho phép kiểm tra và gỡ lỗi nhanh chóng.
  • Tổ chức có cấu trúc : Tuân theo hệ thống phân cấp WordNet, tương tự như hệ thống đầy đủ ImageNet tập dữ liệu.
  • CI và Kiểm tra Tính Hợp lý: Lý tưởng cho các bài kiểm tra tích hợp liên tục và kiểm tra tính hợp lý.
  • Không Dùng để Đánh Giá Hiệu Năng: Mặc dù hữu ích cho việc đánh giá nhanh mô hình, nhưng nó không được thiết kế để đánh giá hiệu năng một cách mở rộng.

ImageNet10 so sánh với các bộ dữ liệu nhỏ khác như ImageNette như thế nào?

Trong khi cả ImageNet10ImageNet đều là tập hợp con của ImageNet , chúng phục vụ các mục đích khác nhau. ImageNet10 chỉ chứa 20 hình ảnh (2 hình ảnh mỗi lớp) từ 10 lớp đầu tiên của ImageNet , giúp nó cực kỳ nhẹ cho việc kiểm tra CI và kiểm tra tính hợp lý nhanh chóng. Ngược lại, ImageNette chứa hàng ngàn hình ảnh thuộc 10 lớp dễ phân biệt, giúp nó phù hợp hơn cho việc đào tạo và phát triển mô hình thực tế. ImageNet10 được thiết kế để xác minh chức năng đường ống, trong khi ImageNette tốt hơn cho việc kiểm tra có ý nghĩa nhưng nhanh hơn toàn bộ. ImageNet thí nghiệm đào tạo.



📅 Đã tạo 2 năm trước ✏️ Cập nhật 8 tháng trước
glenn-jocherUltralyticsAssistantMatthewNoyceRizwanMunawarjk4e

Bình luận