Bộ dữ liệu ImageNette
Bộ dữ liệu ImageNette là một tập hợp con của bộ dữ liệu Imagenet lớn hơn, nhưng nó chỉ bao gồm 10 lớp dễ phân biệt. Nó được tạo ra để cung cấp phiên bản Imagenet nhanh hơn, dễ sử dụng hơn cho phát triển phần mềm và giáo dục.
Các tính năng chính
- ImageNette chứa hình ảnh từ 10 lớp khác nhau như cá mú, English lò xo, máy nghe băng, cưa máy, nhà thờ, kèn cor, xe chở rác, máy bơm xăng, bóng gôn, dù.
- Bộ dữ liệu bao gồm các hình ảnh màu có nhiều kích thước khác nhau.
- ImageNette được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại hình ảnh.
Cấu trúc tập dữ liệu
Bộ dữ liệu ImageNette được chia thành hai tập hợp con:
- Bộ đào tạo : Tập hợp con này chứa hàng nghìn hình ảnh được sử dụng để đào tạo các mô hình học máy. Số lượng chính xác thay đổi tùy theo lớp.
- Bộ xác thực : Tập hợp con này bao gồm hàng trăm hình ảnh được sử dụng để xác thực và đánh giá chuẩn các mô hình đã được đào tạo. Một lần nữa, số lượng chính xác thay đổi theo từng lớp.
Ứng dụng
Bộ dữ liệu ImageNette được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Convolutional Neural Networks (CNN) và nhiều thuật toán học máy khác. Định dạng đơn giản và các lớp được lựa chọn kỹ lưỡng của bộ dữ liệu khiến nó trở thành một nguồn tài nguyên hữu ích cho cả người mới bắt đầu và những người có kinh nghiệm trong lĩnh vực học máy và thị giác máy tính.
Cách sử dụng
Để đào tạo mô hình trên tập dữ liệu ImageNette trong 100 kỷ nguyên với kích thước hình ảnh chuẩn là 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Hình ảnh mẫu và chú thích
Bộ dữ liệu ImageNette chứa các hình ảnh màu của nhiều đối tượng và cảnh khác nhau, cung cấp một bộ dữ liệu đa dạng cho các tác vụ phân loại hình ảnh . Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:
Ví dụ này cho thấy sự đa dạng và phức tạp của các hình ảnh trong tập dữ liệu ImageNette, nhấn mạnh tầm quan trọng của một tập dữ liệu đa dạng trong việc đào tạo các mô hình phân loại hình ảnh mạnh mẽ.
ImageNette160 và ImageNette320
Để tạo mẫu và đào tạo nhanh hơn, tập dữ liệu ImageNette cũng có sẵn ở hai kích thước giảm: ImageNette160 và ImageNette320. Các tập dữ liệu này duy trì cùng các lớp và cấu trúc như tập dữ liệu ImageNette đầy đủ, nhưng hình ảnh được thay đổi kích thước thành kích thước nhỏ hơn. Do đó, các phiên bản tập dữ liệu này đặc biệt hữu ích cho thử nghiệm mô hình sơ bộ hoặc khi tài nguyên tính toán bị hạn chế.
Để sử dụng các tập dữ liệu này, chỉ cần thay thế 'imagenette' bằng 'imagenette160' hoặc 'imagenette320' trong lệnh đào tạo. Các đoạn mã sau minh họa điều này:
Ví dụ đào tạo với ImageNette160
Ví dụ đào tạo với ImageNette320
Các phiên bản nhỏ hơn của tập dữ liệu này cho phép lặp lại nhanh chóng trong quá trình phát triển nhưng vẫn cung cấp các tác vụ phân loại hình ảnh có giá trị và thực tế.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng bộ dữ liệu ImageNette trong công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi nhận một cách thích hợp. Để biết thêm thông tin về bộ dữ liệu ImageNette, hãy truy cập trang GitHub của bộ dữ liệu ImageNette .
CÂU HỎI THƯỜNG GẶP
Bộ dữ liệu ImageNette là gì?
Bộ dữ liệu ImageNette là một tập hợp con được đơn giản hóa của bộ dữ liệu ImageNet lớn hơn, chỉ có 10 lớp dễ phân biệt như cá mú, English springer và French horn. Nó được tạo ra để cung cấp một tập dữ liệu dễ quản lý hơn cho việc đào tạo và đánh giá hiệu quả các mô hình phân loại hình ảnh. Tập dữ liệu này đặc biệt hữu ích cho mục đích phát triển phần mềm nhanh chóng và giáo dục trong học máy và thị giác máy tính.
Làm thế nào tôi có thể sử dụng tập dữ liệu ImageNette để đào tạo một YOLO người mẫu?
Để đào tạo một YOLO mô hình trên tập dữ liệu ImageNette cho 100 kỷ nguyên , bạn có thể sử dụng các lệnh sau. Đảm bảo có Ultralytics YOLO thiết lập môi trường.
Ví dụ về tàu hỏa
Để biết thêm chi tiết, hãy xem trang Tài liệu đào tạo .
Tại sao tôi nên sử dụng ImageNette cho nhiệm vụ phân loại hình ảnh?
Bộ dữ liệu ImageNette có lợi thế vì một số lý do:
- Nhanh chóng và đơn giản : Chỉ bao gồm 10 lớp, khiến nó ít phức tạp và tốn thời gian hơn so với các tập dữ liệu lớn hơn.
- Sử dụng trong giáo dục : Thích hợp cho việc học và giảng dạy những kiến thức cơ bản về phân loại hình ảnh vì nó đòi hỏi ít sức mạnh tính toán và thời gian hơn.
- Tính linh hoạt : Được sử dụng rộng rãi để đào tạo và đánh giá chuẩn nhiều mô hình học máy khác nhau, đặc biệt là trong phân loại hình ảnh.
Để biết thêm chi tiết về đào tạo mô hình và quản lý tập dữ liệu, hãy khám phá phần Cấu trúc tập dữ liệu .
Bộ dữ liệu ImageNette có thể sử dụng với nhiều kích thước hình ảnh khác nhau không?
Có, tập dữ liệu ImageNette cũng có sẵn ở hai phiên bản được thay đổi kích thước: ImageNette160 và ImageNette320. Các phiên bản này giúp tạo mẫu nhanh hơn và đặc biệt hữu ích khi tài nguyên tính toán bị hạn chế.
Ví dụ đào tạo với ImageNette160
Để biết thêm thông tin, hãy tham khảo Đào tạo với ImageNette160 và ImageNette320 .
Một số ứng dụng thực tế của bộ dữ liệu ImageNette là gì?
Bộ dữ liệu ImageNette được sử dụng rộng rãi trong:
- Cài đặt giáo dục : Đào tạo người mới bắt đầu về học máy và thị giác máy tính .
- Phát triển phần mềm : Dùng để tạo mẫu nhanh và phát triển các mô hình phân loại hình ảnh.
- Nghiên cứu học sâu : Đánh giá và so sánh hiệu suất của nhiều mô hình học sâu khác nhau, đặc biệt là Mạng nơ-ron tích chập (CNN).
Khám phá phần Ứng dụng để biết thông tin chi tiết về các trường hợp sử dụng.