Bỏ để qua phần nội dung

Tập dữ liệu ImageNette

Tập dữ liệu ImageNette là một tập hợp con của tập dữ liệu Imagenet lớn hơn, nhưng nó chỉ bao gồm 10 lớp dễ phân biệt. Nó được tạo ra để cung cấp một phiên bản Imagenet nhanh hơn, dễ sử dụng hơn để phát triển phần mềm và giáo dục.

Các tính năng chính

  • ImageNette chứa hình ảnh từ 10 lớp khác nhau như tench, English lò xo, máy cassette, cưa xích, nhà thờ, kèn Pháp, xe chở rác, bơm xăng, bóng golf, dù.
  • Bộ dữ liệu bao gồm các hình ảnh màu có kích thước khác nhau.
  • ImageNette được sử dụng rộng rãi để đào tạo và thử nghiệm trong lĩnh vực học máy, đặc biệt là cho các tác vụ phân loại hình ảnh.

Cấu trúc tập dữ liệu

Tập dữ liệu ImageNette được chia thành hai tập con:

  1. Training Set: Tập hợp con này chứa hàng nghìn hình ảnh được sử dụng để đào tạo các mô hình học máy. Số lượng chính xác khác nhau tùy theo lớp.
  2. Bộ xác nhận: Tập hợp con này bao gồm hàng trăm hình ảnh được sử dụng để xác nhận và đo điểm chuẩn cho các mô hình được đào tạo. Một lần nữa, số lượng chính xác khác nhau cho mỗi lớp.

Ứng dụng

Bộ dữ liệu ImageNette được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, chẳng hạn như Mạng nơ-ron tích chập (CNN) và nhiều thuật toán học máy khác. Định dạng đơn giản của tập dữ liệu và các lớp học được lựa chọn tốt làm cho nó trở thành một nguồn tài nguyên hữu ích cho cả những người mới bắt đầu và có kinh nghiệm trong lĩnh vực học máy và thị giác máy tính.

Sử dụng

Để huấn luyện mô hình trên tập dữ liệu ImageNette cho 100 kỷ nguyên với kích thước hình ảnh chuẩn là 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenette", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Hình ảnh mẫu và chú thích

Bộ dữ liệu ImageNette chứa hình ảnh màu của các đối tượng và cảnh khác nhau, cung cấp một bộ dữ liệu đa dạng cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ này cho thấy sự đa dạng và phức tạp của hình ảnh trong tập dữ liệu ImageNette, làm nổi bật tầm quan trọng của bộ dữ liệu đa dạng để đào tạo các mô hình phân loại hình ảnh mạnh mẽ.

ImageNette160 và ImageNette320

Để tạo mẫu và đào tạo nhanh hơn, tập dữ liệu ImageNette cũng có sẵn ở hai kích cỡ giảm: ImageNette160 và ImageNette320. Các bộ dữ liệu này duy trì các lớp và cấu trúc giống như tập dữ liệu ImageNette đầy đủ, nhưng hình ảnh được thay đổi kích thước thành kích thước nhỏ hơn. Do đó, các phiên bản này của tập dữ liệu đặc biệt hữu ích cho việc kiểm tra mô hình sơ bộ hoặc khi tài nguyên tính toán bị hạn chế.

Để sử dụng các bộ dữ liệu này, chỉ cần thay thế 'imagenette' bằng 'imagenette160' hoặc 'imagenette320' trong lệnh đào tạo. Các đoạn mã sau đây minh họa điều này:

Ví dụ về Tàu hỏa với ImageNetTE160

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model with ImageNette160
results = model.train(data="imagenette160", epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Ví dụ về Tàu hỏa với ImageNette320

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model with ImageNette320
results = model.train(data="imagenette320", epochs=100, imgsz=320)
# Start training from a pretrained *.pt model with ImageNette320
yolo detect train data=imagenette320 model=yolov8n-cls.pt epochs=100 imgsz=320

Các phiên bản nhỏ hơn của tập dữ liệu này cho phép lặp lại nhanh chóng trong quá trình phát triển trong khi vẫn cung cấp các nhiệm vụ phân loại hình ảnh có giá trị và thực tế.

Trích dẫn và xác nhận

Nếu bạn sử dụng tập dữ liệu ImageNette trong công việc nghiên cứu hoặc phát triển của mình, vui lòng xác nhận nó một cách thích hợp. Để biết thêm thông tin về tập dữ liệu ImageNette, hãy truy cập trang GitHub tập dữ liệu ImageNette.

FAQ

Tập dữ liệu ImageNette là gì?

Tập dữ liệu ImageNette là một tập hợp con đơn giản hóa của tập dữ liệu ImageNet lớn hơn, chỉ có 10 lớp dễ phân biệt như tench,English lò xo, và kèn Pháp. Nó được tạo ra để cung cấp một bộ dữ liệu dễ quản lý hơn để đào tạo và đánh giá hiệu quả các mô hình phân loại hình ảnh. Bộ dữ liệu này đặc biệt hữu ích cho mục đích phát triển phần mềm nhanh chóng và giáo dục trong học máy và thị giác máy tính.

Làm thế nào tôi có thể sử dụng tập dữ liệu ImageNette để đào tạo một YOLO mẫu?

Để đào tạo một YOLO mô hình trên tập dữ liệu ImageNette cho 100 kỷ nguyên, bạn có thể sử dụng các lệnh sau. Đảm bảo có Ultralytics YOLO môi trường được thiết lập.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenette", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Để biết thêm chi tiết, hãy xem trang tài liệu đào tạo .

Tại sao tôi nên sử dụng ImageNette cho các tác vụ phân loại hình ảnh?

Tập dữ liệu ImageNette có lợi thế vì một số lý do:

  • Nhanh chóng và đơn giản: Nó chỉ chứa 10 lớp, làm cho nó ít phức tạp và tốn thời gian hơn so với các bộ dữ liệu lớn hơn.
  • Sử dụng giáo dục: Lý tưởng cho việc học và giảng dạy những điều cơ bản về phân loại hình ảnh vì nó đòi hỏi ít sức mạnh và thời gian tính toán hơn.
  • Tính linh hoạt: Được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học máy khác nhau, đặc biệt là trong phân loại hình ảnh.

Để biết thêm chi tiết về đào tạo mô hình và quản lý tập dữ liệu, hãy khám phá phần Cấu trúc tập dữ liệu .

Tập dữ liệu ImageNette có thể được sử dụng với các kích thước hình ảnh khác nhau không?

Có, tập dữ liệu ImageNette cũng sẵn dùng trong hai phiên bản thay đổi kích thước: ImageNette160 và ImageNette320. Các phiên bản này giúp tạo mẫu nhanh hơn và đặc biệt hữu ích khi tài nguyên tính toán bị hạn chế.

Ví dụ về Tàu hỏa với ImageNetTE160

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")

# Train the model with ImageNette160
results = model.train(data="imagenette160", epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Để biết thêm thông tin, hãy tham khảo Đào tạo với ImageNette160 và ImageNette320.

Một số ứng dụng thực tế của tập dữ liệu ImageNette là gì?

Tập dữ liệu ImageNette được sử dụng rộng rãi trong:

  • Cài đặt giáo dục: Để giáo dục người mới bắt đầu về học máy và thị giác máy tính.
  • Phát triển phần mềm: Để tạo mẫu nhanh và phát triển các mô hình phân loại hình ảnh.
  • Nghiên cứu học sâu: Để đánh giá và đánh giá hiệu suất của các mô hình học sâu khác nhau, đặc biệt là Mạng nơ-ron tích chập (CNN).

Khám phá phần Ứng dụng để biết các trường hợp sử dụng chi tiết.



Đã tạo 2023-11-12, Cập nhật 2024-07-04
Tác giả: glenn-jocher (6)

Ý kiến