Bỏ để qua phần nội dung

Tập dữ liệu ImageWoof

Tập dữ liệu ImageWoof là một tập hợp con của ImageNet bao gồm 10 lớp rất khó phân loại, vì chúng đều là giống chó. Nó được tạo ra như một nhiệm vụ khó khăn hơn cho các thuật toán phân loại hình ảnh để giải quyết, nhằm khuyến khích phát triển các mô hình tiên tiến hơn.

Các tính năng chính

  • ImageWoof chứa hình ảnh của 10 giống chó khác nhau: chó sục Úc, chó sục biên giới, Samoyed, Beagle, Shih-Tzu, English chó săn cáo, chó xoáy lưng Rhodesia, Dingo, Golden retriever và Old English chó chăn cừu.
  • Bộ dữ liệu cung cấp hình ảnh ở các độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px), phù hợp với các khả năng tính toán và nhu cầu nghiên cứu khác nhau.
  • Nó cũng bao gồm một phiên bản có nhãn nhiễu, cung cấp một kịch bản thực tế hơn, nơi nhãn có thể không phải lúc nào cũng đáng tin cậy.

Cấu trúc tập dữ liệu

Cấu trúc tập dữ liệu ImageWoof dựa trên các lớp giống chó, với mỗi giống có thư mục hình ảnh riêng.

Ứng dụng

Bộ dữ liệu ImageWoof được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, đặc biệt là khi nói đến các lớp phức tạp và tương tự hơn. Thách thức của bộ dữ liệu nằm ở sự khác biệt tinh tế giữa các giống chó, đẩy giới hạn hiệu suất và khái quát hóa của mô hình.

Sử dụng

Để huấn luyện mô hình CNN trên tập dữ liệu ImageWoof cho 100 kỷ nguyên với kích thước hình ảnh 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Biến thể tập dữ liệu

Bộ dữ liệu ImageWoof có ba kích thước khác nhau để đáp ứng các nhu cầu nghiên cứu và khả năng tính toán khác nhau:

  1. Kích thước đầy đủ (imagewoof): Đây là phiên bản gốc của tập dữ liệu ImageWoof. Nó chứa hình ảnh kích thước đầy đủ và lý tưởng cho đào tạo cuối cùng và điểm chuẩn hiệu suất.

  2. Kích thước trung bình (imagewoof320): Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 320 pixel. Nó phù hợp để đào tạo nhanh hơn mà không phải hy sinh đáng kể hiệu suất mô hình.

  3. Kích thước nhỏ (imagewoof160): Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 160 pixel. Nó được thiết kế để tạo mẫu và thử nghiệm nhanh, trong đó tốc độ đào tạo là ưu tiên hàng đầu.

Để sử dụng các biến thể này trong quá trình đào tạo của bạn, chỉ cần thay thế 'imagewoof' trong đối số tập dữ liệu bằng 'imagewoof320' hoặc 'imagewoof160'. Chẳng hạn:

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

Điều quan trọng cần lưu ý là việc sử dụng hình ảnh nhỏ hơn có thể sẽ mang lại hiệu suất thấp hơn về độ chính xác phân loại. Tuy nhiên, đó là một cách tuyệt vời để lặp lại nhanh chóng trong giai đoạn đầu phát triển và tạo mẫu mô hình.

Hình ảnh mẫu và chú thích

Bộ dữ liệu ImageWoof chứa hình ảnh đầy màu sắc của các giống chó khác nhau, cung cấp một bộ dữ liệu đầy thách thức cho các nhiệm vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ cho thấy sự khác biệt và tương đồng tinh tế giữa các giống chó khác nhau trong tập dữ liệu ImageWoof, làm nổi bật sự phức tạp và khó khăn của nhiệm vụ phân loại.

Trích dẫn và xác nhận

Nếu bạn sử dụng tập dữ liệu ImageWoof trong công việc nghiên cứu hoặc phát triển của mình, vui lòng đảm bảo ghi nhận những người tạo tập dữ liệu bằng cách liên kết đến kho lưu trữ tập dữ liệu chính thức.

Chúng tôi muốn ghi nhận nhóm FastAI đã tạo và duy trì tập dữ liệu ImageWoof như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu ImageWoof, hãy truy cập kho dữ liệu ImageWoof.



Đã tạo 2023-11-12, Cập nhật 2023-12-03
Tác giả: glenn-jocher (3)

Ý kiến