Tập dữ liệu ImageWoof

Tập dữ liệu ImageWoof là một tập con của ImageNet bao gồm 10 lớp khó phân loại do tất cả đều là các giống chó. Nó được tạo ra như một bài toán khó hơn cho các thuật toán phân loại hình ảnh nhằm khuyến khích phát triển các model tiên tiến hơn.

Các tính năng chính

  • ImageWoof chứa hình ảnh của 10 giống chó khác nhau: Australian terrier, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever và Old English sheepdog.
  • Tập dữ liệu cung cấp hình ảnh ở các độ phân giải khác nhau (kích thước gốc, 320px, 160px), phù hợp với các khả năng tính toán và nhu cầu nghiên cứu khác nhau.
  • Nó cũng bao gồm một phiên bản với các nhãn nhiễu (noisy labels), cung cấp một kịch bản thực tế hơn nơi các nhãn có thể không phải lúc nào cũng đáng tin cậy.

Cấu trúc tập dữ liệu

Cấu trúc tập dữ liệu ImageWoof dựa trên các lớp giống chó, với mỗi giống chó có thư mục hình ảnh riêng. Tương tự như các tập dữ liệu phân loại khác, nó tuân theo định dạng chia tách thư mục với các thư mục riêng biệt cho tập huấn luyện và tập kiểm chứng.

Ứng dụng

Tập dữ liệu ImageWoof được sử dụng rộng rãi để huấn luyện và đánh giá các model deep learning trong các tác vụ phân loại hình ảnh, đặc biệt là đối với các lớp phức tạp và tương đồng hơn. Thách thức của tập dữ liệu nằm ở những khác biệt tinh tế giữa các giống chó, đẩy giới hạn về hiệu suất và khả năng tổng quát hóa của model. Nó đặc biệt có giá trị cho:

  • Đánh giá hiệu suất model phân loại trên các danh mục chi tiết
  • Kiểm tra độ bền vững của model đối với các lớp trông giống nhau
  • Phát triển các thuật toán có thể phân biệt những khác biệt trực quan tinh tế
  • Đánh giá khả năng transfer learning từ các miền chung sang miền cụ thể

Cách sử dụng

Để huấn luyện một model CNN trên tập dữ liệu ImageWoof trong 100 epoch với kích thước ảnh 224x224, bạn có thể sử dụng các đoạn code sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Training của model.

Ví dụ huấn luyện
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

Các biến thể tập dữ liệu

Tập dữ liệu ImageWoof có ba kích thước khác nhau để đáp ứng nhiều nhu cầu nghiên cứu và khả năng tính toán:

  1. Kích thước gốc (imagewoof): Đây là phiên bản gốc của tập dữ liệu ImageWoof. Nó chứa hình ảnh kích thước gốc và lý tưởng cho việc huấn luyện cuối cùng và đánh giá hiệu suất.

  2. Kích thước trung bình (imagewoof320): Phiên bản này chứa các hình ảnh đã được thay đổi kích thước để có chiều dài cạnh tối đa là 320 pixel. Nó phù hợp cho việc huấn luyện nhanh hơn mà không làm giảm đáng kể hiệu suất của model.

  3. Kích thước nhỏ (imagewoof160): Phiên bản này chứa các hình ảnh đã được thay đổi kích thước để có chiều dài cạnh tối đa là 160 pixel. Nó được thiết kế cho việc tạo mẫu nhanh và thử nghiệm nơi tốc độ huấn luyện được ưu tiên.

Để sử dụng các biến thể này trong quá trình huấn luyện, chỉ cần thay thế 'imagewoof' trong đối số tập dữ liệu bằng 'imagewoof320' hoặc 'imagewoof160'. Ví dụ:

Ví dụ
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Cần lưu ý rằng việc sử dụng ảnh nhỏ hơn có thể mang lại hiệu suất thấp hơn về độ chính xác phân loại. Tuy nhiên, đây là cách tuyệt vời để lặp lại nhanh chóng trong giai đoạn đầu phát triển và tạo mẫu model.

Hình ảnh và chú thích mẫu

Tập dữ liệu ImageWoof chứa các hình ảnh đầy màu sắc của nhiều giống chó khác nhau, cung cấp một tập dữ liệu đầy thử thách cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

ImageWoof dog breed classification dataset samples

Ví dụ này thể hiện những khác biệt và tương đồng tinh tế giữa các giống chó khác nhau trong tập dữ liệu ImageWoof, làm nổi bật sự phức tạp và độ khó của tác vụ phân loại.

Trích dẫn và Ghi nhận

Nếu bạn sử dụng tập dữ liệu ImageWoof trong công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi nhận các tác giả của tập dữ liệu bằng cách liên kết đến kho lưu trữ tập dữ liệu chính thức.

Chúng tôi xin gửi lời cảm ơn đến đội ngũ FastAI vì đã tạo và duy trì tập dữ liệu ImageWoof như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu machine learningcomputer vision. Để biết thêm thông tin về tập dữ liệu ImageWoof, hãy truy cập kho lưu trữ tập dữ liệu ImageWoof.

Câu hỏi thường gặp (FAQ)

Tập dữ liệu ImageWoof trong Ultralytics là gì?

Tập dữ liệu ImageWoof là một tập con đầy thách thức của ImageNet tập trung vào 10 giống chó cụ thể. Được tạo ra để đẩy giới hạn của các model phân loại hình ảnh, nó bao gồm các giống chó như Beagle, Shih-Tzu và Golden Retriever. Tập dữ liệu bao gồm hình ảnh ở nhiều độ phân giải (kích thước gốc, 320px, 160px) và thậm chí cả các nhãn nhiễu cho các kịch bản huấn luyện thực tế hơn. Sự phức tạp này làm cho ImageWoof trở nên lý tưởng để phát triển các model deep learning tiên tiến hơn.

Làm thế nào để tôi có thể huấn luyện một model bằng tập dữ liệu ImageWoof với Ultralytics YOLO?

Để huấn luyện một model Convolutional Neural Network (CNN) trên tập dữ liệu ImageWoof bằng Ultralytics YOLO trong 100 epoch với kích thước ảnh 224x224, bạn có thể sử dụng code sau:

Ví dụ huấn luyện
from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

Để biết thêm chi tiết về các đối số huấn luyện có sẵn, hãy tham khảo trang Training.

Những phiên bản nào của tập dữ liệu ImageWoof hiện có?

Tập dữ liệu ImageWoof có ba kích thước:

  1. Kích thước gốc (imagewoof): Lý tưởng cho việc huấn luyện cuối cùng và đánh giá, chứa các hình ảnh kích thước gốc.
  2. Kích thước trung bình (imagewoof320): Hình ảnh đã thay đổi kích thước với chiều dài cạnh tối đa là 320 pixel, phù hợp để huấn luyện nhanh hơn.
  3. Kích thước nhỏ (imagewoof160): Hình ảnh đã thay đổi kích thước với chiều dài cạnh tối đa là 160 pixel, hoàn hảo để tạo mẫu nhanh.

Sử dụng các phiên bản này bằng cách thay thế 'imagewoof' trong đối số tập dữ liệu cho phù hợp. Tuy nhiên, lưu ý rằng hình ảnh nhỏ hơn có thể mang lại độ chính xác phân loại thấp hơn nhưng có thể hữu ích cho việc lặp lại nhanh hơn.

Các nhãn nhiễu trong tập dữ liệu ImageWoof mang lại lợi ích gì cho việc huấn luyện?

Các nhãn nhiễu trong tập dữ liệu ImageWoof mô phỏng các điều kiện thực tế nơi các nhãn có thể không phải lúc nào cũng chính xác. Huấn luyện các model với dữ liệu này giúp phát triển độ bền vững và khả năng tổng quát hóa trong các tác vụ phân loại hình ảnh. Điều này chuẩn bị cho các model xử lý hiệu quả dữ liệu mơ hồ hoặc bị dán nhãn sai, điều thường gặp trong các ứng dụng thực tế.

Những thách thức chính khi sử dụng tập dữ liệu ImageWoof là gì?

Thách thức chính của tập dữ liệu ImageWoof nằm ở những khác biệt tinh tế giữa các giống chó mà nó bao gồm. Vì nó tập trung vào 10 giống chó có quan hệ gần gũi, việc phân biệt giữa chúng đòi hỏi các model phân loại hình ảnh tiên tiến và được tinh chỉnh kỹ lưỡng hơn. Điều này khiến ImageWoof trở thành một tiêu chuẩn tuyệt vời để kiểm tra khả năng và cải tiến của các model deep learning.

Bình luận