Chuyển đến nội dung

Bộ dữ liệu ImageWoof

Bộ dữ liệu ImageWoof là một tập hợp con của ImageNet bao gồm 10 lớp khó phân loại, vì tất cả chúng đều là giống chó. Nó được tạo ra như một nhiệm vụ khó khăn hơn để các thuật toán phân loại hình ảnh giải quyết, nhằm khuyến khích sự phát triển của các mô hình tiên tiến hơn.

Các tính năng chính

  • ImageWoof chứa hình ảnh của 10 giống chó khác nhau: chó sục Úc, chó Border Terrier, chó Samoyed, chó Beagle, chó Shih-Tzu, chó săn cáo English, chó Rhodesian Ridgeback, chó Dingo, chó Golden Retriever và chó chăn cừu Old English.
  • Bộ dữ liệu cung cấp hình ảnh ở nhiều độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px), phù hợp với các khả năng tính toán và nhu cầu nghiên cứu khác nhau.
  • Nó cũng bao gồm một phiên bản với nhãn nhiễu, cung cấp một kịch bản thực tế hơn, nơi các nhãn có thể không phải lúc nào cũng đáng tin cậy.

Cấu trúc bộ dữ liệu

Cấu trúc bộ dữ liệu ImageWoof dựa trên các lớp giống chó, với mỗi giống có thư mục hình ảnh riêng. Tương tự như các bộ dữ liệu phân loại khác, nó tuân theo định dạng thư mục phân chia với các thư mục riêng biệt cho bộ huấn luyện và bộ xác thực.

Các ứng dụng

Bộ dữ liệu ImageWoof được sử dụng rộng rãi để huấn luyện và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, đặc biệt là khi nói đến các lớp phức tạp và tương tự hơn. Thách thức của bộ dữ liệu nằm ở sự khác biệt tinh tế giữa các giống chó, đẩy giới hạn hiệu suất và khả năng khái quát hóa của mô hình. Nó đặc biệt có giá trị cho:

  • Đánh giá hiệu năng của mô hình phân loại trên các danh mục chi tiết
  • Kiểm tra khả năng chống chịu của mô hình đối với các lớp có hình dạng tương tự
  • Phát triển các thuật toán có thể phân biệt sự khác biệt nhỏ về hình ảnh
  • Đánh giá khả năng chuyển giao học tập từ các miền tổng quát sang cụ thể

Cách sử dụng

Để huấn luyện mô hình CNN trên bộ dữ liệu ImageWoof trong 100 epochs với kích thước ảnh 224x224, bạn có thể sử dụng các đoạn mã sau. Để có danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Huấn luyện của mô hình.

Ví dụ huấn luyện

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Các biến thể của bộ dữ liệu

Bộ dữ liệu ImageWoof có ba kích cỡ khác nhau để phù hợp với các nhu cầu nghiên cứu và khả năng tính toán khác nhau:

  1. Kích thước đầy đủ (imagewoof): Đây là phiên bản gốc của bộ dữ liệu ImageWoof. Nó chứa hình ảnh kích thước đầy đủ và lý tưởng cho việc huấn luyện cuối cùng và đánh giá hiệu suất.

  2. Kích thước trung bình (imagewoof320): Phiên bản này chứa các hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 320 pixel. Nó phù hợp để đào tạo nhanh hơn mà không làm giảm đáng kể hiệu suất của mô hình.

  3. Kích thước nhỏ (imagewoof160): Phiên bản này chứa các hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 160 pixel. Nó được thiết kế để tạo mẫu và thử nghiệm nhanh, nơi tốc độ huấn luyện là ưu tiên hàng đầu.

Để sử dụng các biến thể này trong quá trình huấn luyện, chỉ cần thay thế 'imagewoof' trong đối số tập dữ liệu bằng 'imagewoof320' hoặc 'imagewoof160'. Ví dụ:

Ví dụ

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

Điều quan trọng cần lưu ý là việc sử dụng hình ảnh nhỏ hơn có thể sẽ làm giảm hiệu suất về độ chính xác của phân loại. Tuy nhiên, đó là một cách tuyệt vời để lặp lại nhanh chóng trong giai đoạn đầu phát triển và tạo mẫu mô hình.

Ảnh và Chú thích mẫu

Bộ dữ liệu ImageWoof chứa hình ảnh đầy màu sắc về nhiều giống chó khác nhau, cung cấp một bộ dữ liệu đầy thách thức cho các tác vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ bộ dữ liệu:

Ảnh mẫu bộ dữ liệu

Ví dụ này thể hiện sự khác biệt và tương đồng tinh tế giữa các giống chó khác nhau trong bộ dữ liệu ImageWoof, làm nổi bật sự phức tạp và khó khăn của nhiệm vụ phân loại.

Trích dẫn và Lời cảm ơn

Nếu bạn sử dụng bộ dữ liệu ImageWoof trong công việc nghiên cứu hoặc phát triển của mình, vui lòng đảm bảo ghi nhận những người tạo ra bộ dữ liệu bằng cách liên kết đến kho lưu trữ bộ dữ liệu chính thức.

Chúng tôi xin ghi nhận công lao của nhóm FastAI vì đã tạo ra và duy trì bộ dữ liệu ImageWoof như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu học máythị giác máy tính. Để biết thêm thông tin về bộ dữ liệu ImageWoof, hãy truy cập kho lưu trữ bộ dữ liệu ImageWoof.

Câu hỏi thường gặp

Bộ dữ liệu ImageWoof trong Ultralytics là gì?

Tập dữ liệu ImageWoof là một tập hợp con đầy thách thức của ImageNet, tập trung vào 10 giống chó cụ thể. Được tạo ra để đẩy giới hạn của các mô hình phân loại hình ảnh, nó có các giống chó như Beagle, Shih-Tzu và Golden Retriever. Tập dữ liệu bao gồm hình ảnh ở nhiều độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px) và thậm chí cả nhãn nhiễu cho các tình huống huấn luyện thực tế hơn. Sự phức tạp này làm cho ImageWoof trở nên lý tưởng để phát triển các mô hình deep learning tiên tiến hơn.

Làm thế nào để huấn luyện một mô hình bằng bộ dữ liệu ImageWoof với Ultralytics YOLO?

Để huấn luyện mô hình Mạng Nơ-ron Tích chập (CNN) trên bộ dữ liệu ImageWoof bằng Ultralytics YOLO trong 100 epochs với kích thước ảnh 224x224, bạn có thể sử dụng mã sau:

Ví dụ huấn luyện

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Để biết thêm chi tiết về các đối số huấn luyện có sẵn, hãy tham khảo trang Huấn luyện.

Những phiên bản nào của bộ dữ liệu ImageWoof có sẵn?

Bộ dữ liệu ImageWoof có ba kích cỡ:

  1. Kích thước đầy đủ (imagewoof): Lý tưởng cho việc huấn luyện cuối cùng và đánh giá chuẩn, chứa hình ảnh kích thước đầy đủ.
  2. Kích thước trung bình (imagewoof320): Hình ảnh được thay đổi kích thước với chiều dài cạnh tối đa là 320 pixel, phù hợp để đào tạo nhanh hơn.
  3. Kích thước nhỏ (imagewoof160): Hình ảnh được thay đổi kích thước với chiều dài cạnh tối đa là 160 pixel, hoàn hảo để tạo mẫu nhanh.

Sử dụng các phiên bản này bằng cách thay thế 'imagewoof' trong đối số tập dữ liệu cho phù hợp. Tuy nhiên, lưu ý rằng hình ảnh nhỏ hơn có thể làm giảm độ chính xác phân loại nhưng có thể hữu ích cho các lần lặp nhanh hơn.

Việc sử dụng nhãn nhiễu trong bộ dữ liệu ImageWoof mang lại lợi ích gì cho quá trình huấn luyện?

Nhãn nhiễu trong bộ dữ liệu ImageWoof mô phỏng các điều kiện thực tế, trong đó nhãn có thể không phải lúc nào cũng chính xác. Việc huấn luyện mô hình với dữ liệu này giúp phát triển tính mạnh mẽ và khả năng khái quát hóa trong các tác vụ phân loại hình ảnh. Điều này giúp các mô hình chuẩn bị để xử lý dữ liệu mơ hồ hoặc bị gắn nhãn sai một cách hiệu quả, thường gặp trong các ứng dụng thực tế.

Những thách thức chính khi sử dụng bộ dữ liệu ImageWoof là gì?

Thách thức chính của bộ dữ liệu ImageWoof nằm ở sự khác biệt tinh tế giữa các giống chó mà nó bao gồm. Vì nó tập trung vào 10 giống chó có liên quan chặt chẽ, nên việc phân biệt giữa chúng đòi hỏi các mô hình phân loại hình ảnh nâng cao và được tinh chỉnh hơn. Điều này làm cho ImageWoof trở thành một chuẩn mực tuyệt vời để kiểm tra khả năng và cải tiến của các mô hình học sâu.



📅 Đã tạo 1 năm trước ✏️ Cập nhật 5 tháng trước

Bình luận