Bỏ để qua phần nội dung

Tập dữ liệu ImageWoof

Tập dữ liệu ImageWoof là một tập hợp con của ImageNet bao gồm 10 lớp rất khó phân loại, vì chúng đều là giống chó. Nó được tạo ra như một nhiệm vụ khó khăn hơn cho các thuật toán phân loại hình ảnh để giải quyết, nhằm khuyến khích phát triển các mô hình tiên tiến hơn.

Các tính năng chính

  • ImageWoof chứa hình ảnh của 10 giống chó khác nhau: chó sục Úc, chó sục biên giới, Samoyed, Beagle, Shih-Tzu, English chó săn cáo, chó xoáy lưng Rhodesia, Dingo, Golden retriever và Old English chó chăn cừu.
  • Bộ dữ liệu cung cấp hình ảnh ở các độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px), phù hợp với các khả năng tính toán và nhu cầu nghiên cứu khác nhau.
  • Nó cũng bao gồm một phiên bản có nhãn nhiễu, cung cấp một kịch bản thực tế hơn, nơi nhãn có thể không phải lúc nào cũng đáng tin cậy.

Cấu trúc tập dữ liệu

Cấu trúc tập dữ liệu ImageWoof dựa trên các lớp giống chó, với mỗi giống có thư mục hình ảnh riêng.

Ứng dụng

Bộ dữ liệu ImageWoof được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, đặc biệt là khi nói đến các lớp phức tạp và tương tự hơn. Thách thức của bộ dữ liệu nằm ở sự khác biệt tinh tế giữa các giống chó, đẩy giới hạn hiệu suất và khái quát hóa của mô hình.

Sử dụng

Để huấn luyện mô hình CNN trên tập dữ liệu ImageWoof cho 100 kỷ nguyên với kích thước hình ảnh 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số có sẵn, hãy tham khảo trang Đào tạo mẫu.

Ví dụ về tàu hỏa

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Biến thể tập dữ liệu

Bộ dữ liệu ImageWoof có ba kích thước khác nhau để đáp ứng các nhu cầu nghiên cứu và khả năng tính toán khác nhau:

  1. Kích thước đầy đủ (imagewoof): Đây là phiên bản gốc của tập dữ liệu ImageWoof. Nó chứa hình ảnh kích thước đầy đủ và lý tưởng cho đào tạo cuối cùng và điểm chuẩn hiệu suất.

  2. Kích thước trung bình (imagewoof320): Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 320 pixel. Nó phù hợp để đào tạo nhanh hơn mà không phải hy sinh đáng kể hiệu suất mô hình.

  3. Kích thước nhỏ (imagewoof160): Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 160 pixel. Nó được thiết kế để tạo mẫu và thử nghiệm nhanh, trong đó tốc độ đào tạo là ưu tiên hàng đầu.

Để sử dụng các biến thể này trong quá trình đào tạo của bạn, chỉ cần thay thế 'imagewoof' trong đối số tập dữ liệu bằng 'imagewoof320' hoặc 'imagewoof160'. Chẳng hạn:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Điều quan trọng cần lưu ý là việc sử dụng hình ảnh nhỏ hơn có thể sẽ mang lại hiệu suất thấp hơn về độ chính xác phân loại. Tuy nhiên, đó là một cách tuyệt vời để lặp lại nhanh chóng trong giai đoạn đầu phát triển và tạo mẫu mô hình.

Hình ảnh mẫu và chú thích

Bộ dữ liệu ImageWoof chứa hình ảnh đầy màu sắc của các giống chó khác nhau, cung cấp một bộ dữ liệu đầy thách thức cho các nhiệm vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:

Hình ảnh mẫu tập dữ liệu

Ví dụ cho thấy sự khác biệt và tương đồng tinh tế giữa các giống chó khác nhau trong tập dữ liệu ImageWoof, làm nổi bật sự phức tạp và khó khăn của nhiệm vụ phân loại.

Trích dẫn và xác nhận

Nếu bạn sử dụng tập dữ liệu ImageWoof trong công việc nghiên cứu hoặc phát triển của mình, vui lòng đảm bảo ghi nhận những người tạo tập dữ liệu bằng cách liên kết đến kho lưu trữ tập dữ liệu chính thức.

Chúng tôi muốn ghi nhận nhóm FastAI đã tạo và duy trì tập dữ liệu ImageWoof như một nguồn tài nguyên quý giá cho cộng đồng nghiên cứu thị giác máy và máy tính. Để biết thêm thông tin về tập dữ liệu ImageWoof, hãy truy cập kho dữ liệu ImageWoof.

FAQ

Tập dữ liệu ImageWoof trong là gì Ultralytics?

Bộ dữ liệu ImageWoof là một tập hợp con đầy thách thức của ImageNet tập trung vào 10 giống chó cụ thể. Được tạo ra để đẩy giới hạn của các mô hình phân loại hình ảnh, nó có các giống như Beagle, Shih-Tzu và Golden Retriever. Bộ dữ liệu bao gồm hình ảnh ở các độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px) và thậm chí cả nhãn nhiễu cho các tình huống đào tạo thực tế hơn. Sự phức tạp này làm cho ImageWoof trở nên lý tưởng để phát triển các mô hình học sâu tiên tiến hơn.

Làm thế nào tôi có thể huấn luyện một mô hình bằng cách sử dụng tập dữ liệu ImageWoof với Ultralytics YOLO?

Để đào tạo mô hình Mạng nơ-ron tích chập (CNN) trên tập dữ liệu ImageWoof bằng cách sử dụng Ultralytics YOLO Đối với 100 kỷ nguyên ở kích thước hình ảnh 224x224, bạn có thể sử dụng mã sau:

Ví dụ về tàu hỏa

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Để biết thêm chi tiết về các đối số đào tạo có sẵn, hãy tham khảo trang Đào tạo .

Có những phiên bản nào của tập dữ liệu ImageWoof?

Tập dữ liệu ImageWoof có ba kích cỡ:

  1. Kích thước đầy đủ (imagewoof): Lý tưởng cho đào tạo cuối cùng và đo điểm chuẩn, chứa hình ảnh có kích thước đầy đủ.
  2. Kích thước trung bình (imagewoof320): Thay đổi kích thước hình ảnh với chiều dài cạnh tối đa là 320 pixel, phù hợp để đào tạo nhanh hơn.
  3. Kích thước nhỏ (imagewoof160): Thay đổi kích thước hình ảnh với chiều dài cạnh tối đa là 160 pixel, hoàn hảo để tạo mẫu nhanh.

Sử dụng các phiên bản này bằng cách thay thế 'imagewoof' trong đối số tập dữ liệu tương ứng. Tuy nhiên, lưu ý rằng hình ảnh nhỏ hơn có thể mang lại độ chính xác phân loại thấp hơn nhưng có thể hữu ích cho các lần lặp nhanh hơn.

Làm thế nào để các nhãn nhiễu trong tập dữ liệu ImageWoof mang lại lợi ích cho việc đào tạo?

Các nhãn nhiễu trong tập dữ liệu ImageWoof mô phỏng các điều kiện trong thế giới thực trong đó nhãn có thể không phải lúc nào cũng chính xác. Các mô hình đào tạo với dữ liệu này giúp phát triển tính mạnh mẽ và khái quát hóa trong các nhiệm vụ phân loại hình ảnh. Điều này chuẩn bị cho các mô hình để xử lý dữ liệu mơ hồ hoặc bị gắn nhãn sai một cách hiệu quả, điều thường gặp phải trong các ứng dụng thực tế.

Những thách thức chính của việc sử dụng tập dữ liệu ImageWoof là gì?

Thách thức chính của bộ dữ liệu ImageWoof nằm ở sự khác biệt tinh tế giữa các giống chó mà nó bao gồm. Vì nó tập trung vào 10 giống có liên quan chặt chẽ, việc phân biệt giữa chúng đòi hỏi các mô hình phân loại hình ảnh tiên tiến và tinh chỉnh hơn. Điều này làm cho ImageWoof trở thành một điểm chuẩn tuyệt vời để kiểm tra khả năng và cải tiến của các mô hình học sâu.



Đã tạo 2023-11-12, Cập nhật 2024-07-04
Tác giả: glenn-jocher (6)

Ý kiến