Tập dữ liệu ImageWoof
Bộ dữ liệu ImageWoof là một tập hợp con của ImageNet bao gồm 10 lớp khó phân loại vì tất cả đều là giống chó. Nó được tạo ra như một nhiệm vụ khó hơn để các thuật toán phân loại hình ảnh giải quyết, nhằm mục đích khuyến khích phát triển các mô hình tiên tiến hơn.
Các tính năng chính
- ImageWoof chứa hình ảnh của 10 giống chó khác nhau: chó sục Úc, chó sục biên giới, Samoyed, Beagle, Shih-Tzu, English chó săn cáo, chó xoáy lưng Rhodesia, Dingo, Golden retriever và Old English chó chăn cừu.
- Bộ dữ liệu cung cấp hình ảnh ở các độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px), phù hợp với các khả năng tính toán và nhu cầu nghiên cứu khác nhau.
- Nó cũng bao gồm một phiên bản có nhãn nhiễu, cung cấp một kịch bản thực tế hơn, nơi nhãn có thể không phải lúc nào cũng đáng tin cậy.
Cấu trúc tập dữ liệu
Cấu trúc tập dữ liệu ImageWoof dựa trên các lớp giống chó, với mỗi giống có thư mục hình ảnh riêng.
Ứng dụng
Bộ dữ liệu ImageWoof được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, đặc biệt là khi nói đến các lớp phức tạp và tương tự hơn. Thách thức của bộ dữ liệu nằm ở sự khác biệt tinh tế giữa các giống chó, đẩy giới hạn hiệu suất và khái quát hóa của mô hình.
Sử dụng
Để đào tạo mô hình CNN trên tập dữ liệu ImageWoof trong 100 kỷ nguyên với kích thước hình ảnh là 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Biến thể tập dữ liệu
Bộ dữ liệu ImageWoof có ba kích thước khác nhau để đáp ứng các nhu cầu nghiên cứu và khả năng tính toán khác nhau:
Kích thước đầy đủ (imagewoof): Đây là phiên bản gốc của tập dữ liệu ImageWoof. Nó chứa hình ảnh kích thước đầy đủ và lý tưởng cho đào tạo cuối cùng và điểm chuẩn hiệu suất.
Kích thước trung bình (imagewoof320): Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 320 pixel. Nó phù hợp để đào tạo nhanh hơn mà không phải hy sinh đáng kể hiệu suất mô hình.
Kích thước nhỏ (imagewoof160): Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 160 pixel. Nó được thiết kế để tạo mẫu và thử nghiệm nhanh, trong đó tốc độ đào tạo là ưu tiên hàng đầu.
Để sử dụng các biến thể này trong quá trình đào tạo của bạn, chỉ cần thay thế 'imagewoof' trong đối số tập dữ liệu bằng 'imagewoof320' hoặc 'imagewoof160'. Chẳng hạn:
Ví dụ
Điều quan trọng cần lưu ý là việc sử dụng hình ảnh nhỏ hơn có thể sẽ mang lại hiệu suất thấp hơn về độ chính xác phân loại. Tuy nhiên, đó là một cách tuyệt vời để lặp lại nhanh chóng trong giai đoạn đầu phát triển và tạo mẫu mô hình.
Hình ảnh mẫu và chú thích
Bộ dữ liệu ImageWoof chứa hình ảnh đầy màu sắc của các giống chó khác nhau, cung cấp một bộ dữ liệu đầy thách thức cho các nhiệm vụ phân loại hình ảnh. Dưới đây là một số ví dụ về hình ảnh từ tập dữ liệu:
Ví dụ cho thấy sự khác biệt và tương đồng tinh tế giữa các giống chó khác nhau trong tập dữ liệu ImageWoof, làm nổi bật sự phức tạp và khó khăn của nhiệm vụ phân loại.
Trích dẫn và xác nhận
Nếu bạn sử dụng tập dữ liệu ImageWoof trong công việc nghiên cứu hoặc phát triển của mình, vui lòng đảm bảo ghi nhận những người tạo tập dữ liệu bằng cách liên kết đến kho lưu trữ tập dữ liệu chính thức.
Chúng tôi muốn cảm ơn nhóm FastAI đã tạo và duy trì bộ dữ liệu ImageWoof như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính . Để biết thêm thông tin về bộ dữ liệu ImageWoof, hãy truy cập kho lưu trữ bộ dữ liệu ImageWoof .
FAQ
Tập dữ liệu ImageWoof trong là gì Ultralytics?
Bộ dữ liệu ImageWoof là một tập hợp con đầy thách thức của ImageNet tập trung vào 10 giống chó cụ thể. Được tạo ra để đẩy giới hạn của các mô hình phân loại hình ảnh, nó có các giống như Beagle, Shih-Tzu và Golden Retriever. Bộ dữ liệu bao gồm hình ảnh ở các độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px) và thậm chí cả nhãn nhiễu cho các tình huống đào tạo thực tế hơn. Sự phức tạp này làm cho ImageWoof trở nên lý tưởng để phát triển các mô hình học sâu tiên tiến hơn.
Làm thế nào tôi có thể huấn luyện một mô hình bằng cách sử dụng tập dữ liệu ImageWoof với Ultralytics YOLO?
Để đào tạo mô hình Mạng nơ-ron tích chập (CNN) trên tập dữ liệu ImageWoof bằng cách sử dụng Ultralytics YOLO đối với 100 kỷ nguyên ở kích thước hình ảnh 224x224, bạn có thể sử dụng mã sau:
Ví dụ về tàu hỏa
Để biết thêm chi tiết về các đối số đào tạo có sẵn, hãy tham khảo trang Đào tạo .
Có những phiên bản nào của tập dữ liệu ImageWoof?
Tập dữ liệu ImageWoof có ba kích cỡ:
- Kích thước đầy đủ (imagewoof): Lý tưởng cho đào tạo cuối cùng và đo điểm chuẩn, chứa hình ảnh có kích thước đầy đủ.
- Kích thước trung bình (imagewoof320): Thay đổi kích thước hình ảnh với chiều dài cạnh tối đa là 320 pixel, phù hợp để đào tạo nhanh hơn.
- Kích thước nhỏ (imagewoof160): Thay đổi kích thước hình ảnh với chiều dài cạnh tối đa là 160 pixel, hoàn hảo để tạo mẫu nhanh.
Sử dụng các phiên bản này bằng cách thay thế 'imagewoof' trong đối số tập dữ liệu cho phù hợp. Tuy nhiên, lưu ý rằng hình ảnh nhỏ hơn có thể mang lại độ chính xác phân loại thấp hơn nhưng có thể hữu ích cho các lần lặp lại nhanh hơn.
Làm thế nào để các nhãn nhiễu trong tập dữ liệu ImageWoof mang lại lợi ích cho việc đào tạo?
Các nhãn nhiễu trong tập dữ liệu ImageWoof mô phỏng các điều kiện trong thế giới thực trong đó nhãn có thể không phải lúc nào cũng chính xác. Các mô hình đào tạo với dữ liệu này giúp phát triển tính mạnh mẽ và khái quát hóa trong các nhiệm vụ phân loại hình ảnh. Điều này chuẩn bị cho các mô hình để xử lý dữ liệu mơ hồ hoặc bị gắn nhãn sai một cách hiệu quả, điều thường gặp phải trong các ứng dụng thực tế.
Những thách thức chính của việc sử dụng tập dữ liệu ImageWoof là gì?
Thách thức chính của tập dữ liệu ImageWoof nằm ở sự khác biệt tinh tế giữa các giống chó mà nó bao gồm. Vì nó tập trung vào 10 giống chó có quan hệ gần gũi, việc phân biệt giữa chúng đòi hỏi các mô hình phân loại hình ảnh tiên tiến và tinh chỉnh hơn. Điều này khiến ImageWoof trở thành chuẩn mực tuyệt vời để kiểm tra khả năng và cải tiến của các mô hình học sâu .