Bộ dữ liệu ImageWoof
Bộ dữ liệu ImageWoof là một tập hợp con của ImageNet bao gồm 10 lớp khó phân loại vì tất cả đều là giống chó. Nó được tạo ra như một nhiệm vụ khó hơn để các thuật toán phân loại hình ảnh giải quyết, nhằm mục đích khuyến khích phát triển các mô hình tiên tiến hơn.
Các tính năng chính
- ImageWoof chứa hình ảnh của 10 giống chó khác nhau: chó sục Úc, chó sục biên giới, chó Samoyed, chó săn thỏ, chó Shih-Tzu, English chó săn cáo, chó săn lưng Rhodesian, chó Dingo, chó tha mồi vàng và chó Old English chó chăn cừu.
- Bộ dữ liệu cung cấp hình ảnh ở nhiều độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px), phù hợp với các khả năng tính toán và nhu cầu nghiên cứu khác nhau.
- Nó cũng bao gồm một phiên bản có nhãn nhiễu, cung cấp một kịch bản thực tế hơn khi nhãn không phải lúc nào cũng đáng tin cậy.
Cấu trúc tập dữ liệu
Cấu trúc tập dữ liệu ImageWoof dựa trên các lớp giống chó, trong đó mỗi giống chó có thư mục hình ảnh riêng.
Ứng dụng
Bộ dữ liệu ImageWoof được sử dụng rộng rãi để đào tạo và đánh giá các mô hình học sâu trong các tác vụ phân loại hình ảnh, đặc biệt là khi nói đến các lớp phức tạp và tương tự hơn. Thách thức của bộ dữ liệu nằm ở sự khác biệt tinh tế giữa các giống chó, đẩy giới hạn hiệu suất và khả năng khái quát của mô hình.
Cách sử dụng
Để đào tạo mô hình CNN trên tập dữ liệu ImageWoof trong 100 kỷ nguyên với kích thước hình ảnh là 224x224, bạn có thể sử dụng các đoạn mã sau. Để biết danh sách đầy đủ các đối số khả dụng, hãy tham khảo trang Đào tạo mô hình.
Ví dụ về tàu hỏa
Các biến thể của tập dữ liệu
Bộ dữ liệu ImageWoof có ba kích cỡ khác nhau để đáp ứng nhiều nhu cầu nghiên cứu và khả năng tính toán khác nhau:
-
Kích thước đầy đủ (imagewoof) : Đây là phiên bản gốc của tập dữ liệu ImageWoof. Nó chứa hình ảnh kích thước đầy đủ và lý tưởng cho việc đào tạo cuối cùng và đánh giá hiệu suất.
-
Kích thước trung bình (imagewoof320) : Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 320 pixel. Phiên bản này phù hợp để đào tạo nhanh hơn mà không làm giảm đáng kể hiệu suất của mô hình.
-
Kích thước nhỏ (imagewoof160) : Phiên bản này chứa hình ảnh được thay đổi kích thước để có chiều dài cạnh tối đa là 160 pixel. Phiên bản này được thiết kế để tạo mẫu nhanh và thử nghiệm, trong đó tốc độ đào tạo là ưu tiên hàng đầu.
Để sử dụng các biến thể này trong quá trình đào tạo của bạn, chỉ cần thay thế 'imagewoof' trong đối số tập dữ liệu bằng 'imagewoof320' hoặc 'imagewoof160'. Ví dụ:
Ví dụ
Điều quan trọng cần lưu ý là việc sử dụng hình ảnh nhỏ hơn có thể mang lại hiệu suất thấp hơn về độ chính xác phân loại. Tuy nhiên, đây là một cách tuyệt vời để lặp lại nhanh chóng trong giai đoạn đầu của quá trình phát triển mô hình và tạo mẫu.
Hình ảnh mẫu và chú thích
Bộ dữ liệu ImageWoof chứa các hình ảnh đầy màu sắc của nhiều giống chó khác nhau, cung cấp một bộ dữ liệu đầy thử thách cho các nhiệm vụ phân loại hình ảnh. Sau đây là một số ví dụ về hình ảnh từ bộ dữ liệu:
Ví dụ này cho thấy sự khác biệt và điểm tương đồng tinh tế giữa các giống chó khác nhau trong tập dữ liệu ImageWoof, làm nổi bật tính phức tạp và khó khăn của nhiệm vụ phân loại.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng bộ dữ liệu ImageWoof cho công việc nghiên cứu hoặc phát triển của mình, vui lòng ghi rõ nguồn gốc của bộ dữ liệu bằng cách liên kết đến kho lưu trữ dữ liệu chính thức .
Chúng tôi muốn cảm ơn nhóm FastAI đã tạo và duy trì bộ dữ liệu ImageWoof như một nguồn tài nguyên có giá trị cho cộng đồng nghiên cứu về máy học và thị giác máy tính . Để biết thêm thông tin về bộ dữ liệu ImageWoof, hãy truy cập kho lưu trữ bộ dữ liệu ImageWoof .
CÂU HỎI THƯỜNG GẶP
Bộ dữ liệu ImageWoof là gì? Ultralytics ?
Bộ dữ liệu ImageWoof là một tập hợp con đầy thách thức của ImageNet tập trung vào 10 giống chó cụ thể. Được tạo ra để đẩy giới hạn của các mô hình phân loại hình ảnh, nó có các giống chó như Beagle, Shih-Tzu và Golden Retriever. Bộ dữ liệu bao gồm các hình ảnh ở nhiều độ phân giải khác nhau (kích thước đầy đủ, 320px, 160px) và thậm chí cả nhãn nhiễu cho các tình huống đào tạo thực tế hơn. Sự phức tạp này khiến ImageWoof trở nên lý tưởng để phát triển các mô hình học sâu tiên tiến hơn.
Làm thế nào tôi có thể đào tạo một mô hình bằng cách sử dụng tập dữ liệu ImageWoof với Ultralytics YOLO ?
Để đào tạo mô hình Mạng nơ-ron tích chập (CNN) trên tập dữ liệu ImageWoof bằng cách sử dụng Ultralytics YOLO đối với 100 kỷ nguyên ở kích thước hình ảnh 224x224, bạn có thể sử dụng mã sau:
Ví dụ về tàu hỏa
Để biết thêm chi tiết về các đối số đào tạo có sẵn, hãy tham khảo trang Đào tạo .
Có những phiên bản nào của bộ dữ liệu ImageWoof?
Bộ dữ liệu ImageWoof có ba kích cỡ:
- Kích thước đầy đủ (imagewoof) : Lý tưởng cho mục đích đào tạo và đánh giá cuối cùng, chứa hình ảnh kích thước đầy đủ.
- Kích thước trung bình (imagewoof320) : Hình ảnh được thay đổi kích thước với độ dài cạnh tối đa là 320 pixel, phù hợp để đào tạo nhanh hơn.
- Kích thước nhỏ (imagewoof160) : Hình ảnh được thay đổi kích thước với độ dài cạnh tối đa là 160 pixel, hoàn hảo cho việc tạo mẫu nhanh.
Sử dụng các phiên bản này bằng cách thay thế 'imagewoof' trong đối số tập dữ liệu cho phù hợp. Tuy nhiên, lưu ý rằng hình ảnh nhỏ hơn có thể mang lại độ chính xác phân loại thấp hơn nhưng có thể hữu ích cho các lần lặp lại nhanh hơn.
Nhãn nhiễu trong tập dữ liệu ImageWoof có lợi ích gì cho việc đào tạo?
Nhãn nhiễu trong tập dữ liệu ImageWoof mô phỏng các điều kiện thực tế mà nhãn có thể không phải lúc nào cũng chính xác. Các mô hình đào tạo với dữ liệu này giúp phát triển tính mạnh mẽ và khái quát trong các tác vụ phân loại hình ảnh. Điều này chuẩn bị cho các mô hình xử lý dữ liệu mơ hồ hoặc có nhãn sai một cách hiệu quả, thường gặp trong các ứng dụng thực tế.
Những thách thức chính khi sử dụng bộ dữ liệu ImageWoof là gì?
Thách thức chính của tập dữ liệu ImageWoof nằm ở sự khác biệt tinh tế giữa các giống chó mà nó bao gồm. Vì nó tập trung vào 10 giống chó có quan hệ gần gũi, việc phân biệt giữa chúng đòi hỏi các mô hình phân loại hình ảnh tiên tiến và tinh chỉnh hơn. Điều này khiến ImageWoof trở thành chuẩn mực tuyệt vời để kiểm tra khả năng và cải tiến của các mô hình học sâu .