Link to this sectionChiến lược thu thập và gán nhãn dữ liệu cho thị giác máy tính#
Link to this sectionGiới thiệu#
Chìa khóa thành công trong bất kỳ dự án thị giác máy tính nào đều bắt đầu bằng các chiến lược thu thập và gán nhãn dữ liệu hiệu quả. Chất lượng dữ liệu ảnh hưởng trực tiếp đến hiệu suất của model, vì vậy điều quan trọng là phải hiểu các phương pháp hay nhất liên quan đến việc thu thập và gán nhãn dữ liệu.
Watch: How to Build Effective Data Collection and Annotation Strategies for Computer Vision 🚀
Mọi cân nhắc liên quan đến dữ liệu cần phải bám sát mục tiêu dự án của bạn. Những thay đổi trong chiến lược gán nhãn có thể làm thay đổi trọng tâm hoặc hiệu quả của dự án và ngược lại. Với suy nghĩ đó, hãy cùng xem xét kỹ hơn các cách tốt nhất để tiếp cận việc thu thập và gán nhãn dữ liệu.
Link to this sectionThiết lập các lớp (class) và thu thập dữ liệu#
Việc thu thập hình ảnh và video cho dự án thị giác máy tính bao gồm xác định số lượng lớp, tìm nguồn dữ liệu và xem xét các hàm ý về đạo đức. Trước khi bắt đầu thu thập dữ liệu, bạn cần làm rõ:
Link to this sectionChọn các lớp phù hợp cho dự án của bạn#
Một trong những câu hỏi đầu tiên khi bắt đầu dự án thị giác máy tính là nên bao gồm bao nhiêu lớp. Bạn cần xác định tư cách thành viên của lớp, bao gồm các danh mục hoặc nhãn khác nhau mà bạn muốn model của mình nhận diện và phân biệt. Số lượng lớp nên được xác định bởi các mục tiêu cụ thể của dự án.
Ví dụ, nếu bạn muốn giám sát giao thông, các lớp của bạn có thể bao gồm "car" (ô tô), "truck" (xe tải), "bus" (xe buýt), "motorcycle" (xe máy) và "bicycle" (xe đạp). Mặt khác, để theo dõi các mặt hàng trong cửa hàng, các lớp của bạn có thể là "fruits" (trái cây), "vegetables" (rau củ), "beverages" (đồ uống) và "snacks" (đồ ăn nhẹ). Việc xác định các lớp dựa trên mục tiêu dự án giúp giữ cho tập dữ liệu của bạn luôn liên quan và tập trung.
Khi bạn xác định các lớp của mình, một sự phân biệt quan trọng khác cần thực hiện là chọn số lượng lớp thô hay mịn. 'Count' (Số lượng) đề cập đến số lượng các lớp riêng biệt mà bạn quan tâm. Quyết định này ảnh hưởng đến độ chi tiết của dữ liệu và độ phức tạp của model. Dưới đây là những cân nhắc cho từng phương pháp:
- Coarse Class-Count (Số lượng lớp thô): Đây là các danh mục rộng hơn, bao quát hơn, chẳng hạn như "vehicle" (phương tiện) và "non-vehicle" (phi phương tiện). Chúng giúp đơn giản hóa việc gán nhãn và yêu cầu ít tài nguyên tính toán hơn nhưng lại cung cấp ít thông tin chi tiết, có khả năng hạn chế hiệu quả của model trong các tình huống phức tạp.
- Fine Class-Count (Số lượng lớp mịn): Nhiều danh mục hơn với các sự phân biệt tinh tế hơn, chẳng hạn như "sedan" (xe sedan), "SUV", "pickup truck" (xe bán tải) và "motorcycle" (xe máy). Chúng nắm bắt được nhiều thông tin chi tiết hơn, cải thiện độ chính xác và hiệu suất của model. Tuy nhiên, việc gán nhãn mất nhiều thời gian và công sức hơn, đồng thời đòi hỏi nhiều tài nguyên tính toán hơn.
Bắt đầu với các lớp cụ thể hơn có thể rất hữu ích, đặc biệt là trong các dự án phức tạp nơi chi tiết là quan trọng. Các lớp cụ thể hơn cho phép bạn thu thập dữ liệu chi tiết hơn, đạt được thông tin chuyên sâu sâu sắc hơn và thiết lập sự khác biệt rõ ràng hơn giữa các danh mục. Nó không chỉ cải thiện độ chính xác của model mà còn giúp điều chỉnh model sau này dễ dàng hơn nếu cần, giúp tiết kiệm cả thời gian và tài nguyên.
Link to this sectionCác nguồn dữ liệu#
Bạn có thể sử dụng các tập dữ liệu công khai hoặc tự thu thập dữ liệu tùy chỉnh. Các tập dữ liệu công khai như trên Kaggle và Google Dataset Search Engine cung cấp dữ liệu được chuẩn hóa và gán nhãn tốt, khiến chúng trở thành điểm khởi đầu tuyệt vời để huấn luyện và xác thực các model.
Mặt khác, việc thu thập dữ liệu tùy chỉnh cho phép bạn tùy biến tập dữ liệu theo nhu cầu cụ thể của mình. Bạn có thể chụp ảnh và quay video bằng camera hoặc drone, thu thập hình ảnh từ web hoặc sử dụng dữ liệu nội bộ hiện có từ tổ chức của mình. Dữ liệu tùy chỉnh mang lại cho bạn nhiều quyền kiểm soát hơn về chất lượng và mức độ liên quan. Việc kết hợp cả nguồn dữ liệu công khai và tùy chỉnh giúp tạo ra một tập dữ liệu đa dạng và toàn diện.
Link to this sectionTránh sai lệch trong thu thập dữ liệu#
Sai lệch (bias) xảy ra khi một số nhóm hoặc tình huống nhất định bị thiếu hụt hoặc đại diện quá mức trong tập dữ liệu của bạn. Điều này dẫn đến một model hoạt động tốt trên dữ liệu này nhưng lại kém trên dữ liệu khác. Việc tránh bias trong AI là rất quan trọng để model thị giác máy tính của bạn có thể hoạt động tốt trong nhiều tình huống khác nhau.
Đây là cách bạn có thể tránh sai lệch khi thu thập dữ liệu:
- Nguồn đa dạng: Thu thập dữ liệu từ nhiều nguồn để nắm bắt các quan điểm và tình huống khác nhau.
- Đại diện cân bằng: Bao gồm sự đại diện cân bằng từ tất cả các nhóm liên quan. Ví dụ, hãy xem xét các độ tuổi, giới tính và sắc tộc khác nhau.
- Giám sát liên tục: Thường xuyên đánh giá và cập nhật tập dữ liệu của bạn để xác định và giải quyết bất kỳ sai lệch nào mới phát sinh.
- Kỹ thuật giảm thiểu sai lệch: Sử dụng các phương pháp như lấy mẫu quá mức (oversampling) cho các lớp bị thiếu hụt, data augmentation và các thuật toán nhận thức công bằng.
Việc tuân theo các thực tiễn này giúp tạo ra một model mạnh mẽ và công bằng hơn, có khả năng khái quát hóa tốt trong các ứng dụng thực tế.
Link to this sectionData Annotation là gì?#
Data annotation là quá trình gán nhãn dữ liệu để làm cho dữ liệu đó có thể sử dụng được cho việc huấn luyện các model machine learning. Trong thị giác máy tính, điều này có nghĩa là gán nhãn cho hình ảnh hoặc video bằng thông tin mà model cần để học hỏi. Nếu không có dữ liệu được gán nhãn đúng cách, các model không thể học chính xác mối quan hệ giữa đầu vào và đầu ra.
Link to this sectionCác loại Data Annotation#
Tùy thuộc vào các yêu cầu cụ thể của một tác vụ thị giác máy tính, có các loại gán nhãn dữ liệu khác nhau. Dưới đây là một số ví dụ:
- Bounding Boxes: Các hộp hình chữ nhật được vẽ xung quanh các đối tượng trong hình ảnh, chủ yếu được sử dụng cho các tác vụ phát hiện đối tượng (object detection). Các hộp này được xác định bởi tọa độ trên cùng bên trái và dưới cùng bên phải của chúng.
- Polygons: Các đường viền chi tiết cho đối tượng, cho phép gán nhãn chính xác hơn so với bounding box. Polygons được sử dụng trong các tác vụ như instance segmentation, nơi hình dạng của đối tượng là quan trọng.
- Masks: Các mặt nạ nhị phân (binary masks) trong đó mỗi pixel là một phần của đối tượng hoặc nền. Masks được sử dụng trong các tác vụ semantic segmentation để cung cấp chi tiết ở cấp độ pixel.
- Keypoints: Các điểm cụ thể được đánh dấu trong hình ảnh để xác định vị trí quan tâm. Keypoints được sử dụng trong các tác vụ như pose estimation và phát hiện đặc điểm khuôn mặt.
Link to this sectionCác định dạng gán nhãn phổ biến#
Sau khi chọn loại gán nhãn, điều quan trọng là phải chọn định dạng thích hợp để lưu trữ và chia sẻ các nhãn đó.
Các định dạng thường được sử dụng bao gồm COCO, hỗ trợ nhiều loại gán nhãn khác nhau như object detection, phát hiện điểm khóa (keypoint detection), stuff segmentation, panoptic segmentation và chú thích hình ảnh, được lưu trữ dưới dạng JSON. Pascal VOC sử dụng tệp XML và rất phổ biến cho các tác vụ phát hiện đối tượng. Mặt khác, YOLO tạo một tệp .txt cho mỗi hình ảnh, chứa các nhãn như lớp đối tượng, tọa độ, chiều cao và chiều rộng, làm cho nó phù hợp cho việc phát hiện đối tượng.
Link to this sectionCác kỹ thuật gán nhãn#
Bây giờ, giả sử bạn đã chọn loại gán nhãn và định dạng, đã đến lúc thiết lập các quy tắc gán nhãn rõ ràng và khách quan. Những quy tắc này giống như một lộ trình cho sự nhất quán và độ chính xác trong suốt quá trình gán nhãn. Các khía cạnh chính của các quy tắc này bao gồm:
- Rõ ràng và chi tiết: Đảm bảo hướng dẫn của bạn rõ ràng. Sử dụng các ví dụ và hình ảnh minh họa để cho thấy những gì được mong đợi.
- Tính nhất quán: Giữ cho các nhãn của bạn đồng nhất. Thiết lập các tiêu chuẩn cho việc gán nhãn các loại dữ liệu khác nhau để tất cả các nhãn đều tuân theo cùng một quy tắc.
- Giảm thiểu sai lệch: Hãy trung lập. Tự rèn luyện để khách quan và giảm thiểu các sai lệch cá nhân nhằm đảm bảo việc gán nhãn công bằng.
- Hiệu quả: Làm việc thông minh hơn, không vất vả hơn. Sử dụng các công cụ và quy trình làm việc tự động hóa các tác vụ lặp đi lặp lại, giúp quá trình gán nhãn nhanh hơn và hiệu quả hơn.
Việc thường xuyên đánh giá và cập nhật các quy tắc gán nhãn sẽ giúp giữ cho các nhãn của bạn chính xác, nhất quán và phù hợp với mục tiêu dự án của bạn.
Link to this sectionCác công cụ gán nhãn phổ biến#
Giả sử bây giờ bạn đã sẵn sàng gán nhãn. Có một số công cụ mã nguồn mở có sẵn để giúp hợp lý hóa quá trình gán nhãn dữ liệu. Dưới đây là một số công cụ gán nhãn mở hữu ích:
- Label Studio: Một công cụ linh hoạt hỗ trợ nhiều tác vụ gán nhãn và bao gồm các tính năng quản lý dự án và kiểm soát chất lượng.
- CVAT: Một công cụ mạnh mẽ hỗ trợ nhiều định dạng gán nhãn và quy trình làm việc có thể tùy chỉnh, giúp nó phù hợp cho các dự án phức tạp.
- Labelme: Một công cụ đơn giản và dễ sử dụng cho phép gán nhãn hình ảnh nhanh chóng với các đa giác (polygon), khiến nó trở nên lý tưởng cho các tác vụ đơn giản.
- LabelImg: Một công cụ gán nhãn hình ảnh đồ họa dễ sử dụng, đặc biệt hữu ích để tạo các nhãn bounding box ở định dạng YOLO.
Các công cụ mã nguồn mở này thân thiện với ngân sách và cung cấp một loạt các tính năng để đáp ứng các nhu cầu gán nhãn khác nhau. Ultralytics Platform cũng cung cấp một trình chỉnh sửa gán nhãn tích hợp hỗ trợ các nhãn phát hiện, instance segmentation, pose, OBB và phân loại với tính năng gán nhãn thông minh được hỗ trợ bởi SAM cho các tác vụ không gian.
Link to this sectionMột vài điều cần cân nhắc thêm trước khi gán nhãn dữ liệu#
Trước khi bạn bắt đầu gán nhãn dữ liệu, có một vài điều nữa cần lưu ý. Bạn nên biết về độ chính xác, độ chuẩn xác, các giá trị ngoại lai (outliers) và kiểm soát chất lượng để tránh gán nhãn dữ liệu theo cách phản tác dụng.
Link to this sectionHiểu về độ chính xác và độ chuẩn xác#
Điều quan trọng là phải hiểu sự khác biệt giữa độ chính xác và độ chuẩn xác và cách chúng liên quan đến việc gán nhãn. Accuracy (Độ chính xác) đề cập đến việc dữ liệu được gán nhãn gần với giá trị thực như thế nào. Nó giúp chúng ta đo lường mức độ các nhãn phản ánh sát với các tình huống thực tế. Precision (Độ chuẩn xác) cho biết tính nhất quán của các nhãn. Nó kiểm tra xem bạn có đang gán cùng một nhãn cho cùng một đối tượng hoặc đặc điểm trong toàn bộ tập dữ liệu hay không. Độ chính xác và độ chuẩn xác cao dẫn đến các model được huấn luyện tốt hơn bằng cách giảm nhiễu và cải thiện khả năng khái quát hóa của model từ dữ liệu huấn luyện.
Link to this sectionXác định các giá trị ngoại lai (Outliers)#
Outliers là các điểm dữ liệu lệch khá nhiều so với các quan sát khác trong tập dữ liệu. Liên quan đến các nhãn, một outlier có thể là một hình ảnh được gán nhãn không chính xác hoặc một nhãn không phù hợp với phần còn lại của tập dữ liệu. Các outlier rất đáng lo ngại vì chúng có thể làm méo mó quá trình học của model, dẫn đến các dự đoán không chính xác và khả năng khái quát hóa kém.
Bạn có thể sử dụng nhiều phương pháp khác nhau để phát hiện và sửa các outlier:
- Kỹ thuật thống kê: Để phát hiện các outlier trong các đặc điểm số như giá trị pixel, tọa độ bounding box hoặc kích thước đối tượng, bạn có thể sử dụng các phương pháp như biểu đồ hộp (box plots), biểu đồ tần suất (histograms) hoặc z-scores.
- Kỹ thuật hình ảnh: Để phát hiện các bất thường trong các đặc điểm phân loại như lớp đối tượng, màu sắc hoặc hình dạng, hãy sử dụng các phương pháp trực quan như vẽ hình ảnh, nhãn hoặc bản đồ nhiệt (heat maps).
- Phương pháp thuật toán: Sử dụng các công cụ như phân cụm (ví dụ: phân cụm K-means, DBSCAN) và các thuật toán phát hiện bất thường để xác định các outlier dựa trên các mẫu phân phối dữ liệu.
Link to this sectionKiểm soát chất lượng dữ liệu được gán nhãn#
Cũng giống như các dự án kỹ thuật khác, kiểm soát chất lượng là bắt buộc đối với dữ liệu được gán nhãn. Thực hành tốt là thường xuyên kiểm tra các nhãn để đảm bảo chúng chính xác và nhất quán. Việc này có thể được thực hiện theo một vài cách khác nhau:
- Đánh giá các mẫu dữ liệu được gán nhãn
- Sử dụng các công cụ tự động để phát hiện các lỗi phổ biến
- Yêu cầu người khác kiểm tra lại các nhãn
Nếu bạn đang làm việc với nhiều người, sự nhất quán giữa các người gán nhãn khác nhau là rất quan trọng. Sự đồng thuận tốt giữa những người gán nhãn có nghĩa là các hướng dẫn rõ ràng và mọi người đều đang tuân theo chúng theo cùng một cách. Nó giữ cho mọi người cùng làm việc trên một hướng và các nhãn nhất quán.
Trong khi đánh giá, nếu bạn tìm thấy lỗi, hãy sửa chúng và cập nhật các hướng dẫn để tránh những sai lầm trong tương lai. Cung cấp phản hồi cho người gán nhãn và cung cấp đào tạo thường xuyên để giúp giảm thiểu lỗi. Có một quy trình mạnh mẽ để xử lý các lỗi giúp giữ cho tập dữ liệu của bạn chính xác và đáng tin cậy.
Link to this sectionCác chiến lược gán nhãn dữ liệu hiệu quả#
Để làm cho quá trình gán nhãn dữ liệu suôn sẻ và hiệu quả hơn, hãy cân nhắc triển khai các chiến lược sau:
- Hướng dẫn gán nhãn rõ ràng: Cung cấp hướng dẫn chi tiết với các ví dụ để đảm bảo tất cả những người gán nhãn hiểu các tác vụ một cách nhất quán. Ví dụ, khi gán nhãn cho các loài chim, hãy chỉ định xem có nên bao gồm toàn bộ con chim hay chỉ các bộ phận cụ thể.
- Kiểm tra chất lượng thường xuyên: Thiết lập các điểm chuẩn và sử dụng các số liệu cụ thể để xem xét công việc, duy trì các tiêu chuẩn cao thông qua phản hồi liên tục.
- Sử dụng các công cụ gán nhãn trước: Nhiều nền tảng gán nhãn hiện đại cung cấp các tính năng gán nhãn trước có sự hỗ trợ của AI, có thể tăng tốc đáng kể quá trình này bằng cách tự động tạo các nhãn ban đầu mà con người sau đó có thể tinh chỉnh.
- Triển khai Active Learning: Phương pháp này ưu tiên gán nhãn cho các mẫu thông tin nhất trước, điều này có thể làm giảm tổng số lượng nhãn cần thiết trong khi vẫn duy trì hiệu suất của model.
- Xử lý theo lô: Nhóm các hình ảnh tương tự lại với nhau để gán nhãn nhằm duy trì tính nhất quán và cải thiện hiệu quả.
Các chiến lược này có thể giúp duy trì các nhãn chất lượng cao trong khi giảm thời gian và tài nguyên cần thiết cho quá trình gán nhãn.
Link to this sectionChia sẻ suy nghĩ của bạn với cộng đồng#
Việc trao đổi ý tưởng và câu hỏi của bạn với những người đam mê thị giác máy tính khác có thể giúp tăng tốc dự án của bạn. Dưới đây là một số cách tuyệt vời để học hỏi, khắc phục sự cố và kết nối:
Link to this sectionNơi tìm sự trợ giúp và hỗ trợ#
- GitHub Issues: Truy cập kho lưu trữ YOLO26 trên GitHub và sử dụng tab Issues để nêu câu hỏi, báo cáo lỗi và đề xuất các tính năng. Cộng đồng và các quản trị viên ở đó để giúp đỡ với bất kỳ vấn đề nào bạn gặp phải.
- Máy chủ Discord của Ultralytics: Tham gia máy chủ Discord của Ultralytics để kết nối với những người dùng và nhà phát triển khác, nhận hỗ trợ, chia sẻ kiến thức và cùng suy nghĩ về các ý tưởng.
Link to this sectionTài liệu chính thức#
- Tài liệu Ultralytics YOLO26: Tham khảo tài liệu YOLO26 chính thức để có các hướng dẫn kỹ lưỡng và thông tin chi tiết có giá trị về nhiều tác vụ và dự án thị giác máy tính.
Link to this sectionKết luận#
Bằng cách tuân theo các thực tiễn tốt nhất để thu thập và gán nhãn dữ liệu, tránh sai lệch và sử dụng các công cụ và kỹ thuật phù hợp, bạn có thể cải thiện đáng kể hiệu suất của model. Việc tham gia với cộng đồng và sử dụng các tài nguyên có sẵn sẽ giúp bạn luôn được thông tin và giúp bạn khắc phục sự cố một cách hiệu quả. Hãy nhớ rằng, dữ liệu chất lượng là nền tảng của một dự án thành công và các chiến lược đúng đắn sẽ giúp bạn xây dựng các model mạnh mẽ và đáng tin cậy.
Link to this sectionCâu hỏi thường gặp (FAQ)#
Link to this sectionCách tốt nhất để tránh sai lệch trong thu thập dữ liệu cho các dự án thị giác máy tính là gì?#
Tránh sai lệch trong thu thập dữ liệu đảm bảo rằng model thị giác máy tính của bạn hoạt động tốt trong nhiều tình huống khác nhau. Để giảm thiểu sai lệch, hãy cân nhắc thu thập dữ liệu từ các nguồn đa dạng để nắm bắt các quan điểm và tình huống khác nhau. Đảm bảo sự đại diện cân bằng giữa tất cả các nhóm liên quan, chẳng hạn như các độ tuổi, giới tính và sắc tộc khác nhau. Thường xuyên đánh giá và cập nhật tập dữ liệu của bạn để xác định và giải quyết bất kỳ sai lệch nào mới phát sinh. Các kỹ thuật như lấy mẫu quá mức cho các lớp bị thiếu hụt, data augmentation và các thuật toán nhận thức công bằng cũng có thể giúp giảm thiểu sai lệch. Bằng cách áp dụng các chiến lược này, bạn duy trì một tập dữ liệu mạnh mẽ và công bằng giúp nâng cao khả năng khái quát hóa của model.
Link to this sectionLàm thế nào tôi có thể đảm bảo tính nhất quán và độ chính xác cao trong gán nhãn dữ liệu?#
Việc đảm bảo tính nhất quán và độ chính xác cao trong gán nhãn dữ liệu bao gồm việc thiết lập các hướng dẫn gán nhãn rõ ràng và khách quan. Hướng dẫn của bạn phải chi tiết, kèm theo các ví dụ và hình ảnh minh họa để làm rõ những gì được mong đợi. Tính nhất quán đạt được bằng cách thiết lập các tiêu chuẩn cho việc gán nhãn các loại dữ liệu khác nhau, đảm bảo tất cả các nhãn đều tuân theo cùng một quy tắc. Để giảm thiểu sai lệch cá nhân, hãy đào tạo người gán nhãn để họ luôn trung lập và khách quan. Việc thường xuyên đánh giá và cập nhật các quy tắc gán nhãn giúp duy trì độ chính xác và sự phù hợp với mục tiêu dự án. Việc sử dụng các công cụ tự động để kiểm tra tính nhất quán và nhận phản hồi từ những người gán nhãn khác cũng góp phần duy trì các nhãn chất lượng cao.
Link to this sectionTôi cần bao nhiêu hình ảnh để huấn luyện các model Ultralytics YOLO?#
Để thực hiện hiệu quả transfer learning và phát hiện đối tượng với các model Ultralytics YOLO, hãy bắt đầu với tối thiểu vài trăm đối tượng được gán nhãn cho mỗi lớp. Nếu huấn luyện chỉ cho một lớp, hãy bắt đầu với ít nhất 100 hình ảnh được gán nhãn và huấn luyện trong khoảng 100 epoch. Các tác vụ phức tạp hơn có thể yêu cầu hàng nghìn hình ảnh cho mỗi lớp để đạt được độ tin cậy và hiệu suất cao. Các nhãn chất lượng là rất quan trọng, vì vậy hãy đảm bảo quy trình thu thập và gán nhãn dữ liệu của bạn nghiêm ngặt và phù hợp với các mục tiêu cụ thể của dự án. Khám phá các chiến lược huấn luyện chi tiết trong hướng dẫn huấn luyện YOLO26.
Link to this sectionMột số công cụ phổ biến cho gán nhãn dữ liệu là gì?#
Một số công cụ mã nguồn mở phổ biến có thể hợp lý hóa quá trình gán nhãn dữ liệu:
- Label Studio: Một công cụ linh hoạt hỗ trợ các tác vụ gán nhãn khác nhau, quản lý dự án và các tính năng kiểm soát chất lượng.
- CVAT: Cung cấp nhiều định dạng gán nhãn và quy trình làm việc có thể tùy chỉnh, giúp nó phù hợp cho các dự án phức tạp.
- Labelme: Lý tưởng cho việc gán nhãn hình ảnh nhanh chóng và đơn giản với các đa giác.
- LabelImg: Hoàn hảo để tạo các nhãn bounding box ở định dạng YOLO với giao diện đơn giản.
Các công cụ này có thể giúp tăng cường hiệu quả và độ chính xác cho quy trình gán nhãn của bạn. Để biết danh sách các tính năng và hướng dẫn mở rộng, hãy tham khảo tài liệu về công cụ gán nhãn dữ liệu của chúng tôi.
Link to this sectionCác loại gán nhãn dữ liệu nào thường được sử dụng trong thị giác máy tính?#
Các loại gán nhãn dữ liệu khác nhau phục vụ cho các tác vụ thị giác máy tính khác nhau:
- Bounding Boxes: Được sử dụng chủ yếu cho phát hiện đối tượng, đây là các hộp hình chữ nhật xung quanh các đối tượng trong hình ảnh.
- Polygons: Cung cấp các đường viền đối tượng chính xác hơn, phù hợp cho các tác vụ instance segmentation.
- Masks: Cung cấp chi tiết ở cấp độ pixel, được sử dụng trong semantic segmentation để phân biệt đối tượng với nền.
- Keypoints: Xác định các điểm quan tâm cụ thể trong ảnh, hữu ích cho các tác vụ như ước tính tư thế (pose estimation) và phát hiện đặc điểm khuôn mặt.
Việc lựa chọn loại annotation phù hợp phụ thuộc vào yêu cầu của dự án bạn. Tìm hiểu thêm về cách triển khai các annotation này và định dạng của chúng trong hướng dẫn annotation dữ liệu của chúng tôi.