Các chiến lược thu thập và gắn nhãn dữ liệu cho thị giác máy tính

Giới thiệu

Chìa khóa thành công trong bất kỳ dự án thị giác máy tính nào đều bắt đầu bằng các chiến lược thu thập và gắn nhãn dữ liệu hiệu quả. Chất lượng dữ liệu ảnh hưởng trực tiếp đến hiệu suất của model, vì vậy việc hiểu rõ các phương pháp tốt nhất liên quan đến thu thập và gắn nhãn dữ liệu là rất quan trọng.



Watch: How to Build Effective Data Collection and Annotation Strategies for Computer Vision 🚀

Mọi cân nhắc về dữ liệu phải bám sát mục tiêu dự án của bạn. Những thay đổi trong chiến lược gắn nhãn có thể làm thay đổi trọng tâm hoặc hiệu quả của dự án và ngược lại. Với suy nghĩ đó, hãy cùng xem xét kỹ hơn các cách tiếp cận tối ưu nhất cho việc thu thập và gắn nhãn dữ liệu.

Thiết lập các Class và Thu thập dữ liệu

Việc thu thập hình ảnh và video cho dự án thị giác máy tính bao gồm việc xác định số lượng class, tìm nguồn dữ liệu và xem xét các khía cạnh đạo đức. Trước khi bắt đầu thu thập dữ liệu, bạn cần làm rõ:

Chọn các Class phù hợp cho dự án của bạn

Một trong những câu hỏi đầu tiên khi bắt đầu dự án thị giác máy tính là nên đưa vào bao nhiêu class. Bạn cần xác định thành phần của class, bao gồm các danh mục hoặc nhãn khác nhau mà bạn muốn model nhận diện và phân biệt. Số lượng class nên được xác định dựa trên các mục tiêu cụ thể của dự án.

Ví dụ, nếu bạn muốn giám sát giao thông, các class của bạn có thể bao gồm "ô tô", "xe tải", "xe buýt", "xe máy" và "xe đạp". Mặt khác, để theo dõi các mặt hàng trong cửa hàng, các class của bạn có thể là "trái cây", "rau củ", "đồ uống" và "đồ ăn nhẹ". Việc định nghĩa class dựa trên mục tiêu dự án giúp tập dữ liệu của bạn luôn phù hợp và có trọng tâm.

Khi bạn định nghĩa các class, một sự phân biệt quan trọng khác là quyết định chọn số lượng class thô (coarse) hay tinh (fine). 'Số lượng' đề cập đến số lượng class riêng biệt mà bạn quan tâm. Quyết định này ảnh hưởng đến độ chi tiết của dữ liệu và độ phức tạp của model. Dưới đây là các cân nhắc cho từng phương pháp:

  • Số lượng Class thô (Coarse Class-Count): Đây là những danh mục rộng và bao quát hơn, chẳng hạn như "phương tiện" và "phi phương tiện". Chúng giúp đơn giản hóa việc gắn nhãn và đòi hỏi ít tài nguyên tính toán hơn nhưng cung cấp ít thông tin chi tiết, có khả năng hạn chế hiệu quả của model trong các tình huống phức tạp.
  • Số lượng Class tinh (Fine Class-Count): Nhiều danh mục với sự phân biệt chi tiết hơn, chẳng hạn như "sedan", "SUV", "xe bán tải" và "xe máy". Chúng thu thập thông tin chi tiết hơn, cải thiện độ chính xác và hiệu suất của model. Tuy nhiên, việc gắn nhãn sẽ tốn nhiều thời gian và công sức hơn, đồng thời đòi hỏi nhiều tài nguyên tính toán hơn.

Bắt đầu với các class cụ thể hơn có thể rất hữu ích, đặc biệt là trong các dự án phức tạp nơi chi tiết là yếu tố quan trọng. Các class cụ thể hơn cho phép bạn thu thập dữ liệu chi tiết hơn, đạt được thông tin chuyên sâu và thiết lập các sự phân biệt rõ ràng hơn giữa các danh mục. Điều này không chỉ cải thiện độ chính xác của model mà còn giúp dễ dàng điều chỉnh model sau này nếu cần, tiết kiệm cả thời gian và tài nguyên.

Nguồn dữ liệu

Bạn có thể sử dụng các tập dữ liệu công khai hoặc tự thu thập dữ liệu tùy chỉnh. Các tập dữ liệu công khai như trên KaggleGoogle Dataset Search Engine cung cấp dữ liệu chuẩn hóa, đã được gắn nhãn tốt, trở thành điểm khởi đầu tuyệt vời để huấn luyện và xác thực các model.

Ngược lại, việc thu thập dữ liệu tùy chỉnh cho phép bạn điều chỉnh tập dữ liệu theo nhu cầu cụ thể của mình. Bạn có thể chụp ảnh và quay video bằng máy ảnh hoặc drone, thu thập hình ảnh từ web hoặc sử dụng dữ liệu nội bộ hiện có từ tổ chức của mình. Dữ liệu tùy chỉnh mang lại cho bạn sự kiểm soát tốt hơn về chất lượng và mức độ liên quan. Kết hợp cả nguồn dữ liệu công khai và dữ liệu tùy chỉnh sẽ giúp tạo ra một tập dữ liệu đa dạng và toàn diện.

Tránh sai lệch (bias) trong thu thập dữ liệu

Sai lệch (bias) xảy ra khi một số nhóm hoặc tình huống nhất định bị thiếu hụt hoặc dư thừa đại diện trong tập dữ liệu của bạn. Điều này dẫn đến một model hoạt động tốt trên một số dữ liệu nhưng lại kém trên những dữ liệu khác. Việc tránh sai lệch trong AI là rất quan trọng để model thị giác máy tính của bạn có thể hoạt động tốt trong nhiều tình huống khác nhau.

Dưới đây là cách bạn có thể tránh sai lệch khi thu thập dữ liệu:

  • Nguồn đa dạng: Thu thập dữ liệu từ nhiều nguồn để nắm bắt các quan điểm và tình huống khác nhau.
  • Đại diện cân bằng: Đảm bảo sự đại diện cân bằng từ tất cả các nhóm có liên quan. Ví dụ, hãy xem xét các độ tuổi, giới tính và sắc tộc khác nhau.
  • Giám sát liên tục: Thường xuyên đánh giá và cập nhật tập dữ liệu của bạn để xác định và giải quyết bất kỳ sai lệch nào mới phát sinh.
  • Kỹ thuật giảm thiểu sai lệch: Sử dụng các phương pháp như lấy mẫu quá mức (oversampling) các class thiếu đại diện, data augmentation và các thuật toán đảm bảo tính công bằng.

Tuân thủ các phương pháp này giúp tạo ra một model mạnh mẽ và công bằng hơn, có khả năng khái quát hóa tốt trong các ứng dụng thực tế.

Gắn nhãn dữ liệu là gì?

Gắn nhãn dữ liệu là quá trình gán nhãn cho dữ liệu để làm cho nó có thể sử dụng được cho việc huấn luyện các model machine learning. Trong thị giác máy tính, điều này có nghĩa là gắn nhãn cho hình ảnh hoặc video với thông tin mà model cần để học hỏi. Nếu không có dữ liệu được gắn nhãn đúng cách, các model không thể học chính xác mối quan hệ giữa các input và output.

Các loại gắn nhãn dữ liệu

Tùy thuộc vào các yêu cầu cụ thể của tác vụ thị giác máy tính, có nhiều loại gắn nhãn dữ liệu khác nhau. Dưới đây là một số ví dụ:

  • Bounding Boxes: Các hộp chữ nhật được vẽ xung quanh các đối tượng trong hình ảnh, được sử dụng chủ yếu cho các tác vụ object detection. Các hộp này được xác định bởi tọa độ góc trên cùng bên trái và góc dưới cùng bên phải.
  • Polygons: Các đường viền chi tiết cho đối tượng, cho phép gắn nhãn chính xác hơn so với bounding boxes. Polygons được sử dụng trong các tác vụ như instance segmentation, nơi hình dạng của đối tượng rất quan trọng.
  • Masks: Các mặt nạ nhị phân nơi mỗi pixel là một phần của đối tượng hoặc là nền. Masks được sử dụng trong các tác vụ semantic segmentation để cung cấp chi tiết ở cấp độ pixel.
  • Keypoints: Các điểm cụ thể được đánh dấu trong hình ảnh để xác định vị trí quan tâm. Keypoints được sử dụng trong các tác vụ như pose estimation và nhận diện các điểm mốc trên khuôn mặt.

Data annotation types including bounding boxes, polygons, and masks

Các định dạng gắn nhãn phổ biến

Sau khi chọn loại gắn nhãn, việc chọn định dạng phù hợp để lưu trữ và chia sẻ các nhãn là rất quan trọng.

Các định dạng thường được sử dụng bao gồm COCO, hỗ trợ nhiều loại gắn nhãn như object detection, keypoint detection, stuff segmentation, panoptic segmentation và chú thích hình ảnh, được lưu trữ dưới dạng JSON. Pascal VOC sử dụng các tệp XML và rất phổ biến cho các tác vụ object detection. Mặt khác, YOLO tạo một tệp .txt cho mỗi hình ảnh, chứa các nhãn như class đối tượng, tọa độ, chiều cao và chiều rộng, làm cho nó phù hợp cho object detection.

Các kỹ thuật gắn nhãn

Giả sử bạn đã chọn loại gắn nhãn và định dạng, đã đến lúc thiết lập các quy tắc gắn nhãn rõ ràng và khách quan. Các quy tắc này giống như một lộ trình cho tính nhất quán và độ chính xác trong suốt quá trình gắn nhãn. Các khía cạnh chính của các quy tắc này bao gồm:

  • Rõ ràng và chi tiết: Hãy chắc chắn rằng hướng dẫn của bạn rõ ràng. Sử dụng các ví dụ và hình ảnh minh họa để cho thấy những gì được mong đợi.
  • Tính nhất quán: Giữ các nhãn của bạn đồng nhất. Thiết lập các tiêu chí chuẩn để gắn nhãn các loại dữ liệu khác nhau để tất cả các nhãn đều tuân theo cùng một quy tắc.
  • Giảm thiểu sai lệch: Luôn trung lập. Tự rèn luyện để khách quan và giảm thiểu các định kiến cá nhân nhằm đảm bảo các nhãn công bằng.
  • Hiệu quả: Làm việc thông minh hơn, đừng làm việc chăm chỉ hơn. Sử dụng các công cụ và quy trình làm việc tự động hóa các tác vụ lặp đi lặp lại, giúp quá trình gắn nhãn nhanh hơn và hiệu quả hơn.

Việc thường xuyên xem xét và cập nhật các quy tắc gắn nhãn sẽ giúp giữ cho các nhãn của bạn chính xác, nhất quán và phù hợp với mục tiêu dự án.

Các công cụ gắn nhãn phổ biến

Giả sử bây giờ bạn đã sẵn sàng gắn nhãn. Có một số công cụ mã nguồn mở có sẵn để giúp hợp lý hóa quá trình gắn nhãn dữ liệu. Dưới đây là một số công cụ gắn nhãn mở hữu ích:

  • Label Studio: Một công cụ linh hoạt hỗ trợ nhiều tác vụ gắn nhãn và bao gồm các tính năng quản lý dự án và kiểm soát chất lượng.
  • CVAT: Một công cụ mạnh mẽ hỗ trợ nhiều định dạng gắn nhãn và các quy trình làm việc có thể tùy chỉnh, giúp nó phù hợp với các dự án phức tạp.
  • Labelme: Một công cụ đơn giản và dễ sử dụng cho phép gắn nhãn hình ảnh nhanh chóng bằng các đa giác (polygons), lý tưởng cho các tác vụ đơn giản.
  • LabelImg: Một công cụ gắn nhãn hình ảnh đồ họa dễ sử dụng, đặc biệt tốt để tạo các nhãn bounding box ở định dạng YOLO.

LabelMe annotation tool for instance segmentation

Những công cụ mã nguồn mở này rất tiết kiệm ngân sách và cung cấp một loạt các tính năng để đáp ứng các nhu cầu gắn nhãn khác nhau. Ultralytics Platform cũng cung cấp một trình chỉnh sửa nhãn tích hợp hỗ trợ tất cả các loại tác vụ YOLO (detection, segmentation, pose, OBB và classification) với tính năng gắn nhãn thông minh dựa trên SAM cho các tác vụ không gian.

Một vài điều cần xem xét thêm trước khi gắn nhãn dữ liệu

Trước khi đi sâu vào việc gắn nhãn dữ liệu, có một vài điều nữa cần lưu ý. Bạn nên biết về độ chính xác, độ chuẩn xác, các giá trị ngoại lai (outliers) và kiểm soát chất lượng để tránh gắn nhãn dữ liệu theo cách phản tác dụng.

Hiểu về độ chính xác (Accuracy) và độ chuẩn xác (Precision)

Điều quan trọng là hiểu sự khác biệt giữa độ chính xác và độ chuẩn xác cũng như cách nó liên quan đến việc gắn nhãn. Độ chính xác đề cập đến mức độ gần gũi của dữ liệu được gắn nhãn so với các giá trị thực. Nó giúp chúng ta đo lường mức độ phản ánh sát thực tế của các nhãn. Độ chuẩn xác cho biết tính nhất quán của các nhãn. Nó kiểm tra xem bạn có đang gán cùng một nhãn cho cùng một đối tượng hoặc tính năng trong toàn bộ tập dữ liệu hay không. Độ chính xác và độ chuẩn xác cao dẫn đến các model được huấn luyện tốt hơn bằng cách giảm nhiễu và cải thiện khả năng khái quát hóa của model từ dữ liệu huấn luyện.

Accuracy vs precision comparison for data annotation

Xác định các giá trị ngoại lai (Outliers)

Các giá trị ngoại lai là các điểm dữ liệu sai lệch đáng kể so với các quan sát khác trong tập dữ liệu. Liên quan đến các nhãn, một giá trị ngoại lai có thể là một hình ảnh được gắn nhãn sai hoặc một nhãn không phù hợp với phần còn lại của tập dữ liệu. Các giá trị ngoại lai đáng lo ngại vì chúng có thể làm méo mó quá trình học tập của model, dẫn đến các dự đoán không chính xác và khả năng khái quát hóa kém.

Bạn có thể sử dụng nhiều phương pháp để phát hiện và sửa các giá trị ngoại lai:

  • Kỹ thuật thống kê: Để phát hiện các giá trị ngoại lai trong các tính năng số như giá trị pixel, tọa độ bounding box hoặc kích thước đối tượng, bạn có thể sử dụng các phương pháp như biểu đồ hộp (box plots), biểu đồ tần suất (histograms) hoặc z-scores.
  • Kỹ thuật hình ảnh: Để phát hiện các bất thường trong các tính năng phân loại như class đối tượng, màu sắc hoặc hình dạng, hãy sử dụng các phương pháp trực quan như vẽ hình ảnh, nhãn hoặc bản đồ nhiệt (heat maps).
  • Phương pháp thuật toán: Sử dụng các công cụ như phân cụm (ví dụ: K-means clustering, DBSCAN) và các thuật toán phát hiện bất thường để xác định các giá trị ngoại lai dựa trên các mẫu phân phối dữ liệu.

Kiểm soát chất lượng dữ liệu được gắn nhãn

Giống như các dự án kỹ thuật khác, kiểm soát chất lượng là bắt buộc đối với dữ liệu được gắn nhãn. Việc thường xuyên kiểm tra các nhãn để đảm bảo chúng chính xác và nhất quán là một thực tiễn tốt. Điều này có thể được thực hiện theo một vài cách:

  • Xem xét các mẫu dữ liệu đã gắn nhãn
  • Sử dụng các công cụ tự động để phát hiện các lỗi phổ biến
  • Nhờ người khác kiểm tra lại các nhãn

Nếu bạn đang làm việc với nhiều người, tính nhất quán giữa các người gắn nhãn (annotators) là rất quan trọng. Sự đồng thuận tốt giữa những người gắn nhãn có nghĩa là các hướng dẫn rõ ràng và mọi người đang tuân theo chúng theo cùng một cách. Nó giữ cho mọi người đi cùng hướng và các nhãn nhất quán.

Trong quá trình xem xét, nếu bạn tìm thấy lỗi, hãy sửa chúng và cập nhật hướng dẫn để tránh sai lầm trong tương lai. Cung cấp phản hồi cho những người gắn nhãn và cung cấp đào tạo thường xuyên để giúp giảm thiểu lỗi. Có một quy trình mạnh mẽ để xử lý các lỗi sẽ giữ cho tập dữ liệu của bạn chính xác và đáng tin cậy.

Các chiến lược gắn nhãn dữ liệu hiệu quả

Để làm cho quá trình gắn nhãn dữ liệu trơn tru và hiệu quả hơn, hãy cân nhắc triển khai các chiến lược sau:

  • Hướng dẫn gắn nhãn rõ ràng: Cung cấp hướng dẫn chi tiết kèm ví dụ để đảm bảo tất cả những người gắn nhãn hiểu các tác vụ một cách nhất quán. Ví dụ, khi gắn nhãn chim, hãy xác định xem nên bao gồm toàn bộ con chim hay chỉ các bộ phận cụ thể.
  • Kiểm tra chất lượng thường xuyên: Thiết lập các điểm chuẩn và sử dụng các chỉ số cụ thể để đánh giá công việc, duy trì tiêu chuẩn cao thông qua phản hồi liên tục.
  • Sử dụng các công cụ gắn nhãn trước: Nhiều nền tảng gắn nhãn hiện đại cung cấp các tính năng gắn nhãn trước với sự hỗ trợ của AI, giúp tăng tốc đáng kể quá trình bằng cách tự động tạo các nhãn ban đầu mà con người có thể tinh chỉnh sau đó.
  • Triển khai Active Learning: Cách tiếp cận này ưu tiên gắn nhãn các mẫu thông tin nhất trước, điều này có thể làm giảm tổng số lượng nhãn cần thiết trong khi vẫn duy trì hiệu suất của model.
  • Xử lý theo lô (Batch Processing): Nhóm các hình ảnh tương tự lại với nhau để gắn nhãn nhằm duy trì tính nhất quán và cải thiện hiệu quả.

Các chiến lược này có thể giúp duy trì các nhãn chất lượng cao trong khi giảm thời gian và tài nguyên cần thiết cho quá trình gắn nhãn.

Chia sẻ suy nghĩ của bạn với cộng đồng

Việc trao đổi ý tưởng và thắc mắc với những người đam mê thị giác máy tính khác có thể giúp tăng tốc các dự án của bạn. Dưới đây là một số cách tuyệt vời để học hỏi, khắc phục sự cố và kết nối:

Tìm kiếm trợ giúp và hỗ trợ ở đâu

  • GitHub Issues: Truy cập kho lưu trữ YOLO26 trên GitHub và sử dụng tab Issues để đặt câu hỏi, báo cáo lỗi và đề xuất các tính năng. Cộng đồng và các nhà phát triển luôn sẵn sàng hỗ trợ mọi vấn đề bạn gặp phải.
  • Máy chủ Discord của Ultralytics: Tham gia máy chủ Discord của Ultralytics để kết nối với những người dùng và nhà phát triển khác, nhận hỗ trợ, chia sẻ kiến thức và cùng thảo luận ý tưởng.

Tài liệu chính thức

  • Tài liệu Ultralytics YOLO26: Tham khảo tài liệu YOLO26 chính thức để có các hướng dẫn chuyên sâu và thông tin chi tiết có giá trị về vô số tác vụ và dự án thị giác máy tính.

Kết luận

Bằng cách tuân thủ các phương pháp tốt nhất để thu thập và gắn nhãn dữ liệu, tránh sai lệch và sử dụng các công cụ cũng như kỹ thuật phù hợp, bạn có thể cải thiện đáng kể hiệu suất model của mình. Tương tác với cộng đồng và tận dụng các tài nguyên sẵn có sẽ giúp bạn luôn được cập nhật và giúp bạn khắc phục các vấn đề một cách hiệu quả. Hãy nhớ rằng, dữ liệu chất lượng là nền tảng của một dự án thành công và các chiến lược đúng đắn sẽ giúp bạn xây dựng các model mạnh mẽ và đáng tin cậy.

Câu hỏi thường gặp (FAQ)

Cách tốt nhất để tránh sai lệch trong thu thập dữ liệu cho các dự án thị giác máy tính là gì?

Tránh sai lệch trong thu thập dữ liệu đảm bảo rằng model thị giác máy tính của bạn hoạt động tốt trong nhiều tình huống khác nhau. Để giảm thiểu sai lệch, hãy cân nhắc thu thập dữ liệu từ các nguồn đa dạng để nắm bắt các quan điểm và tình huống khác nhau. Đảm bảo sự đại diện cân bằng giữa tất cả các nhóm có liên quan, chẳng hạn như các độ tuổi, giới tính và sắc tộc khác nhau. Thường xuyên xem xét và cập nhật tập dữ liệu của bạn để xác định và giải quyết bất kỳ sai lệch nào mới phát sinh. Các kỹ thuật như lấy mẫu quá mức các class thiếu đại diện, data augmentation và các thuật toán đảm bảo tính công bằng cũng có thể giúp giảm thiểu sai lệch. Bằng cách áp dụng các chiến lược này, bạn duy trì một tập dữ liệu mạnh mẽ và công bằng, giúp tăng cường khả năng khái quát hóa của model.

Làm thế nào tôi có thể đảm bảo tính nhất quán và độ chính xác cao trong việc gắn nhãn dữ liệu?

Đảm bảo tính nhất quán và độ chính xác cao trong việc gắn nhãn dữ liệu bao gồm việc thiết lập các hướng dẫn gắn nhãn rõ ràng và khách quan. Hướng dẫn của bạn phải chi tiết, kèm theo các ví dụ và hình ảnh minh họa để làm rõ những gì được mong đợi. Tính nhất quán đạt được bằng cách thiết lập các tiêu chí chuẩn để gắn nhãn các loại dữ liệu khác nhau, đảm bảo tất cả các nhãn đều tuân theo cùng một quy tắc. Để giảm thiểu định kiến cá nhân, hãy đào tạo những người gắn nhãn để họ duy trì sự trung lập và khách quan. Việc thường xuyên xem xét và cập nhật các quy tắc gắn nhãn giúp duy trì độ chính xác và sự phù hợp với mục tiêu dự án. Việc sử dụng các công cụ tự động để kiểm tra tính nhất quán và nhận phản hồi từ những người gắn nhãn khác cũng góp phần duy trì các nhãn chất lượng cao.

Tôi cần bao nhiêu hình ảnh để huấn luyện các model Ultralytics YOLO?

Để đạt hiệu quả transfer learning và object detection với các model Ultralytics YOLO, hãy bắt đầu với tối thiểu vài trăm đối tượng đã gắn nhãn cho mỗi class. Nếu huấn luyện chỉ cho một class, hãy bắt đầu với ít nhất 100 hình ảnh đã gắn nhãn và huấn luyện trong khoảng 100 epoch. Các tác vụ phức tạp hơn có thể yêu cầu hàng nghìn hình ảnh mỗi class để đạt được độ tin cậy và hiệu suất cao. Các nhãn chất lượng là yếu tố then chốt, vì vậy hãy đảm bảo các quy trình thu thập và gắn nhãn dữ liệu của bạn chặt chẽ và phù hợp với mục tiêu cụ thể của dự án. Khám phá các chiến lược huấn luyện chi tiết trong hướng dẫn huấn luyện YOLO26.

Một số công cụ phổ biến cho việc gắn nhãn dữ liệu là gì?

Một số công cụ mã nguồn mở phổ biến có thể hợp lý hóa quá trình gắn nhãn dữ liệu:

  • Label Studio: Một công cụ linh hoạt hỗ trợ các tác vụ gắn nhãn khác nhau, quản lý dự án và các tính năng kiểm soát chất lượng.
  • CVAT: Cung cấp nhiều định dạng gắn nhãn và quy trình làm việc có thể tùy chỉnh, giúp nó phù hợp cho các dự án phức tạp.
  • Labelme: Lý tưởng để gắn nhãn hình ảnh nhanh chóng và đơn giản với các đa giác (polygons).
  • LabelImg: Hoàn hảo để tạo các nhãn bounding box ở định dạng YOLO với giao diện đơn giản.

Các công cụ này có thể giúp nâng cao hiệu quả và độ chính xác cho quy trình gắn nhãn của bạn. Để biết danh sách tính năng và hướng dẫn mở rộng, hãy tham khảo tài liệu về công cụ gắn nhãn dữ liệu của chúng tôi.

Các loại gắn nhãn dữ liệu nào thường được sử dụng trong thị giác máy tính?

Các loại gắn nhãn dữ liệu khác nhau phục vụ cho các tác vụ thị giác máy tính khác nhau:

  • Bounding Boxes: Được sử dụng chủ yếu cho object detection, đây là các hộp chữ nhật bao quanh các đối tượng trong hình ảnh.
  • Polygons: Cung cấp các đường viền đối tượng chính xác hơn, phù hợp cho các tác vụ instance segmentation.
  • Masks: Cung cấp chi tiết ở cấp độ pixel, được sử dụng trong semantic segmentation để phân biệt các đối tượng với nền.
  • Keypoints: Xác định các điểm quan tâm cụ thể trong hình ảnh, hữu ích cho các tác vụ như pose estimation và nhận diện điểm mốc trên khuôn mặt.

Việc lựa chọn loại gắn nhãn phù hợp phụ thuộc vào yêu cầu của dự án. Tìm hiểu thêm về cách thực hiện các loại gắn nhãn này và định dạng của chúng trong hướng dẫn gắn nhãn dữ liệu của chúng tôi.

Bình luận