Các Chiến lược Thu thập và Chú thích Dữ liệu cho Thị giác Máy tính

Q: How many images do I need for training Ultralytics YOLO models?

Để học chuyển giao và detect đối tượng hiệu quả với các mô hình Ultralytics YOLO, hãy bắt đầu với tối thiểu vài trăm đối tượng được chú thích cho mỗi lớp. Nếu chỉ huấn luyện cho một lớp, hãy bắt đầu với ít nhất 100 hình ảnh được chú thích và huấn luyện trong khoảng 100 epoch. Các tác vụ phức tạp hơn có thể yêu cầu hàng nghìn hình ảnh cho mỗi lớp để đạt được độ tin cậy và hiệu suất cao. Chú thích chất lượng là rất quan trọng, vì vậy hãy đảm bảo quy trình thu thập và chú thích dữ liệu của bạn chặt chẽ và phù hợp với các mục tiêu cụ thể của dự án. Khám phá các chiến lược huấn luyện chi tiết trong hướng dẫn huấn luyện YOLO26.

Giới thiệu

Chìa khóa thành công trong bất kỳ dự án thị giác máy tính nào bắt đầu bằng các chiến lược thu thập và chú thích dữ liệu hiệu quả. Chất lượng của dữ liệu ảnh hưởng trực tiếp đến hiệu suất của mô hình, vì vậy điều quan trọng là phải hiểu các phương pháp hay nhất liên quan đến thu thập dữ liệu và chú thích dữ liệu.

Xem: Cách Xây dựng các Chiến lược Thu thập và Chú thích Dữ liệu Hiệu quả cho Thị giác Máy tính 🚀

Mọi cân nhắc liên quan đến dữ liệu nên phù hợp chặt chẽ với mục tiêu của dự án của bạn. Những thay đổi trong chiến lược chú giải của bạn có thể làm thay đổi trọng tâm hoặc hiệu quả của dự án và ngược lại. Với điều này, hãy xem xét kỹ hơn các cách tiếp cận tốt nhất để thu thập và chú giải dữ liệu.

Thiết lập Lớp và Thu thập Dữ liệu

Việc thu thập hình ảnh và video cho một dự án thị giác máy tính bao gồm việc xác định số lượng lớp, tìm nguồn dữ liệu và xem xét các vấn đề đạo đức. Trước khi bạn bắt đầu thu thập dữ liệu của mình, bạn cần phải rõ ràng về:

Chọn Các Lớp Phù Hợp cho Dự Án Của Bạn

Một trong những câu hỏi đầu tiên khi bắt đầu một dự án thị giác máy tính là nên đưa vào bao nhiêu lớp. Bạn cần xác định thành viên lớp, bao gồm các danh mục hoặc nhãn khác nhau mà bạn muốn mô hình của mình nhận dạng và phân biệt. Số lượng lớp phải được xác định bởi các mục tiêu cụ thể của dự án của bạn.

Ví dụ: nếu bạn muốn theo dõi giao thông, các lớp của bạn có thể bao gồm "ô tô", "xe tải", "xe buýt", "xe máy" và "xe đạp"." Mặt khác, để theo dõi các mặt hàng trong một cửa hàng, các lớp của bạn có thể là "trái cây", "rau", "đồ uống" và "đồ ăn nhẹ"." Xác định các lớp dựa trên mục tiêu dự án của bạn giúp giữ cho tập dữ liệu của bạn phù hợp và tập trung.

Khi bạn xác định các lớp của mình, một điểm khác biệt quan trọng cần thực hiện là có nên chọn số lượng lớp thô hay lớp chi tiết. 'Số lượng' đề cập đến số lượng lớp riêng biệt mà bạn quan tâm. Quyết định này ảnh hưởng đến độ chi tiết của dữ liệu và độ phức tạp của mô hình của bạn. Dưới đây là những cân nhắc cho từng phương pháp:

Đếm Lớp Thô: Đây là những danh mục rộng hơn, bao quát hơn, chẳng hạn như "phương tiện" và "phi phương tiện." Chúng đơn giản hóa việc chú thích và yêu cầu ít tài nguyên tính toán hơn nhưng cung cấp thông tin ít chi tiết hơn, có khả năng hạn chế hiệu quả của mô hình trong các tình huống phức tạp.
Số lượng lớp chi tiết: Nhiều danh mục hơn với các phân biệt chi tiết hơn, chẳng hạn như "sedan", "SUV", "xe bán tải" và "xe máy". Chúng thu thập thông tin chi tiết hơn, cải thiện độ chính xác và hiệu suất của mô hình. Tuy nhiên, chúng tốn nhiều thời gian và công sức hơn để chú thích và đòi hỏi nhiều tài nguyên tính toán hơn.

Bắt đầu với các lớp cụ thể hơn có thể rất hữu ích, đặc biệt trong các dự án phức tạp nơi chi tiết là quan trọng. Các lớp cụ thể hơn cho phép bạn thu thập dữ liệu chi tiết hơn, có được thông tin chi tiết sâu sắc hơn và thiết lập sự phân biệt rõ ràng hơn giữa các danh mục. Điều này không chỉ cải thiện độ chính xác của mô hình mà còn giúp dễ dàng điều chỉnh mô hình sau này nếu cần, tiết kiệm cả thời gian và tài nguyên.

Nguồn dữ liệu

Bạn có thể sử dụng các bộ dữ liệu công khai hoặc thu thập dữ liệu tùy chỉnh của riêng bạn. Các bộ dữ liệu công khai như trên Kaggle và Công cụ tìm kiếm bộ dữ liệu của Google cung cấp dữ liệu được chú thích và tiêu chuẩn hóa tốt, khiến chúng trở thành điểm khởi đầu tuyệt vời để huấn luyện và xác thực mô hình.

Mặt khác, thu thập dữ liệu tùy chỉnh cho phép bạn tùy chỉnh bộ dữ liệu theo nhu cầu cụ thể của mình. Bạn có thể chụp ảnh và quay video bằng máy ảnh hoặc máy bay không người lái, thu thập hình ảnh từ web hoặc sử dụng dữ liệu nội bộ hiện có từ tổ chức của bạn. Dữ liệu tùy chỉnh giúp bạn kiểm soát tốt hơn chất lượng và mức độ liên quan của dữ liệu. Kết hợp cả nguồn dữ liệu công khai và tùy chỉnh giúp tạo ra một bộ dữ liệu đa dạng và toàn diện.

Tránh Sai lệch trong Thu thập Dữ liệu

Sự thiên vị xảy ra khi một số nhóm hoặc tình huống không được đại diện đầy đủ hoặc bị đại diện quá mức trong tập dữ liệu của bạn. Điều này dẫn đến một mô hình hoạt động tốt trên một số dữ liệu nhưng kém hiệu quả trên những dữ liệu khác. Việc tránh sự thiên vị trong AI là rất quan trọng để mô hình thị giác máy tính của bạn có thể hoạt động tốt trong nhiều tình huống.

Đây là cách bạn có thể tránh sai lệch khi thu thập dữ liệu:

Nguồn Đa dạng: Thu thập dữ liệu từ nhiều nguồn để nắm bắt các góc nhìn và kịch bản khác nhau.
Đại diện cân bằng: Bao gồm đại diện cân bằng từ tất cả các nhóm liên quan. Ví dụ: xem xét các độ tuổi, giới tính và dân tộc khác nhau.
Giám sát liên tục: Thường xuyên xem xét và cập nhật bộ dữ liệu của bạn để xác định và giải quyết mọi sai lệch mới phát sinh.
Kỹ thuật giảm thiểu độ chệch: Sử dụng các phương pháp như lấy mẫu vượt mức các lớp được đại diện dưới mức, tăng cường dữ liệu và các thuật toán nhận biết tính công bằng.

Tuân thủ các phương pháp này giúp tạo ra một mô hình mạnh mẽ và công bằng hơn, có khả năng khái quát hóa tốt trong các ứng dụng thực tế.

Chú thích Dữ liệu là gì?

Gán nhãn dữ liệu là quá trình dán nhãn dữ liệu để làm cho dữ liệu đó có thể sử dụng được để huấn luyện các mô hình học máy. Trong thị giác máy tính, điều này có nghĩa là dán nhãn hình ảnh hoặc video bằng thông tin mà mô hình cần học hỏi. Nếu không có dữ liệu được gán nhãn đúng cách, các mô hình không thể học chính xác các mối quan hệ giữa đầu vào và đầu ra.

Các loại Chú thích Dữ liệu

Tùy thuộc vào các yêu cầu cụ thể của một nhiệm vụ thị giác máy tính, có nhiều loại chú thích dữ liệu khác nhau. Dưới đây là một vài ví dụ:

Hộp giới hạn: Các hộp hình chữ nhật được vẽ xung quanh các đối tượng trong một hình ảnh, được sử dụng chủ yếu cho các tác vụ phát hiện đối tượng. Các hộp này được xác định bởi tọa độ trên cùng bên trái và dưới cùng bên phải của chúng.
Đa giác (Polygons): Đường viền chi tiết cho các đối tượng, cho phép chú thích chính xác hơn so với khung giới hạn. Đa giác được sử dụng trong các tác vụ như phân vùng thể hiện (instance segmentation), trong đó hình dạng của đối tượng là quan trọng.
Masks: Mặt nạ nhị phân trong đó mỗi pixel là một phần của đối tượng hoặc nền. Mặt nạ được sử dụng trong các tác vụ phân đoạn ngữ nghĩa để cung cấp chi tiết ở cấp độ pixel.
Keypoint: Các điểm cụ thể được đánh dấu trong hình ảnh để xác định các vị trí quan trọng. Keypoint được sử dụng trong các tác vụ như ước tính tư thế và phát hiện dấu mốc trên khuôn mặt.

Các loại chú thích dữ liệu bao gồm hộp giới hạn, đa giác và mặt nạ.

Các Định Dạng Chú Thích Phổ Biến

Sau khi chọn một loại chú thích, điều quan trọng là phải chọn định dạng thích hợp để lưu trữ và chia sẻ chú thích.

Các định dạng thường được sử dụng bao gồm COCO, hỗ trợ nhiều loại chú thích khác nhau như phát hiện đối tượng, phát hiện điểm khóa, phân đoạn nền, phân đoạn toàn cảnh và chú thích hình ảnh, được lưu trữ dưới dạng JSON. Pascal VOC sử dụng tệp XML và phổ biến cho các tác vụ phát hiện đối tượng. Mặt khác, YOLO tạo một tệp .txt cho mỗi hình ảnh, chứa các chú thích như lớp đối tượng, tọa độ, chiều cao và chiều rộng, làm cho nó phù hợp cho phát hiện đối tượng.

Các kỹ thuật chú thích

Bây giờ, giả sử bạn đã chọn một loại chú thích và định dạng, đã đến lúc thiết lập các quy tắc dán nhãn rõ ràng và khách quan. Các quy tắc này giống như một lộ trình để đảm bảo tính nhất quán và độ chính xác trong suốt quá trình chú thích. Các khía cạnh chính của các quy tắc này bao gồm:

Rõ ràng và Chi tiết: Đảm bảo hướng dẫn của bạn rõ ràng. Sử dụng ví dụ và hình minh họa để thể hiện những gì được mong đợi.
Tính Nhất Quán: Giữ cho các chú thích của bạn đồng nhất. Đặt tiêu chí tiêu chuẩn để chú thích các loại dữ liệu khác nhau, để tất cả các chú thích tuân theo cùng một quy tắc.
Giảm thiểu sự thiên vị: Giữ thái độ trung lập. Rèn luyện bản thân để khách quan và giảm thiểu sự thiên vị cá nhân để đảm bảo chú thích công bằng.
Hiệu quả: Làm việc thông minh hơn, không phải vất vả hơn. Sử dụng các công cụ và quy trình làm việc tự động hóa các tác vụ lặp đi lặp lại, giúp quá trình chú thích nhanh hơn và hiệu quả hơn.

Thường xuyên xem xét và cập nhật các quy tắc gắn nhãn sẽ giúp giữ cho chú thích của bạn chính xác, nhất quán và phù hợp với mục tiêu dự án của bạn.

Các Công Cụ Chú Thích Phổ Biến

Giả sử bạn đã sẵn sàng chú thích. Có một số công cụ mã nguồn mở có sẵn để giúp hợp lý hóa quy trình chú thích dữ liệu. Dưới đây là một số công cụ chú thích mở hữu ích:

Label Studio: Một công cụ linh hoạt hỗ trợ nhiều tác vụ chú thích và bao gồm các tính năng để quản lý dự án và kiểm soát chất lượng.
CVAT: Một công cụ mạnh mẽ hỗ trợ nhiều định dạng chú thích và quy trình làm việc tùy chỉnh, phù hợp cho các dự án phức tạp.
Labelme: Một công cụ đơn giản và dễ sử dụng cho phép chú thích nhanh chóng hình ảnh bằng các đa giác, lý tưởng cho các tác vụ đơn giản.
LabelImg: Một công cụ chú thích hình ảnh đồ họa dễ sử dụng, đặc biệt tốt để tạo các chú thích bounding box ở định dạng YOLO.

Công cụ chú thích LabelMe để phân đoạn đối tượng

Các công cụ mã nguồn mở này có giá cả phải chăng và cung cấp nhiều tính năng đáp ứng các nhu cầu chú thích khác nhau. Nền tảng Ultralytics cũng cung cấp trình chỉnh sửa chú thích tích hợp hỗ trợ tất cả các định dạng. YOLO các loại tác vụ (phát hiện, phân đoạn, tư thế, OBB và phân loại) với chú thích thông minh được hỗ trợ bởi SAM cho các tác vụ không gian.

Một số điều cần cân nhắc trước khi chú thích dữ liệu

Trước khi bạn đi sâu vào việc chú thích dữ liệu của mình, có một vài điều nữa cần ghi nhớ. Bạn nên biết về độ chính xác, độ chuẩn xác, giá trị ngoại lệ và kiểm soát chất lượng để tránh việc gắn nhãn dữ liệu của bạn một cách phản tác dụng.

Tìm hiểu về Độ chính xác (Accuracy) và Độ chuẩn xác (Precision)

Điều quan trọng là phải hiểu sự khác biệt giữa độ chính xác và độ chuẩn xác cũng như mối liên hệ của nó với chú thích. Độ chính xác đề cập đến mức độ gần của dữ liệu được chú thích với các giá trị thực. Nó giúp chúng ta đo lường mức độ phản ánh sát sao các nhãn các tình huống thực tế. Độ chuẩn xác cho biết tính nhất quán của các chú thích. Nó kiểm tra xem bạn có gán cùng một nhãn cho cùng một đối tượng hoặc tính năng trong toàn bộ tập dữ liệu hay không. Độ chính xác và độ chuẩn xác cao dẫn đến các mô hình được huấn luyện tốt hơn bằng cách giảm nhiễu và cải thiện khả năng khái quát hóa của mô hình từ dữ liệu huấn luyện.

So sánh độ chính xác và độ tin cậy trong chú thích dữ liệu

Xác định các giá trị ngoại lệ

Giá trị ngoại lệ là các điểm dữ liệu lệch khá nhiều so với các quan sát khác trong tập dữ liệu. Đối với chú thích, giá trị ngoại lệ có thể là một hình ảnh được gắn nhãn không chính xác hoặc một chú thích không phù hợp với phần còn lại của tập dữ liệu. Các giá trị ngoại lệ đáng lo ngại vì chúng có thể làm sai lệch quá trình học của mô hình, dẫn đến dự đoán không chính xác và khả năng khái quát hóa kém.

Bạn có thể sử dụng nhiều phương pháp khác nhau để phát hiện và hiệu chỉnh các giá trị ngoại lai:

Kỹ thuật Thống kê: Để phát hiện các giá trị ngoại lai trong các đặc trưng số như giá trị pixel, tọa độ hộp giới hạn hoặc kích thước đối tượng, bạn có thể sử dụng các phương pháp như biểu đồ hộp, biểu đồ tần suất hoặc điểm z.
Các Kỹ Thuật Trực Quan: Để phát hiện các điểm bất thường trong các đặc điểm phân loại như lớp đối tượng, màu sắc hoặc hình dạng, hãy sử dụng các phương pháp trực quan như vẽ đồ thị hình ảnh, nhãn hoặc bản đồ nhiệt.
Phương pháp Thuật toán: Sử dụng các công cụ như phân cụm (ví dụ: phân cụm K-means, DBSCAN) và các thuật toán phát hiện dị thường để xác định các giá trị ngoại lệ dựa trên các mẫu phân phối dữ liệu.

Kiểm soát chất lượng dữ liệu được chú thích

Giống như các dự án kỹ thuật khác, kiểm soát chất lượng là điều bắt buộc đối với dữ liệu được gán nhãn. Nên thường xuyên kiểm tra các gán nhãn để đảm bảo chúng chính xác và nhất quán. Điều này có thể được thực hiện theo một vài cách khác nhau:

Xem lại các mẫu dữ liệu đã được chú thích
Sử dụng các công cụ tự động để phát hiện các lỗi phổ biến
Nhờ một người khác kiểm tra lại các chú thích

Nếu bạn làm việc với nhiều người, tính nhất quán giữa những người chú thích khác nhau là rất quan trọng. Thỏa thuận giữa những người chú thích tốt có nghĩa là các hướng dẫn rõ ràng và mọi người đều tuân theo chúng theo cùng một cách. Nó giữ cho mọi người luôn đồng nhất và các chú thích nhất quán.

Trong khi xem xét, nếu bạn tìm thấy lỗi, hãy sửa chúng và cập nhật các hướng dẫn để tránh những sai lầm trong tương lai. Cung cấp phản hồi cho người chú thích và cung cấp đào tạo thường xuyên để giúp giảm lỗi. Có một quy trình mạnh mẽ để xử lý lỗi giúp bộ dữ liệu của bạn chính xác và đáng tin cậy.

Các chiến lược gắn nhãn dữ liệu hiệu quả

Để làm cho quá trình gắn nhãn dữ liệu trở nên suôn sẻ và hiệu quả hơn, hãy xem xét triển khai các chiến lược sau:

Hướng dẫn chú thích rõ ràng: Cung cấp hướng dẫn chi tiết kèm theo ví dụ để đảm bảo tất cả những người chú thích đều hiểu các nhiệm vụ một cách nhất quán. Ví dụ: khi gắn nhãn chim, hãy chỉ định xem có nên bao gồm toàn bộ con chim hay chỉ các bộ phận cụ thể.
Kiểm tra chất lượng thường xuyên: Thiết lập các chuẩn mực và sử dụng các số liệu cụ thể để xem xét công việc, duy trì các tiêu chuẩn cao thông qua phản hồi liên tục.
Sử dụng công cụ tiền chú thích: Nhiều nền tảng chú thích hiện đại cung cấp các tính năng tiền chú thích hỗ trợ AI có thể tăng tốc đáng kể quy trình bằng cách tự động tạo các chú thích ban đầu mà con người sau đó có thể tinh chỉnh.
Triển khai Học chủ động: Phương pháp này ưu tiên gắn nhãn các mẫu thông tin nhất trước, có thể giảm tổng số lượng chú thích cần thiết trong khi vẫn duy trì hiệu suất của mô hình.
Xử lý theo lô: Nhóm các hình ảnh tương tự lại với nhau để chú thích nhằm duy trì tính nhất quán và nâng cao hiệu quả.

Các chiến lược này có thể giúp duy trì các chú thích chất lượng cao đồng thời giảm thời gian và tài nguyên cần thiết cho quá trình gắn nhãn.

Việc trao đổi ý tưởng và thắc mắc với những người đam mê thị giác máy tính khác có thể giúp đẩy nhanh tiến độ dự án của bạn. Dưới đây là một số cách tuyệt vời để học hỏi, khắc phục sự cố và kết nối:

Tìm trợ giúp và hỗ trợ ở đâu

Vấn đề trên GitHub: Truy cập kho lưu trữ GitHub của YOLO26 và sử dụng tab Issues để đặt câu hỏi, báo cáo lỗi và đề xuất tính năng. Cộng đồng và những người duy trì luôn sẵn sàng trợ giúp bạn với bất kỳ vấn đề nào.
Máy chủ Ultralytics Discord: Tham gia máy chủ Ultralytics Discord để kết nối với những người dùng và nhà phát triển khác, nhận hỗ trợ, chia sẻ kiến thức vàBrainstorm ý tưởng.

Tài liệu Chính thức

Tài liệu Ultralytics YOLO26: Tham khảo tài liệu chính thức của YOLO26 để có các hướng dẫn chi tiết và thông tin chuyên sâu có giá trị về nhiều tác vụ và dự án thị giác máy tính.

Kết luận

Bằng cách tuân theo các phương pháp hay nhất để thu thập và chú thích dữ liệu, tránh sai lệch và sử dụng đúng công cụ và kỹ thuật, bạn có thể cải thiện đáng kể hiệu suất của mô hình. Tương tác với cộng đồng và sử dụng các tài nguyên có sẵn sẽ giúp bạn luôn được thông tin và giúp bạn khắc phục sự cố một cách hiệu quả. Hãy nhớ rằng, dữ liệu chất lượng là nền tảng của một dự án thành công và các chiến lược phù hợp sẽ giúp bạn xây dựng các mô hình mạnh mẽ và đáng tin cậy.

Câu hỏi thường gặp

Cách tốt nhất để tránh sai lệch trong quá trình thu thập dữ liệu cho các dự án thị giác máy tính là gì?

Tránh sai lệch trong quá trình thu thập dữ liệu đảm bảo rằng mô hình thị giác máy tính của bạn hoạt động tốt trong nhiều tình huống khác nhau. Để giảm thiểu sai lệch, hãy cân nhắc thu thập dữ liệu từ nhiều nguồn khác nhau để nắm bắt các quan điểm và tình huống khác nhau. Đảm bảo sự cân bằng giữa tất cả các nhóm liên quan, chẳng hạn như độ tuổi, giới tính và dân tộc khác nhau. Thường xuyên xem xét và cập nhật bộ dữ liệu của bạn để xác định và giải quyết mọi sai lệch mới phát sinh. Các kỹ thuật như lấy mẫu quá mức các lớp được biểu diễn dưới mức, tăng cường dữ liệu và các thuật toán nhận biết tính công bằng cũng có thể giúp giảm thiểu sai lệch. Bằng cách sử dụng các chiến lược này, bạn duy trì một bộ dữ liệu mạnh mẽ và công bằng, giúp tăng cường khả năng khái quát hóa của mô hình.

Làm cách nào để đảm bảo tính nhất quán và chính xác cao trong chú thích dữ liệu?

Để đảm bảo tính nhất quán và độ chính xác cao trong việc gán nhãn dữ liệu, cần thiết lập các hướng dẫn gán nhãn rõ ràng và khách quan. Hướng dẫn của bạn nên chi tiết, kèm theo các ví dụ và hình minh họa để làm rõ những mong đợi. Tính nhất quán đạt được bằng cách thiết lập các tiêu chí tiêu chuẩn để chú thích các loại dữ liệu khác nhau, đảm bảo tất cả các chú thích tuân theo cùng một quy tắc. Để giảm thiểu sự thiên vị cá nhân, hãy đào tạo người chú thích để giữ thái độ trung lập và khách quan. Việc xem xét và cập nhật thường xuyên các quy tắc gán nhãn giúp duy trì tính chính xác và phù hợp với mục tiêu của dự án. Sử dụng các công cụ tự động để kiểm tra tính nhất quán và nhận phản hồi từ những người chú thích khác cũng góp phần duy trì các chú thích chất lượng cao.

Tôi cần bao nhiêu ảnh để huấn luyện các mô hình Ultralytics YOLO?

Để học chuyển giao hiệu quả và detect đối tượng với các mô hình Ultralytics YOLO, hãy bắt đầu với tối thiểu vài trăm đối tượng được chú thích cho mỗi lớp. Nếu chỉ huấn luyện cho một lớp, hãy bắt đầu với ít nhất 100 hình ảnh được chú thích và huấn luyện trong khoảng 100 epochs. Các tác vụ phức tạp hơn có thể yêu cầu hàng nghìn hình ảnh cho mỗi lớp để đạt được độ tin cậy và hiệu suất cao. Chú thích chất lượng là rất quan trọng, vì vậy hãy đảm bảo quy trình thu thập và chú thích dữ liệu của bạn chặt chẽ và phù hợp với các mục tiêu cụ thể của dự án. Khám phá các chiến lược huấn luyện chi tiết trong hướng dẫn huấn luyện YOLO26.

Những công cụ phổ biến nào để chú thích dữ liệu?

Một số công cụ mã nguồn mở phổ biến có thể hợp lý hóa quy trình chú thích dữ liệu:

Label Studio: Một công cụ linh hoạt hỗ trợ nhiều tác vụ chú thích, quản lý dự án và các tính năng kiểm soát chất lượng.
CVAT: Cung cấp nhiều định dạng chú thích và quy trình làm việc tùy chỉnh, phù hợp cho các dự án phức tạp.
Labelme: Lý tưởng để chú thích ảnh nhanh chóng và đơn giản bằng các đa giác.
LabelImg: Hoàn hảo để tạo các chú thích bounding box ở định dạng YOLO với giao diện đơn giản.

Các công cụ này có thể giúp nâng cao hiệu quả và độ chính xác của quy trình chú thích của bạn. Để biết danh sách và hướng dẫn tính năng mở rộng, hãy tham khảo tài liệu về công cụ chú thích dữ liệu của chúng tôi.

Những loại chú thích dữ liệu nào thường được sử dụng trong thị giác máy tính?

Các loại chú thích dữ liệu khác nhau phục vụ cho các tác vụ thị giác máy tính khác nhau:

Hộp giới hạn: Được sử dụng chủ yếu để phát hiện đối tượng, đây là các hộp hình chữ nhật xung quanh các đối tượng trong một hình ảnh.
Đa giác (Polygons): Cung cấp đường viền đối tượng chính xác hơn, phù hợp cho các tác vụ phân vùng thể hiện.
Masks: Cung cấp chi tiết đến cấp độ pixel, được sử dụng trong phân đoạn ngữ nghĩa để phân biệt các đối tượng với nền.
Keypoints: Xác định các điểm quan trọng cụ thể trong một hình ảnh, hữu ích cho các tác vụ như ước tính tư thế và phát hiện điểm mốc trên khuôn mặt.

Việc chọn loại chú thích phù hợp tùy thuộc vào yêu cầu của dự án bạn. Tìm hiểu thêm về cách triển khai các chú thích này và định dạng của chúng trong hướng dẫn chú thích dữ liệu của chúng tôi.

📅 Được tạo 1 năm trước ✍️ Cập nhật 5 ngày trước