Chuyển đến nội dung

Trình chỉnh sửa chú thích

Nền tảng Ultralytics bao gồm một trình chỉnh sửa chú thích mạnh mẽ để gắn nhãn hình ảnh với hộp giới hạn, đa giác, điểm chính, hộp định hướng và phân loại. Trình chỉnh sửa hỗ trợ chú thích thủ công, chú thích thông minh được hỗ trợ bởi SAM và tự động gắn nhãn YOLO.

graph TB
    subgraph Manual["✏️ Manual Tools"]
        A[Box] & B[Polygon] & C[Keypoint] & D[OBB] & E[Classify]
    end
    subgraph AI["🤖 AI-Assisted"]
        F[SAM Smart] & G[Auto-Annotate]
    end
    Manual --> H[📁 Save Labels]
    AI --> H

Các loại tác vụ được hỗ trợ

Trình chỉnh sửa chú thích hỗ trợ tất cả 5 loại tác vụ YOLO:

Tác vụCông cụĐịnh dạng chú thích
Phát hiệnHình chữ nhậtHộp giới hạn (x, y, chiều rộng, chiều cao)
Phân đoạnĐa giácMặt nạ chính xác đến từng pixel (đỉnh đa giác)
Pose (Dáng điệu/Tư thế)Điểm chínhKhung xương COCO 17 điểm
OBBHộp định hướngHộp giới hạn xoay (4 góc)
Phân loạiBộ chọn lớpNhãn cấp độ hình ảnh

Chi tiết nhiệm vụ

Phát Hiện Đối Tượng

Chức năng: Xác định các đối tượng và vị trí của chúng bằng các hộp giới hạn thẳng hàng với trục tọa độ.

Định dạng nhãn: class_id center_x center_y width height (tất cả đều được chuẩn hóa từ 0 đến 1)

Ví dụ: 0 0.5 0.5 0.2 0.3 — Lớp 0 được căn giữa tại (50%, 50%) với chiều rộng 20% và chiều cao 30%

Các trường hợp sử dụng: Kiểm kê hàng tồn kho, giám sát giao thông, phát hiện động vật hoang dã, hệ thống an ninh.

Phân đoạn thực thể

Chức năng: Tạo mặt nạ chính xác đến từng pixel cho mỗi đối tượng.

Định dạng nhãn: class_id x1 y1 x2 y2 x3 y3 ... (các đỉnh đa giác, được chuẩn hóa từ 0 đến 1)

Ví dụ: 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 — Mặt nạ tứ giác

Ứng dụng thực tế: Chụp ảnh y tế, xe tự hành, chỉnh sửa ảnh, phân tích nông nghiệp.

Ước tính tư thế

Chức năng: Phát hiện các điểm mấu chốt trên cơ thể để theo dõi khung xương.

Định dạng nhãn: class_id cx cy w h kx1 ky1 v1 kx2 ky2 v2 ...

  • Cờ hiển thị: 0=không được dán nhãn, 1=đã được gắn nhãn nhưng bị che khuất, 2=được dán nhãn và hiển thị

Ví dụ: 0 0.5 0.5 0.2 0.3 0.6 0.7 2 0.4 0.8 1 — Người có 2 điểm chính

Ứng dụng: Phân tích thể thao, vật lý trị liệu, hoạt hình, nhận dạng cử chỉ

Hộp giới hạn có hướng (OBB)

Chức năng: Phát hiện các đối tượng xoay bằng hộp giới hạn có tính đến góc xoay.

Định dạng nhãn: class_id x1 y1 x2 y2 x3 y3 x4 y4 (bốn điểm góc, đã được chuẩn hóa)

Ví dụ: 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 — Hình chữ nhật xoay

Ứng dụng: Ảnh chụp từ trên không, phân tích tài liệu, kiểm tra sản xuất, phát hiện tàu thuyền.

Phân loại hình ảnh

Chức năng: Gán một nhãn duy nhất cho toàn bộ hình ảnh.

Định dạng nhãn: Phân loại theo thư mục — hình ảnh được sắp xếp theo tên lớp (train/cats/, train/dogs/)

Ứng dụng: Kiểm duyệt nội dung, kiểm soát chất lượng, chẩn đoán y tế, nhận dạng hiện trường.

Bắt đầu

Để chú thích hình ảnh:

  1. Điều hướng đến tập dữ liệu của bạn
  2. Nhấp vào một hình ảnh để mở trình xem toàn màn hình
  3. Nhấp vào Chỉnh sửa để vào chế độ chú thích
  4. Chọn công cụ chú thích của bạn
  5. Vẽ chú thích trên hình ảnh
  6. Nhấp vào Lưu khi hoàn tất

Công cụ chú thích thủ công

Hộp giới hạn (detect)

Vẽ các hộp hình chữ nhật xung quanh đối tượng:

  1. Chọn Hộp công cụ hoặc nhấn B
  2. Nhấp và kéo để vẽ hình chữ nhật
  3. Thả chuột để hoàn tất hộp
  4. Chọn một lớp từ danh sách thả xuống

Thay đổi kích thước và Di chuyển

  • Kéo các góc hoặc cạnh để thay đổi kích thước
  • Kéo trung tâm để di chuyển
  • Nhấn Delete để xóa chú thích đã chọn

Đa giác (segment)

Vẽ mặt nạ đa giác chính xác:

  1. Chọn Đa giác công cụ hoặc nhấn P
  2. Nhấp để thêm các đỉnh
  3. Nhấp đúp hoặc nhấn Enter để đóng đa giác
  4. Chọn một lớp từ danh sách thả xuống

Chỉnh sửa các đỉnh

  • Kéo từng đỉnh để điều chỉnh
  • Kéo toàn bộ đa giác để di chuyển
  • Nhấp vào một đỉnh và nhấn Delete để xóa nó

Điểm chính (Tư thế)

Đặt 17 điểm khóa COCO cho tư thế người:

  1. Chọn Điểm chính công cụ hoặc nhấn K
  2. Nhấp để đặt các điểm khóa theo trình tự
  3. Tuân theo thứ tự xương COCO

17 điểm khóa COCO là:

#Điểm chính#Điểm chính
1Mũi10Cổ tay phải
2Mắt trái11Hông trái
3Mắt phải12Hông phải
4Tai trái13Đầu gối trái
5Tai phải14Đầu gối phải
6Vai trái15Mắt cá chân trái
7Vai phải16Mắt cá chân phải
8Khuỷu tay trái17(dành riêng)
9Khuỷu tay phải

Hộp giới hạn có hướng (OBB)

Vẽ hộp xoay cho các đối tượng có góc nghiêng:

  1. Chọn OBB công cụ hoặc nhấn O
  2. Nhấp và kéo để vẽ một hộp ban đầu
  3. Sử dụng tay cầm xoay để điều chỉnh góc
  4. Chọn một lớp từ danh sách thả xuống

Phân loại (classify)

Gán nhãn lớp cấp độ hình ảnh:

  1. Chọn chế độ classify
  2. Nhấp vào các nút lớp hoặc nhấn phím số 1-9
  3. Nhiều lớp có thể được gán cho mỗi hình ảnh

Chú thích thông minh SAM

Segment Anything Model (SAM) cho phép chú thích thông minh chỉ với vài cú nhấp chuột:

  1. Chọn SAM chế độ hoặc nhấn S
  2. Nhấp chuột trái để thêm điểm tích cực (bao gồm khu vực này)
  3. Nhấp chuột phải để thêm điểm tiêu cực (loại trừ khu vực này)
  4. SAM tạo ra một mặt nạ chính xác theo thời gian thực
  5. Nhấp Chấp nhận để chuyển đổi thành chú thích

Mẹo SAM

  • Bắt đầu bằng một cú nhấp tích cực vào trung tâm đối tượng
  • Thêm các cú nhấp tiêu cực để loại trừ nền
  • Hoạt động tốt nhất cho các đối tượng riêng biệt có cạnh rõ ràng

Chú thích thông minh SAM có thể tạo ra:

  • Đa giác cho các tác vụ segment
  • Hộp giới hạn cho các tác vụ detect
  • Hộp định hướng cho các tác vụ obb

Tự động chú thích YOLO

Sử dụng các mô hình YOLO đã được huấn luyện để tự động gán nhãn hình ảnh:

  1. Chọn Tự động chú thích chế độ hoặc nhấn A
  2. Chọn một mô hình (chính thức hoặc các mô hình đã được huấn luyện của bạn)
  3. Đặt ngưỡng tin cậy
  4. Nhấp vào Chạy để tạo ra các dự đoán
  5. Xem xét và chỉnh sửa kết quả khi cần

Mô hình tự động chú thích

Bạn có thể sử dụng:

  • Chính thức Ultralytics các mẫu (YOLO26n, YOLO26s, v.v.)
  • Các mô hình đã được huấn luyện của riêng bạn từ Nền tảng

Quản lý lớp

Tạo Lớp

Xác định các lớp chú thích cho tập dữ liệu của bạn:

  1. Nhấp vào Thêm Lớp trong bảng lớp
  2. Nhập tên lớp
  3. Một màu được gán tự động

Thêm lớp mới trong quá trình chú thích

Bạn có thể tạo các lớp mới trực tiếp trong khi chú thích mà không cần rời khỏi trình chỉnh sửa:

  1. Vẽ chú thích lên hình ảnh
  2. Trong menu thả xuống "Lớp học", hãy nhấp vào "Thêm lớp học mới".
  3. Nhập tên lớp
  4. Nhấn Enter để tạo và gán

Điều này cho phép quy trình làm việc liền mạch, nơi bạn có thể định nghĩa các lớp khi gặp các loại đối tượng mới trong dữ liệu của mình.

Bảng các lớp thống nhất

Tất cả các lớp trong tập dữ liệu của bạn được quản lý trong một bảng thống nhất. Các thay đổi về tên lớp hoặc màu sắc sẽ tự động được áp dụng cho toàn bộ tập dữ liệu.

Chỉnh sửa Lớp

  • Nhấp vào một lớp để chọn nó cho các chú thích mới
  • Nhấp đúp để đổi tên
  • Kéo để sắp xếp lại
  • Nhấp chuột phải để có thêm tùy chọn

Màu sắc của lớp

Mỗi lớp được gán một màu từ bảng màu Ultralytics. Màu sắc nhất quán trên toàn Nền tảng để dễ dàng nhận biết.

Phím tắt bàn phím

Chú thích hiệu quả với các phím tắt:

Phím tắtHành động
BCông cụ hộp (detect)
PCông cụ đa giác (segment)
KCông cụ điểm khóa (tư thế)
OCông cụ OBB
SChú thích thông minh SAM
ATự động chú thích
VChế độ chọn/di chuyển
1-9Chọn lớp 1-9
DeleteXóa chú thích đã chọn
Ctrl+ZHoàn tác
Ctrl+YLàm lại
EscapeHủy thao tác hiện tại
EnterHoàn thành đa giác
←/→Ảnh trước/kế tiếp
Xem tất cả phím tắt

Nhấn ? để mở hộp thoại phím tắt bàn phím.

Hoàn tác/Làm lại

Trình chỉnh sửa chú thích duy trì toàn bộ lịch sử:

  • Hoàn tác: Ctrl+Z (Cmd+Z trên Mac)
  • Làm lại: Ctrl+Y (Cmd+Y trên Mac)

Lịch sử bao gồm:

  • Thêm chú thích
  • Chỉnh sửa chú thích
  • Xóa chú thích
  • Thay đổi lớp

Lưu Chú thích

Chú thích được lưu khi bạn nhấp vào Lưu hoặc di chuyển đi:

  • Lưu: Nhấp vào nút lưu hoặc nhấn Ctrl+S
  • Hủy: Nhấp vào hủy để loại bỏ các thay đổi
  • Cảnh báo tự động lưu: Nhắc nhở về các thay đổi chưa lưu trước khi rời đi

Lưu công việc của bạn

Luôn lưu trước khi chuyển sang hình ảnh khác. Các thay đổi chưa lưu sẽ bị mất.

Câu hỏi thường gặp

Chú thích SAM có độ chính xác như thế nào?

SAM cung cấp các mask chất lượng cao cho hầu hết các đối tượng. Độ chính xác phụ thuộc vào:

  • Sự khác biệt của đối tượng so với nền
  • Chất lượng và độ phân giải hình ảnh
  • Số lượng điểm dương/âm được cung cấp

Để có kết quả tốt nhất, hãy bắt đầu với một điểm dương tại trung tâm đối tượng và thêm các điểm âm để loại trừ các đối tượng lân cận.

Tôi có thể nhập các chú thích hiện có không?

Có, hãy tải lên tập dữ liệu của bạn với các tệp nhãn định dạng YOLO. Nền tảng sẽ tự động phân tích cú pháp và hiển thị chúng trong trình chỉnh sửa.

Làm cách nào để tôi chú thích nhiều đối tượng cùng một lớp?

Sau khi vẽ một chú thích:

  1. Giữ nguyên lớp đã chọn
  2. Vẽ chú thích tiếp theo
  3. Lặp lại cho đến khi tất cả các đối tượng được gán nhãn

Phím tắt 1-9 chọn nhanh các lớp.

Sự khác biệt giữa SAM và tự động chú thích là gì?

Tính năngSAMTự động chú thích
Phương thứcLời nhắc điểm tương tácSuy luận mô hình
Tốc độMột đối tượng mỗi lầnTất cả các đối tượng cùng lúc
Độ chính xácRất cao với hướng dẫnPhụ thuộc vào mô hình
Tốt nhất choCác đối tượng phức tạp, chi tiết nhỏGán nhãn hàng loạt, các đối tượng đơn giản

Tôi có thể huấn luyện trên các tập dữ liệu được chú thích một phần không?

Có, nhưng để có kết quả tốt nhất:

  • Gán nhãn tất cả các đối tượng thuộc các lớp mục tiêu của bạn trong mỗi hình ảnh
  • Sử dụng phân tách unknown cho các hình ảnh chưa được gán nhãn
  • Loại trừ hình ảnh chưa được gắn nhãn khỏi cấu hình huấn luyện


📅 Được tạo 20 ngày trước ✏️ Cập nhật 14 ngày trước
glenn-jocher

Bình luận