Meet YOLO26: next-gen vision AI.

Link to this sectionPhân đoạn thực thể (Instance Segmentation) và Theo dõi (Tracking) sử dụng Ultralytics YOLO26 🚀#

Link to this sectionPhân đoạn thực thể là gì?#

Phân đoạn thực thể là một tác vụ thị giác máy tính bao gồm việc nhận diện và khoanh vùng các đối tượng riêng lẻ trong hình ảnh ở cấp độ pixel. Không giống như phân đoạn ngữ nghĩa chỉ phân loại các pixel theo danh mục, phân đoạn thực thể gán nhãn duy nhất và vạch ra chính xác từng thực thể đối tượng, khiến nó trở nên quan trọng đối với các ứng dụng đòi hỏi hiểu biết không gian chi tiết như chẩn đoán hình ảnh y tế, xe tự lái và tự động hóa công nghiệp.

Ultralytics YOLO26 cung cấp các khả năng phân đoạn thực thể mạnh mẽ cho phép phát hiện biên đối tượng chính xác trong khi vẫn duy trì tốc độ và hiệu quả vốn có của các model YOLO.

Có hai loại theo dõi phân đoạn thực thể có sẵn trong gói Ultralytics:

  • Phân đoạn thực thể với đối tượng lớp: Mỗi đối tượng lớp được gán một màu duy nhất để phân tách trực quan rõ ràng.

  • Phân đoạn thực thể với các theo dõi đối tượng: Mỗi theo dõi được đại diện bởi một màu sắc riêng biệt, tạo điều kiện thuận lợi cho việc nhận dạng và theo dõi dễ dàng qua các khung hình video.



Watch: Instance Segmentation with Object Tracking using Ultralytics YOLO26

Link to this sectionMẫu#

Instance SegmentationPhân đoạn thực thể + Theo dõi đối tượng
Ultralytics Instance SegmentationUltralytics Instance Segmentation with Object Tracking
Ultralytics Instance Segmentation 😍Ultralytics Instance Segmentation với theo dõi đối tượng 🔥
Phân đoạn thực thể sử dụng Ultralytics YOLO
# Instance segmentation using Ultralytics YOLO26
yolo solutions isegment show=True

# Pass a source video
yolo solutions isegment source="path/to/video.mp4"

# Monitor the specific classes
yolo solutions isegment classes="[0, 5]"

Link to this sectionCác tham số của InstanceSegmentation#

Dưới đây là bảng các tham số InstanceSegmentation:

Đối sốLoạiMặc địnhMô tả
modelstrNoneĐường dẫn đến tệp model Ultralytics YOLO.

Bạn cũng có thể tận dụng các tham số track trong giải pháp InstanceSegmentation:

Đối sốLoạiMặc địnhMô tả
trackerstr'botsort.yaml'Chỉ định thuật toán tracking cần sử dụng. Các tùy chọn tích hợp sẵn: botsort.yaml, bytetrack.yaml, ocsort.yaml, deepocsort.yaml, fasttrack.yaml, tracktrack.yaml.
conffloat0.1Thiết lập ngưỡng tin cậy cho các phát hiện; các giá trị thấp hơn cho phép nhiều đối tượng được theo dõi hơn nhưng có thể bao gồm các kết quả dương tính giả.
ioufloat0.7Thiết lập ngưỡng Intersection over Union (IoU) để lọc các phát hiện chồng lấp.
classeslistNoneLọc kết quả theo chỉ số lớp. Ví dụ, classes=[0, 2, 3] chỉ theo dõi các lớp đã chỉ định.
verboseboolTrueKiểm soát việc hiển thị kết quả theo dõi, cung cấp đầu ra trực quan của các đối tượng được theo dõi.
devicestrNoneChỉ định thiết bị để thực hiện suy luận (ví dụ: cpu, cuda:0 hoặc 0). Cho phép người dùng chọn giữa CPU, một GPU cụ thể, hoặc các thiết bị tính toán khác để thực thi model.

Hơn nữa, các tham số trực quan hóa sau đây cũng có sẵn:

Đối sốLoạiMặc địnhMô tả
showboolFalseNếu True, hiển thị các hình ảnh hoặc video đã được chú thích trong một cửa sổ. Hữu ích cho phản hồi trực quan ngay lập tức trong quá trình phát triển hoặc kiểm thử.
line_widthint or NoneNoneChỉ định độ dày đường của bounding box. Nếu None, độ dày đường được tự động điều chỉnh dựa trên kích thước hình ảnh. Cung cấp khả năng tùy chỉnh trực quan để rõ ràng hơn.
show_confboolTrueHiển thị điểm số tin cậy (confidence score) cho mỗi phát hiện cùng với nhãn. Cung cấp thông tin chi tiết về độ chắc chắn của model đối với từng phát hiện.
show_labelsboolTrueHiển thị nhãn cho mỗi phát hiện trong đầu ra hình ảnh. Cung cấp khả năng nhận biết tức thì các đối tượng được phát hiện.

Link to this sectionCác ứng dụng của phân đoạn thực thể#

Phân đoạn thực thể với YOLO26 có vô số ứng dụng thực tế trong nhiều ngành công nghiệp:

Link to this sectionQuản lý và Tái chế Rác thải#

YOLO26 có thể được sử dụng tại các cơ sở quản lý chất thải để nhận diện và phân loại các loại vật liệu khác nhau. Model có thể phân đoạn rác thải nhựa, bìa cứng, kim loại và các loại vật liệu tái chế khác với độ chính xác cao, giúp các hệ thống phân loại tự động xử lý rác thải hiệu quả hơn. Điều này đặc biệt có giá trị khi chỉ khoảng 10% trong số 7 tỷ tấn rác thải nhựa được tạo ra trên toàn cầu được tái chế.

Link to this sectionXe tự hành#

Trong xe tự lái, phân đoạn thực thể giúp nhận diện và theo dõi người đi bộ, phương tiện, biển báo giao thông và các yếu tố đường bộ khác ở cấp độ pixel. Hiểu biết chính xác về môi trường là yếu tố then chốt cho các quyết định điều hướng và an toàn. Hiệu suất thời gian thực của YOLO26 khiến nó trở nên lý tưởng cho các ứng dụng đòi hỏi tốc độ cao này.

Link to this sectionChẩn đoán hình ảnh y tế#

Phân đoạn thực thể có thể nhận diện và khoanh vùng khối u, cơ quan hoặc cấu trúc tế bào trong các bản quét y tế. Khả năng vạch ra chính xác biên đối tượng của YOLO26 giúp nó trở nên hữu ích cho chẩn đoán y tế và lập kế hoạch điều trị.

Link to this sectionGiám sát công trường xây dựng#

Tại các công trường xây dựng, phân đoạn thực thể có thể theo dõi máy móc hạng nặng, công nhân và vật liệu. Điều này giúp đảm bảo an toàn bằng cách giám sát vị trí thiết bị và phát hiện khi công nhân đi vào các khu vực nguy hiểm, đồng thời tối ưu hóa quy trình làm việc và phân bổ nguồn lực.

Link to this sectionLưu ý#

Đối với bất kỳ thắc mắc nào, vui lòng đăng câu hỏi của bạn trong Phần Issue của Ultralytics hoặc phần thảo luận được đề cập bên dưới.

Link to this sectionCâu hỏi thường gặp#

Link to this sectionLàm thế nào để thực hiện phân đoạn thực thể bằng Ultralytics YOLO26?#

Để thực hiện phân đoạn thực thể bằng Ultralytics YOLO26, hãy khởi tạo model YOLO với phiên bản YOLO26 dành cho phân đoạn và xử lý các khung hình video thông qua đó. Dưới đây là ví dụ code đơn giản:

import cv2

from ultralytics import solutions

cap = cv2.VideoCapture("path/to/video.mp4")
assert cap.isOpened(), "Error reading video file"

# Video writer
w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))
video_writer = cv2.VideoWriter("instance-segmentation.avi", cv2.VideoWriter_fourcc(*"mp4v"), fps, (w, h))

# Init InstanceSegmentation
isegment = solutions.InstanceSegmentation(
    show=True,  # display the output
    model="yolo26n-seg.pt",  # model="yolo26n-seg.pt" for object segmentation using YOLO26.
)

# Process video
while cap.isOpened():
    success, im0 = cap.read()
    if not success:
        print("Video frame is empty or processing is complete.")
        break
    results = isegment(im0)
    video_writer.write(results.plot_im)

cap.release()
video_writer.release()
cv2.destroyAllWindows()

Tìm hiểu thêm về phân đoạn thực thể trong hướng dẫn Ultralytics YOLO26.

Link to this sectionSự khác biệt giữa phân đoạn thực thể và theo dõi đối tượng trong Ultralytics YOLO26 là gì?#

Phân đoạn thực thể nhận diện và khoanh vùng các đối tượng riêng lẻ trong một hình ảnh, gán cho mỗi đối tượng một nhãn và mask duy nhất. Theo dõi đối tượng mở rộng điều này bằng cách gán các ID nhất quán cho đối tượng qua các khung hình video, tạo điều kiện thuận lợi cho việc theo dõi liên tục cùng một đối tượng theo thời gian. Khi kết hợp lại, như trong triển khai của YOLO26, bạn có được những khả năng mạnh mẽ để phân tích chuyển động và hành vi của đối tượng trong video trong khi vẫn duy trì thông tin biên chính xác.

Link to this sectionTại sao tôi nên sử dụng Ultralytics YOLO26 cho phân đoạn thực thể và theo dõi thay vì các model khác như Mask R-CNN hoặc Faster R-CNN?#

Ultralytics YOLO26 cung cấp hiệu suất thời gian thực, độ chính xác vượt trội và dễ sử dụng so với các model khác như Mask R-CNN hoặc Faster R-CNN. YOLO26 xử lý hình ảnh trong một lượt truyền duy nhất (phát hiện một giai đoạn), giúp nó nhanh hơn đáng kể trong khi vẫn duy trì độ chính xác cao. Nó cũng cung cấp khả năng tích hợp liền mạch với Nền tảng Ultralytics, cho phép người dùng quản lý các model, tập dữ liệu và đường ống đào tạo một cách hiệu quả. Đối với các ứng dụng đòi hỏi cả tốc độ và độ chính xác, YOLO26 cung cấp sự cân bằng tối ưu.

Link to this sectionCó tập dữ liệu nào do Ultralytics cung cấp phù hợp để đào tạo các model YOLO26 cho phân đoạn thực thể và theo dõi không?#

Có, Ultralytics cung cấp một số tập dữ liệu phù hợp để đào tạo các model YOLO26 cho phân đoạn thực thể, bao gồm COCO-Seg, COCO8-Seg (một tập con nhỏ hơn để kiểm tra nhanh), Package-SegCrack-Seg. Các tập dữ liệu này đi kèm với các chú thích ở cấp độ pixel cần thiết cho các tác vụ phân đoạn thực thể. Đối với các ứng dụng chuyên biệt hơn, bạn cũng có thể tạo tập dữ liệu tùy chỉnh theo định dạng Ultralytics. Thông tin đầy đủ về tập dữ liệu và hướng dẫn sử dụng có thể được tìm thấy trong tài liệu về Tập dữ liệu Ultralytics.

Bình luận