Các tác vụ thị giác máy tính được hỗ trợ bởi Ultralytics YOLO26

Ultralytics YOLO26 là một framework AI đa năng hỗ trợ nhiều tác vụ thị giác máy tính. Framework này có thể được sử dụng để thực hiện detect, segment, obb, phân loại và ước tính tư thế. Mỗi tác vụ này có một mục tiêu và trường hợp sử dụng khác nhau, cho phép bạn giải quyết nhiều thách thức thị giác máy tính khác nhau chỉ với một framework duy nhất.
Xem: Khám phá các Tác vụ Ultralytics YOLO: Phát Hiện Đối Tượng, Phân đoạn, OBB, Theo dõi và Ước tính Dáng điệu.
Phát hiện vật thể
detect là tác vụ chính được YOLO26 hỗ trợ. Nó bao gồm việc xác định các đối tượng trong một hình ảnh hoặc khung video và vẽ các hộp giới hạn xung quanh chúng. Các đối tượng được detect được phân loại thành các danh mục khác nhau dựa trên các đặc điểm của chúng. YOLO26 có thể detect nhiều đối tượng trong một hình ảnh hoặc khung video duy nhất với độ chính xác và tốc độ cao, làm cho nó lý tưởng cho các ứng dụng thời gian thực như hệ thống giám sát và phương tiện tự hành.
Phân đoạn hình ảnh
Phân đoạn đưa phát hiện đối tượng lên một tầm cao mới bằng cách tạo ra các mặt nạ cấp độ pixel cho từng đối tượng. Độ chính xác này hữu ích cho các ứng dụng như chẩn đoán hình ảnh y tế, phân tích nông nghiệp và kiểm soát chất lượng sản xuất.
Ví dụ về phân vùng (Segmentation)
Phân loại (Classification)
Phân loại liên quan đến việc phân loại toàn bộ hình ảnh dựa trên nội dung của chúng. Nhiệm vụ này rất cần thiết cho các ứng dụng như phân loại sản phẩm trong thương mại điện tử, kiểm duyệt nội dung và giám sát động vật hoang dã.
Ví dụ về phân loại (Classification)
Ước tính tư thế
Ước tính tư thế detect các điểm chính cụ thể trong hình ảnh hoặc khung video để track chuyển động hoặc ước tính tư thế. Các điểm chính này có thể đại diện cho các khớp người, đặc điểm khuôn mặt hoặc các điểm quan tâm quan trọng khác. YOLO26 vượt trội trong việc detect điểm chính với độ chính xác và tốc độ cao, làm cho nó có giá trị cho các ứng dụng thể dục, phân tích thể thao và tương tác người-máy.
OBB
detect hộp giới hạn có hướng (obb) nâng cao detect đối tượng truyền thống bằng cách thêm một góc định hướng để định vị tốt hơn các đối tượng xoay. Khả năng này đặc biệt có giá trị cho phân tích hình ảnh trên không, xử lý tài liệu và các ứng dụng công nghiệp nơi các đối tượng xuất hiện ở nhiều góc độ khác nhau. YOLO26 mang lại độ chính xác và tốc độ cao để detect các đối tượng xoay trong các kịch bản đa dạng.
Phát hiện theo hướng (Oriented Detection)
Kết luận
Ultralytics YOLO26 hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm detect, segment, phân loại, detect đối tượng có hướng và detect điểm chính. Mỗi tác vụ giải quyết các nhu cầu cụ thể trong lĩnh vực thị giác máy tính, từ nhận dạng đối tượng cơ bản đến phân tích tư thế chi tiết. Bằng cách hiểu rõ khả năng và ứng dụng của từng tác vụ, bạn có thể chọn phương pháp phù hợp nhất cho các thách thức thị giác máy tính cụ thể của mình và tận dụng các tính năng mạnh mẽ của YOLO26 để xây dựng các giải pháp hiệu quả.
Câu hỏi thường gặp
Ultralytics YOLO26 có thể thực hiện những tác vụ thị giác máy tính nào?
Ultralytics YOLO26 là một framework AI đa năng có khả năng thực hiện nhiều tác vụ thị giác máy tính khác nhau với độ chính xác và tốc độ cao. Các tác vụ này bao gồm:
- Phát hiện đối tượng (Object Detection): Xác định và định vị các đối tượng trong hình ảnh hoặc khung hình video bằng cách vẽ các bounding box xung quanh chúng.
- Phân đoạn ảnh (Image segmentation): Phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung của chúng, hữu ích cho các ứng dụng như hình ảnh y tế.
- Phân loại: Phân loại toàn bộ hình ảnh dựa trên nội dung của chúng.
- Ước tính tư thế (Pose estimation): Phát hiện các điểm chính cụ thể trong ảnh hoặc khung hình video để track chuyển động hoặc tư thế.
- Phát hiện đối tượng theo hướng (OBB): Phát hiện các đối tượng xoay với một góc định hướng được thêm vào để tăng cường độ chính xác.
Làm cách nào để tôi sử dụng Ultralytics YOLO26 cho detect đối tượng?
Để sử dụng Ultralytics YOLO26 cho tác vụ phát hiện đối tượng, hãy làm theo các bước sau:
- Chuẩn bị bộ dữ liệu của bạn ở định dạng thích hợp.
- Huấn luyện mô hình YOLO26 bằng cách sử dụng tác vụ phát hiện.
- Sử dụng mô hình để đưa ra dự đoán bằng cách đưa vào các hình ảnh hoặc khung hình video mới.
Ví dụ
from ultralytics import YOLO
# Load a pretrained YOLO model (adjust model type as needed)
model = YOLO("yolo26n.pt") # n, s, m, l, x versions available
# Perform object detection on an image
results = model.predict(source="image.jpg") # Can also use video, directory, URL, etc.
# Display the results
results[0].show() # Show the first image results
# Run YOLO detection from the command line
yolo detect model=yolo26n.pt source="image.jpg" # Adjust model and source as needed
Để biết hướng dẫn chi tiết hơn, hãy xem các ví dụ về phát hiện của chúng tôi.
Lợi ích của việc sử dụng YOLO26 cho các tác vụ segment là gì?
Sử dụng YOLO26 cho các tác vụ phân đoạn mang lại một số lợi ích:
- Độ chính xác cao: Tác vụ phân đoạn cung cấp các mặt nạ chính xác, ở cấp độ pixel.
- Tốc độ: YOLO26 được tối ưu hóa cho các ứng dụng thời gian thực, mang lại khả năng xử lý nhanh chóng ngay cả đối với hình ảnh độ phân giải cao.
- Nhiều ứng dụng: Nó lý tưởng cho xử lý ảnh y tế, lái xe tự động và các ứng dụng khác đòi hỏi phân vùng hình ảnh chi tiết.
Tìm hiểu thêm về lợi ích và các trường hợp sử dụng của YOLO26 cho phân đoạn trong phần phân đoạn hình ảnh.
Ultralytics YOLO26 có thể xử lý ước tính tư thế và detect điểm chính không?
Có, Ultralytics YOLO26 có thể thực hiện ước tính tư thế và phát hiện điểm chính một cách hiệu quả với độ chính xác và tốc độ cao. Tính năng này đặc biệt hữu ích cho việc theo dõi chuyển động trong phân tích thể thao, chăm sóc sức khỏe và các ứng dụng tương tác người-máy tính. YOLO26 phát hiện các điểm chính trong một khung hình hoặc video, cho phép ước tính tư thế chính xác.
Để biết thêm chi tiết và các mẹo triển khai, hãy truy cập các ví dụ về ước tính tư thế của chúng tôi.
Tại sao tôi nên chọn Ultralytics YOLO26 cho detect đối tượng có hướng (obb)?
Phát hiện đối tượng có hướng (OBB) với YOLO26 cung cấp độ chính xác nâng cao bằng cách phát hiện các đối tượng với một tham số góc bổ sung. Tính năng này có lợi cho các ứng dụng yêu cầu định vị chính xác các đối tượng xoay, chẳng hạn như phân tích hình ảnh trên không và tự động hóa kho bãi.
- Độ chính xác tăng lên: Thành phần góc làm giảm các kết quả dương tính giả cho các đối tượng xoay.
- Ứng dụng linh hoạt: Hữu ích cho các tác vụ trong phân tích không gian địa lý, robot học, v.v.
Xem phần Phát hiện đối tượng theo hướng để biết thêm chi tiết và ví dụ.