Các tác vụ thị giác máy tính được hỗ trợ bởi Ultralytics YOLO26
Ultralytics YOLO26 là một framework AI linh hoạt hỗ trợ nhiều tác vụ thị giác máy tính. Framework này có thể được sử dụng để thực hiện phát hiện, phân đoạn, phân đoạn ngữ nghĩa, OBB, phân loại và ước tính tư thế. Mỗi tác vụ trong số này đều có mục tiêu và trường hợp sử dụng khác nhau, cho phép bạn giải quyết nhiều thách thức về thị giác máy tính khác nhau chỉ với một framework duy nhất.
Watch: Explore Ultralytics YOLO Tasks: Object Detection, Segmentation, OBB, Tracking, and Pose Estimation.
Phát hiện
Phát hiện là tác vụ chính được hỗ trợ bởi YOLO26. Nó bao gồm việc nhận diện các đối tượng trong hình ảnh hoặc khung hình video và vẽ các hộp bao (bounding box) xung quanh chúng. Các đối tượng được phát hiện sẽ được phân loại thành các danh mục khác nhau dựa trên đặc điểm của chúng. YOLO26 có thể phát hiện nhiều đối tượng trong một hình ảnh hoặc khung hình video với độ chính xác và tốc độ cao, giúp nó trở nên lý tưởng cho các ứng dụng thời gian thực như hệ thống giám sát và phương tiện tự hành.
Phân đoạn hình ảnh
Phân đoạn tiến xa hơn so với phát hiện đối tượng bằng cách tạo ra các mặt nạ (mask) ở cấp độ pixel cho từng đối tượng. Độ chính xác này rất hữu ích cho các ứng dụng như hình ảnh y tế, phân tích nông nghiệp và kiểm soát chất lượng sản xuất.
Phân đoạn ngữ nghĩa
Phân đoạn ngữ nghĩa gán một nhãn lớp cho mọi pixel trong hình ảnh, tạo ra một bản đồ lớp dày đặc cho toàn bộ cảnh quan. Khác với phân đoạn cá thể (instance segmentation), nó không phân biệt giữa các đối tượng riêng lẻ cùng loại. Điều này làm cho nó trở nên lý tưởng cho lái xe tự hành, phân tích cảnh quan và lập bản đồ lớp phủ đất, nơi việc hiểu bố cục không gian tổng thể quan trọng hơn việc xác định từng đối tượng riêng lẻ.
Phân loại
Phân loại bao gồm việc phân nhóm toàn bộ hình ảnh dựa trên nội dung của chúng. Tác vụ này là cần thiết cho các ứng dụng như phân loại sản phẩm trong thương mại điện tử, kiểm duyệt nội dung và giám sát động vật hoang dã.
Ước tính tư thế
Ước tính tư thế phát hiện các điểm chính (keypoints) cụ thể trong hình ảnh hoặc khung hình video để theo dõi chuyển động hoặc ước tính tư thế. Các điểm chính này có thể đại diện cho các khớp cơ thể người, đặc điểm khuôn mặt hoặc các điểm quan tâm quan trọng khác. YOLO26 vượt trội trong việc phát hiện điểm chính với độ chính xác và tốc độ cao, khiến nó trở nên giá trị cho các ứng dụng thể dục, phân tích thể thao và tương tác người-máy.
OBB
Phát hiện hộp bao định hướng (OBB) cải thiện phương pháp phát hiện đối tượng truyền thống bằng cách thêm một góc định hướng để xác định vị trí tốt hơn các đối tượng bị xoay. Khả năng này đặc biệt có giá trị cho phân tích hình ảnh trên không, xử lý tài liệu và các ứng dụng công nghiệp nơi các đối tượng xuất hiện ở nhiều góc độ khác nhau. YOLO26 mang lại độ chính xác và tốc độ cao cho việc phát hiện các đối tượng bị xoay trong nhiều tình huống đa dạng.
Kết luận
Ultralytics YOLO26 hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm phát hiện, phân đoạn cá thể, phân đoạn ngữ nghĩa, phân loại, phát hiện đối tượng định hướng và phát hiện điểm chính. Mỗi tác vụ giải quyết các nhu cầu cụ thể trong lĩnh vực thị giác máy tính, từ nhận diện đối tượng cơ bản đến phân tích tư thế chi tiết. Bằng cách hiểu rõ khả năng và ứng dụng của từng tác vụ, bạn có thể chọn phương pháp phù hợp nhất cho các thách thức thị giác máy tính cụ thể của mình và tận dụng các tính năng mạnh mẽ của YOLO26 để xây dựng các giải pháp hiệu quả.
Câu hỏi thường gặp
Ultralytics YOLO26 có thể thực hiện những tác vụ thị giác máy tính nào?
Ultralytics YOLO26 là một framework AI linh hoạt có khả năng thực hiện nhiều tác vụ thị giác máy tính khác nhau với độ chính xác và tốc độ cao. Các tác vụ này bao gồm:
- Phát hiện đối tượng: Xác định và định vị các đối tượng trong hình ảnh hoặc khung hình video bằng cách vẽ các hộp bao xung quanh chúng.
- Phân đoạn hình ảnh: Phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung, hữu ích cho các ứng dụng như hình ảnh y tế.
- Phân đoạn ngữ nghĩa: Gán một nhãn lớp cho mọi pixel trong hình ảnh để hiểu sâu về cảnh quan.
- Phân loại: Phân nhóm toàn bộ hình ảnh dựa trên nội dung của chúng.
- Ước tính tư thế: Phát hiện các điểm chính cụ thể trong hình ảnh hoặc khung hình video để theo dõi chuyển động hoặc tư thế.
- Phát hiện đối tượng định hướng (OBB): Phát hiện các đối tượng bị xoay với góc định hướng bổ sung để tăng độ chính xác.
Làm thế nào để sử dụng Ultralytics YOLO26 cho việc phát hiện đối tượng?
Để sử dụng Ultralytics YOLO26 cho việc phát hiện đối tượng, hãy làm theo các bước sau:
- Chuẩn bị bộ dữ liệu của bạn theo định dạng phù hợp.
- Huấn luyện mô hình YOLO26 bằng tác vụ phát hiện.
- Sử dụng mô hình để đưa ra dự đoán bằng cách nhập hình ảnh hoặc khung hình video mới.
from ultralytics import YOLO
# Load a pretrained YOLO model (adjust model type as needed)
model = YOLO("yolo26n.pt") # n, s, m, l, x versions available
# Perform object detection on an image
results = model.predict(source="image.jpg") # Can also use video, directory, URL, etc.
# Display the results
results[0].show() # Show the first image resultsĐể có hướng dẫn chi tiết hơn, hãy xem các ví dụ về phát hiện của chúng tôi.
Lợi ích của việc sử dụng YOLO26 cho các tác vụ phân đoạn là gì?
Việc sử dụng YOLO26 cho các tác vụ phân đoạn mang lại một số lợi thế:
- Độ chính xác cao: Tác vụ phân đoạn cung cấp các mặt nạ chính xác đến từng pixel.
- Tốc độ: YOLO26 được tối ưu hóa cho các ứng dụng thời gian thực, cung cấp khả năng xử lý nhanh ngay cả với hình ảnh có độ phân giải cao.
- Đa ứng dụng: Nó rất lý tưởng cho hình ảnh y tế, lái xe tự hành và các ứng dụng khác đòi hỏi phân đoạn hình ảnh chi tiết.
Tìm hiểu thêm về lợi ích và trường hợp sử dụng của YOLO26 cho phân đoạn trong phần phân đoạn hình ảnh.
Ultralytics YOLO26 có thể xử lý ước tính tư thế và phát hiện điểm chính không?
Có, Ultralytics YOLO26 có thể thực hiện hiệu quả việc ước tính tư thế và phát hiện điểm chính với độ chính xác và tốc độ cao. Tính năng này đặc biệt hữu ích cho việc theo dõi chuyển động trong các ứng dụng phân tích thể thao, chăm sóc sức khỏe và tương tác người-máy. YOLO26 phát hiện các điểm chính trong hình ảnh hoặc khung hình video, cho phép ước tính tư thế chính xác.
Để biết thêm chi tiết và mẹo triển khai, hãy truy cập các ví dụ về ước tính tư thế của chúng tôi.
Tại sao tôi nên chọn Ultralytics YOLO26 cho phát hiện đối tượng định hướng (OBB)?
Phát hiện đối tượng định hướng (OBB) với YOLO26 cung cấp độ chính xác nâng cao bằng cách phát hiện các đối tượng với tham số góc bổ sung. Tính năng này hữu ích cho các ứng dụng đòi hỏi định vị chính xác các đối tượng bị xoay, chẳng hạn như phân tích hình ảnh trên không và tự động hóa nhà kho.
- Tăng cường độ chính xác: Thành phần góc giúp giảm thiểu các kết quả dương tính giả cho các đối tượng bị xoay.
- Ứng dụng linh hoạt: Hữu ích cho các tác vụ trong phân tích địa không gian, robot, v.v.
Xem phần Phát hiện đối tượng định hướng để biết thêm chi tiết và ví dụ.