Nhiệm vụ thị giác máy tính được hỗ trợ bởi Ultralytics YOLO11

Ultralytics YOLO11 là một khuôn khổ AI đa năng hỗ trợ nhiều tác vụ thị giác máy tính . Khuôn khổ này có thể được sử dụng để thực hiện phát hiện , phân đoạn , obb , phân loại và ước tính tư thế . Mỗi tác vụ này có một mục tiêu và trường hợp sử dụng khác nhau, cho phép bạn giải quyết nhiều thách thức về thị giác máy tính khác nhau bằng một khuôn khổ duy nhất.

Đồng hồ: Khám phá Ultralytics YOLO Nhiệm vụ: Phát hiện đối tượng, Phân đoạn, OBB, Theo dõi và Ước tính tư thế.

Phát hiện

Phát hiện là nhiệm vụ chính được hỗ trợ bởi YOLO11 . Nó bao gồm việc xác định các đối tượng trong một khung hình ảnh hoặc video và vẽ các hộp giới hạn xung quanh chúng. Các đối tượng được phát hiện được phân loại thành các loại khác nhau dựa trên các đặc điểm của chúng. YOLO11 có thể phát hiện nhiều đối tượng trong một hình ảnh hoặc khung hình video với độ chính xác và tốc độ cao, lý tưởng cho các ứng dụng thời gian thực như hệ thống giám sát và xe tự hành .

Ví dụ phát hiện

Phân đoạn hình ảnh

Phân đoạn đưa việc phát hiện đối tượng tiến xa hơn bằng cách phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung. Mỗi vùng được gán một nhãn, cung cấp độ chính xác ở cấp độ pixel cho các ứng dụng như hình ảnh y tế , phân tích nông nghiệp và kiểm soát chất lượng sản xuất . YOLO11 triển khai một biến thể của kiến trúc U-Net để thực hiện phân đoạn hiệu quả và chính xác.

Ví dụ về phân đoạn

Phân loại

Phân loại bao gồm việc phân loại toàn bộ hình ảnh dựa trên nội dung của chúng. YOLO11 Khả năng phân loại của tận dụng một biến thể của kiến trúc EfficientNet để cung cấp phân loại hình ảnh hiệu suất cao. Nhiệm vụ này rất cần thiết cho các ứng dụng như phân loại sản phẩm trong thương mại điện tử, kiểm duyệt nội dung và giám sát động vật hoang dã .

Ví dụ phân loại

Ước tính tư thế

Ước tính tư thế phát hiện các điểm chính cụ thể trong hình ảnh hoặc khung video để theo dõi chuyển động hoặc ước tính tư thế. Các điểm chính này có thể biểu thị khớp xương, đặc điểm khuôn mặt hoặc các điểm quan trọng khác của con người. YOLO11 có khả năng phát hiện điểm quan trọng với độ chính xác và tốc độ cao, rất hữu ích cho các ứng dụng thể dục , phân tích thể thao và tương tác giữa người và máy tính .

Ví dụ về tư thế

OBB

Phát hiện Hộp giới hạn định hướng (OBB) tăng cường khả năng phát hiện vật thể truyền thống bằng cách thêm góc định hướng để định vị tốt hơn các vật thể xoay. Khả năng này đặc biệt có giá trị đối với phân tích hình ảnh trên không , xử lý tài liệu và các ứng dụng công nghiệp trong đó các vật thể xuất hiện ở nhiều góc độ khác nhau. YOLO11 mang lại độ chính xác và tốc độ cao để phát hiện các vật thể quay trong nhiều tình huống khác nhau.

Phát hiện định hướng

Phần kết luận

Ultralytics YOLO11 hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm phát hiện, phân đoạn, phân loại, phát hiện đối tượng định hướng và phát hiện điểm chính. Mỗi tác vụ giải quyết các nhu cầu cụ thể trong bối cảnh thị giác máy tính, từ nhận dạng đối tượng cơ bản đến phân tích tư thế chi tiết. Bằng cách hiểu các khả năng và ứng dụng của từng tác vụ, bạn có thể chọn cách tiếp cận phù hợp nhất cho các thách thức thị giác máy tính cụ thể của mình và tận dụng YOLO11 Các tính năng mạnh mẽ của 's để xây dựng các giải pháp hiệu quả.

CÂU HỎI THƯỜNG GẶP

Những nhiệm vụ về thị giác máy tính có thể Ultralytics YOLO11 trình diễn?

Ultralytics YOLO11 là một khuôn khổ AI đa năng có khả năng thực hiện nhiều tác vụ thị giác máy tính khác nhau với độ chính xác và tốc độ cao. Các tác vụ này bao gồm:

Phát hiện đối tượng : Xác định và định vị các đối tượng trong hình ảnh hoặc khung hình video bằng cách vẽ các hộp giới hạn xung quanh chúng.
Phân đoạn hình ảnh : Phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung của chúng, hữu ích cho các ứng dụng như hình ảnh y tế.
Phân loại : Phân loại toàn bộ hình ảnh dựa trên nội dung của chúng, tận dụng các biến thể của kiến trúc EfficientNet.
Ước tính tư thế : Phát hiện các điểm chính cụ thể trong khung hình ảnh hoặc video để theo dõi chuyển động hoặc tư thế.
Phát hiện đối tượng định hướng (OBB) : Phát hiện các đối tượng xoay với góc định hướng bổ sung để tăng độ chính xác.

Tôi sử dụng như thế nào Ultralytics YOLO11 để phát hiện vật thể?

Để sử dụng Ultralytics YOLO11 để phát hiện đối tượng, hãy làm theo các bước sau:

Chuẩn bị tập dữ liệu của bạn theo định dạng phù hợp.
Đào tạo YOLO11 mô hình sử dụng nhiệm vụ phát hiện.
Sử dụng mô hình để đưa ra dự đoán bằng cách đưa vào hình ảnh hoặc khung hình video mới.

Ví dụ

PythonCLI

from ultralytics import YOLO

# Load a pre-trained YOLO model (adjust model type as needed)
model = YOLO("yolo11n.pt")  # n, s, m, l, x versions available

# Perform object detection on an image
results = model.predict(source="image.jpg")  # Can also use video, directory, URL, etc.

# Display the results
results[0].show()  # Show the first image results

# Run YOLO detection from the command line
yolo detect model=yolo11n.pt source="image.jpg" # Adjust model and source as needed

Để biết hướng dẫn chi tiết hơn, hãy xem các ví dụ phát hiện của chúng tôi.

Lợi ích của việc sử dụng là gì? YOLO11 cho nhiệm vụ phân đoạn?

Sử dụng YOLO11 cho các nhiệm vụ phân đoạn cung cấp một số lợi thế:

Độ chính xác cao: Nhiệm vụ phân đoạn tận dụng một biến thể của kiến trúc U-Net để đạt được phân đoạn chính xác.
Tốc độ: YOLO11 được tối ưu hóa cho các ứng dụng thời gian thực, cung cấp khả năng xử lý nhanh ngay cả đối với hình ảnh có độ phân giải cao.
Nhiều ứng dụng: Lý tưởng cho chụp ảnh y tế, lái xe tự động và các ứng dụng khác yêu cầu phân đoạn hình ảnh chi tiết.

Tìm hiểu thêm về lợi ích và trường hợp sử dụng của YOLO11 để phân đoạn trong phần phân đoạn hình ảnh .

Có thể Ultralytics YOLO11 xử lý ước lượng tư thế và phát hiện điểm chính?

Đúng, Ultralytics YOLO11 có thể thực hiện hiệu quả ước tính tư thế và phát hiện điểm chính với độ chính xác và tốc độ cao. Tính năng này đặc biệt hữu ích để theo dõi chuyển động trong phân tích thể thao, chăm sóc sức khỏe và các ứng dụng tương tác giữa người và máy tính. YOLO11 phát hiện các điểm chính trong khung hình ảnh hoặc video, cho phép ước tính tư thế chính xác.

Để biết thêm chi tiết và mẹo triển khai, hãy xem ví dụ ước tính tư thế của chúng tôi.

Tại sao tôi nên chọn Ultralytics YOLO11 để phát hiện vật thể định hướng (OBB)?

Phát hiện đối tượng định hướng (OBB) với YOLO11 cung cấp độ chính xác nâng cao bằng cách phát hiện các đối tượng có tham số góc bổ sung. Tính năng này có lợi cho các ứng dụng yêu cầu định vị chính xác các đối tượng quay, chẳng hạn như phân tích hình ảnh trên không và tự động hóa kho hàng.

Tăng độ chính xác: Thành phần góc làm giảm kết quả dương tính giả đối với các vật thể bị xoay.
Ứng dụng đa năng: Hữu ích cho các nhiệm vụ phân tích không gian địa lý, robot, v.v.

Hãy xem phần Phát hiện đối tượng định hướng để biết thêm chi tiết và ví dụ.

📅 Được tạo cách đây 1 năm ✏️ Đã cập nhật cách đây 27 ngày