Bỏ để qua phần nội dung

Ultralytics Nhiệm vụ YOLO11


Ultralytics YOLO Các tác vụ được hỗ trợ

YOLO11 là một khuôn khổ AI hỗ trợ nhiều tác vụ thị giác máy tính . Khuôn khổ này có thể được sử dụng để thực hiện phát hiện , phân đoạn , obb , phân loại và ước tính tư thế . Mỗi tác vụ này có một mục tiêu và trường hợp sử dụng khác nhau.



Xem: Khám phá Ultralytics YOLO Nhiệm vụ: Phát hiện đối tượng, Phân đoạn, OBB, Theo dõi và Ước tính tư thế.

Detection

Phát hiện là nhiệm vụ chính được YOLO11 hỗ trợ. Nhiệm vụ này bao gồm phát hiện các đối tượng trong một khung hình ảnh hoặc video và vẽ các hộp giới hạn xung quanh chúng. Các đối tượng được phát hiện được phân loại thành các danh mục khác nhau dựa trên các đặc điểm của chúng. YOLO11 có thể phát hiện nhiều đối tượng trong một khung hình ảnh hoặc video với độ chính xác và tốc độ cao.

Ví dụ phát hiện

Phân đoạn

Phân đoạn là một nhiệm vụ liên quan đến việc phân đoạn một hình ảnh thành các vùng khác nhau dựa trên nội dung của hình ảnh. Mỗi vùng được gán một nhãn dựa trên nội dung của nó. Nhiệm vụ này hữu ích trong các ứng dụng như phân đoạn hình ảnh và hình ảnh y tế. YOLO11 sử dụng một biến thể của kiến trúc U-Net để thực hiện phân đoạn.

Ví dụ về phân đoạn

Phân loại

Phân loại là một nhiệm vụ liên quan đến việc phân loại hình ảnh thành các danh mục khác nhau. YOLO11 có thể được sử dụng để phân loại hình ảnh dựa trên nội dung của chúng. Nó sử dụng một biến thể của kiến trúc EfficientNet để thực hiện phân loại.

Ví dụ phân loại

Tư thế

Phát hiện Pose/keypoint là một nhiệm vụ liên quan đến việc phát hiện các điểm cụ thể trong một khung hình ảnh hoặc video. Các điểm này được gọi là keypoint và được sử dụng để theo dõi chuyển động hoặc ước tính tư thế. YOLO11 có thể phát hiện các keypoint trong một khung hình ảnh hoặc video với độ chính xác và tốc độ cao.

Đặt ví dụ

OBB

Phát hiện vật thể định hướng tiến xa hơn so với phát hiện vật thể thông thường bằng cách đưa vào một góc bổ sung để định vị vật thể chính xác hơn trong hình ảnh. YOLO11 có thể phát hiện vật thể xoay trong hình ảnh hoặc khung video với độ chính xác và tốc độ cao.

Phát hiện theo hướng

Kết thúc

YOLO11 hỗ trợ nhiều tác vụ, bao gồm phát hiện, phân đoạn, phân loại, phát hiện đối tượng định hướng và phát hiện điểm chính. Mỗi tác vụ này có các mục tiêu và trường hợp sử dụng khác nhau. Bằng cách hiểu được sự khác biệt giữa các tác vụ này, bạn có thể chọn tác vụ phù hợp cho ứng dụng thị giác máy tính của mình.

FAQ

Những nhiệm vụ nào có thể Ultralytics YOLO11 biểu diễn?

Ultralytics YOLO11 là một khuôn khổ AI đa năng có khả năng thực hiện nhiều tác vụ thị giác máy tính với độ chính xác và tốc độ cao. Các tác vụ này bao gồm:

  • Phát hiện: Xác định và khoanh vùng các đối tượng trong hình ảnh hoặc khung video bằng cách vẽ các hộp giới hạn xung quanh chúng.
  • Phân khúc: Phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung của chúng, hữu ích cho các ứng dụng như hình ảnh y tế.
  • Phân loại: Phân loại toàn bộ hình ảnh dựa trên nội dung của chúng, tận dụng các biến thể của kiến trúc EfficientNet.
  • Ước tính tư thế: Phát hiện các điểm chính cụ thể trong khung hình ảnh hoặc video để theo dõi chuyển động hoặc tư thế.
  • Phát hiện đối tượng định hướng (OBB): Phát hiện các vật thể xoay với góc định hướng bổ sung để nâng cao độ chính xác.

Tôi sử dụng như thế nào Ultralytics YOLO11 để phát hiện vật thể?

Để sử dụng Ultralytics YOLO11 để phát hiện đối tượng, hãy làm theo các bước sau:

  1. Chuẩn bị tập dữ liệu của bạn ở định dạng thích hợp.
  2. Huấn luyện mô hình YOLO11 bằng cách sử dụng tác vụ phát hiện.
  3. Sử dụng mô hình để đưa ra dự đoán bằng cách cung cấp hình ảnh hoặc khung video mới.

Ví dụ

from ultralytics import YOLO

# Load a pre-trained YOLO model (adjust model type as needed)
model = YOLO("yolo11n.pt")  # n, s, m, l, x versions available

# Perform object detection on an image
results = model.predict(source="image.jpg")  # Can also use video, directory, URL, etc.

# Display the results
results[0].show()  # Show the first image results
# Run YOLO detection from the command line
yolo detect model=yolo11n.pt source="image.jpg"  # Adjust model and source as needed

Để biết hướng dẫn chi tiết hơn, hãy xem các ví dụ phát hiện của chúng tôi.

Lợi ích của việc sử dụng YOLO11 cho tác vụ phân đoạn là gì?

Sử dụng YOLO11 cho các tác vụ phân đoạn mang lại một số lợi thế:

  1. Độ chính xác cao: Nhiệm vụ phân đoạn tận dụng một biến thể của kiến trúc U-Net để đạt được phân đoạn chính xác.
  2. Tốc độ: YOLO11 được tối ưu hóa cho các ứng dụng thời gian thực, mang lại khả năng xử lý nhanh ngay cả đối với hình ảnh có độ phân giải cao.
  3. Nhiều ứng dụng: Đó là lý tưởng cho hình ảnh y tế, lái xe tự động và các ứng dụng khác yêu cầu phân đoạn hình ảnh chi tiết.

Tìm hiểu thêm về lợi ích và trường hợp sử dụng YOLO11 để phân khúc trong phần phân khúc .

Có thể Ultralytics YOLO11 xử lý việc ước lượng tư thế và phát hiện điểm chính?

Đúng, Ultralytics YOLO11 có thể thực hiện ước tính tư thế và phát hiện điểm chính một cách hiệu quả với độ chính xác và tốc độ cao. Tính năng này đặc biệt hữu ích để theo dõi chuyển động trong các ứng dụng phân tích thể thao, chăm sóc sức khỏe và tương tác giữa người và máy tính. YOLO11 phát hiện điểm chính trong khung hình ảnh hoặc video, cho phép ước tính tư thế chính xác.

Để biết thêm chi tiết và mẹo triển khai, hãy truy cập ví dụ ước tính tư thế của chúng tôi.

Tại sao tôi nên chọn Ultralytics YOLO11 để phát hiện vật thể định hướng (OBB)?

Phát hiện đối tượng định hướng (OBB) với YOLO11 cung cấp độ chính xác được cải thiện bằng cách phát hiện các đối tượng có tham số góc bổ sung. Tính năng này có lợi cho các ứng dụng yêu cầu định vị chính xác các đối tượng xoay, chẳng hạn như phân tích hình ảnh trên không và tự động hóa kho hàng.

  • Tăng độ chính xác: Thành phần góc làm giảm dương tính giả cho các đối tượng xoay.
  • Ứng dụng đa năng: Hữu ích cho các nhiệm vụ trong phân tích không gian địa lý, robot, v.v.

Kiểm tra phần Phát hiện đối tượng định hướng để biết thêm chi tiết và ví dụ.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Ý kiến