Bỏ qua nội dung

Ultralytics YOLO11 Nhiệm vụ

Ultralytics YOLO nhiệm vụ được hỗ trợ

YOLO11 là một khuôn khổ AI hỗ trợ nhiều tác vụ thị giác máy tính . Khuôn khổ này có thể được sử dụng để thực hiện phát hiện , phân đoạn , obb , phân loại và ước tính tư thế . Mỗi tác vụ này có một mục tiêu và trường hợp sử dụng khác nhau.



Đồng hồ: Khám phá Ultralytics YOLO Nhiệm vụ: Phát hiện đối tượng, Phân đoạn, OBB, Theo dõi và Ước tính tư thế.

Phát hiện

Phát hiện là nhiệm vụ chính được hỗ trợ bởi YOLO11 . Nó bao gồm việc phát hiện các đối tượng trong một khung hình ảnh hoặc video và vẽ các hộp giới hạn xung quanh chúng. Các đối tượng được phát hiện được phân loại thành các loại khác nhau dựa trên các đặc điểm của chúng. YOLO11 có thể phát hiện nhiều đối tượng trong một hình ảnh hoặc khung hình video với độ chính xác và tốc độ cao.

Ví dụ phát hiện

Phân đoạn

Phân đoạn là một nhiệm vụ liên quan đến việc phân đoạn một hình ảnh thành các vùng khác nhau dựa trên nội dung của hình ảnh. Mỗi vùng được gán một nhãn dựa trên nội dung của nó. Nhiệm vụ này hữu ích trong các ứng dụng như phân đoạn hình ảnh và hình ảnh y tế. YOLO11 sử dụng một biến thể của kiến trúc U-Net để thực hiện phân đoạn.

Ví dụ về phân đoạn

Phân loại

Phân loại là nhiệm vụ liên quan đến việc phân loại hình ảnh thành các loại khác nhau. YOLO11 có thể được sử dụng để phân loại hình ảnh dựa trên nội dung của chúng. Nó sử dụng một biến thể của kiến trúc EfficientNet để thực hiện phân loại.

Ví dụ phân loại

Tư thế

Phát hiện tư thế/điểm chính là nhiệm vụ liên quan đến việc phát hiện các điểm cụ thể trong khung hình ảnh hoặc video. Các điểm này được gọi là điểm chính và được sử dụng để theo dõi chuyển động hoặc ước tính tư thế. YOLO11 có thể phát hiện các điểm chính trong hình ảnh hoặc khung hình video với độ chính xác và tốc độ cao.

Ví dụ về tư thế

OBB

Phát hiện vật thể định hướng tiến xa hơn so với phát hiện vật thể thông thường khi đưa vào một góc bổ sung để xác định vị trí vật thể chính xác hơn trong hình ảnh. YOLO11 có thể phát hiện các vật thể quay trong khung hình ảnh hoặc video với độ chính xác và tốc độ cao.

Phát hiện định hướng

Phần kết luận

YOLO11 hỗ trợ nhiều tác vụ, bao gồm phát hiện, phân đoạn, phân loại, phát hiện đối tượng định hướng và phát hiện điểm chính. Mỗi tác vụ này có các mục tiêu và trường hợp sử dụng khác nhau. Bằng cách hiểu được sự khác biệt giữa các tác vụ này, bạn có thể chọn tác vụ phù hợp cho ứng dụng thị giác máy tính của mình.

CÂU HỎI THƯỜNG GẶP

Những nhiệm vụ nào có thể Ultralytics YOLO11 trình diễn?

Ultralytics YOLO11 là một khuôn khổ AI đa năng có khả năng thực hiện nhiều tác vụ thị giác máy tính khác nhau với độ chính xác và tốc độ cao. Các tác vụ này bao gồm:

  • Phát hiện : Xác định và định vị các đối tượng trong hình ảnh hoặc khung hình video bằng cách vẽ các hộp giới hạn xung quanh chúng.
  • Phân đoạn : Phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung của chúng, hữu ích cho các ứng dụng như hình ảnh y tế.
  • Phân loại : Phân loại toàn bộ hình ảnh dựa trên nội dung của chúng, tận dụng các biến thể của kiến trúc EfficientNet.
  • Ước tính tư thế : Phát hiện các điểm chính cụ thể trong khung hình ảnh hoặc video để theo dõi chuyển động hoặc tư thế.
  • Phát hiện đối tượng định hướng (OBB) : Phát hiện các đối tượng xoay với góc định hướng bổ sung để tăng độ chính xác.

Tôi sử dụng như thế nào Ultralytics YOLO11 để phát hiện vật thể?

Để sử dụng Ultralytics YOLO11 để phát hiện đối tượng, hãy làm theo các bước sau:

  1. Chuẩn bị tập dữ liệu của bạn theo định dạng phù hợp.
  2. Đào tạo YOLO11 mô hình sử dụng nhiệm vụ phát hiện.
  3. Sử dụng mô hình để đưa ra dự đoán bằng cách đưa vào hình ảnh hoặc khung hình video mới.

Ví dụ

from ultralytics import YOLO

# Load a pre-trained YOLO model (adjust model type as needed)
model = YOLO("yolo11n.pt")  # n, s, m, l, x versions available

# Perform object detection on an image
results = model.predict(source="image.jpg")  # Can also use video, directory, URL, etc.

# Display the results
results[0].show()  # Show the first image results
# Run YOLO detection from the command line
yolo detect model=yolo11n.pt source="image.jpg"  # Adjust model and source as needed

Để biết hướng dẫn chi tiết hơn, hãy xem các ví dụ phát hiện của chúng tôi.

Lợi ích của việc sử dụng là gì? YOLO11 cho nhiệm vụ phân đoạn?

Sử dụng YOLO11 cho các nhiệm vụ phân đoạn cung cấp một số lợi thế:

  1. Độ chính xác cao: Nhiệm vụ phân đoạn tận dụng một biến thể của kiến trúc U-Net để đạt được phân đoạn chính xác.
  2. Tốc độ: YOLO11 được tối ưu hóa cho các ứng dụng thời gian thực, cung cấp khả năng xử lý nhanh ngay cả đối với hình ảnh có độ phân giải cao.
  3. Nhiều ứng dụng: Lý tưởng cho chụp ảnh y tế, lái xe tự động và các ứng dụng khác yêu cầu phân đoạn hình ảnh chi tiết.

Tìm hiểu thêm về lợi ích và trường hợp sử dụng của YOLO11 để phân đoạn trong phần phân đoạn .

Có thể Ultralytics YOLO11 xử lý ước lượng tư thế và phát hiện điểm chính?

Đúng, Ultralytics YOLO11 có thể thực hiện hiệu quả ước tính tư thế và phát hiện điểm chính với độ chính xác và tốc độ cao. Tính năng này đặc biệt hữu ích để theo dõi chuyển động trong phân tích thể thao, chăm sóc sức khỏe và các ứng dụng tương tác giữa người và máy tính. YOLO11 phát hiện các điểm chính trong khung hình ảnh hoặc video, cho phép ước tính tư thế chính xác.

Để biết thêm chi tiết và mẹo triển khai, hãy xem ví dụ ước tính tư thế của chúng tôi.

Tại sao tôi nên chọn Ultralytics YOLO11 để phát hiện vật thể định hướng (OBB)?

Phát hiện đối tượng định hướng (OBB) với YOLO11 cung cấp độ chính xác nâng cao bằng cách phát hiện các đối tượng có tham số góc bổ sung. Tính năng này có lợi cho các ứng dụng yêu cầu định vị chính xác các đối tượng quay, chẳng hạn như phân tích hình ảnh trên không và tự động hóa kho hàng.

  • Tăng độ chính xác: Thành phần góc làm giảm kết quả dương tính giả đối với các vật thể bị xoay.
  • Ứng dụng đa năng: Hữu ích cho các nhiệm vụ phân tích không gian địa lý, robot, v.v.

Hãy xem phần Phát hiện đối tượng định hướng để biết thêm chi tiết và ví dụ.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận