Bỏ để qua phần nội dung

Ultralytics YOLOv8 Nhiệm vụ


Ultralytics YOLO Các tác vụ được hỗ trợ

YOLOv8 là một khung AI hỗ trợ nhiều tác vụ thị giác máy tính. Khung có thể được sử dụng để thực hiện phát hiện, phân đoạn, obb, phân loại và ước tính tư thế . Mỗi nhiệm vụ này có một mục tiêu và trường hợp sử dụng khác nhau.



Xem: Khám phá Ultralytics YOLO Nhiệm vụ: Phát hiện đối tượng, phân đoạn, OBB, theo dõi và ước tính tư thế.

Detection

Phát hiện là nhiệm vụ chính được hỗ trợ bởi YOLOv8. Nó liên quan đến việc phát hiện các đối tượng trong khung hình ảnh hoặc video và vẽ các hộp giới hạn xung quanh chúng. Các đối tượng được phát hiện được phân loại thành các loại khác nhau dựa trên các tính năng của chúng. YOLOv8 Có thể phát hiện nhiều đối tượng trong một hình ảnh hoặc khung hình video với độ chính xác và tốc độ cao.

Ví dụ phát hiện

Phân đoạn

Phân đoạn là một nhiệm vụ liên quan đến việc phân đoạn hình ảnh thành các khu vực khác nhau dựa trên nội dung của hình ảnh. Mỗi khu vực được gán một nhãn dựa trên nội dung của nó. Nhiệm vụ này rất hữu ích trong các ứng dụng như phân đoạn hình ảnh và hình ảnh y tế. YOLOv8 sử dụng một biến thể của kiến trúc U-Net để thực hiện phân đoạn.

Ví dụ về phân đoạn

Phân loại

Phân loại là một nhiệm vụ liên quan đến việc phân loại hình ảnh thành các danh mục khác nhau. YOLOv8 có thể được sử dụng để phân loại hình ảnh dựa trên nội dung của chúng. Nó sử dụng một biến thể của kiến trúc EfficientNet để thực hiện phân loại.

Ví dụ phân loại

Tư thế

Phát hiện tư thế / điểm chính là một nhiệm vụ liên quan đến việc phát hiện các điểm cụ thể trong khung hình ảnh hoặc video. Những điểm này được gọi là điểm chính và được sử dụng để theo dõi chuyển động hoặc ước tính tư thế. YOLOv8 Có thể phát hiện các điểm chính trong khung hình ảnh hoặc video với độ chính xác và tốc độ cao.

Đặt ví dụ

OBB

Phát hiện đối tượng theo định hướng đi một bước xa hơn so với phát hiện đối tượng thông thường với việc giới thiệu một góc bổ sung để xác định vị trí các đối tượng chính xác hơn trong hình ảnh. YOLOv8 Có thể phát hiện các đối tượng xoay trong khung hình ảnh hoặc video với độ chính xác và tốc độ cao.

Phát hiện theo hướng

Kết thúc

YOLOv8 Hỗ trợ nhiều tác vụ, bao gồm phát hiện, phân đoạn, phân loại, phát hiện đối tượng định hướng và phát hiện điểm chính. Mỗi nhiệm vụ này có các mục tiêu và trường hợp sử dụng khác nhau. Bằng cách hiểu sự khác biệt giữa các tác vụ này, bạn có thể chọn tác vụ thích hợp cho ứng dụng thị giác máy tính của mình.

FAQ

Những nhiệm vụ có thể Ultralytics YOLOv8 diễn?

Ultralytics YOLOv8 là một khung AI đa năng có khả năng thực hiện các tác vụ thị giác máy tính khác nhau với độ chính xác và tốc độ cao. Những nhiệm vụ này bao gồm:

  • Phát hiện: Xác định và khoanh vùng các đối tượng trong hình ảnh hoặc khung video bằng cách vẽ các hộp giới hạn xung quanh chúng.
  • Phân khúc: Phân đoạn hình ảnh thành các vùng khác nhau dựa trên nội dung của chúng, hữu ích cho các ứng dụng như hình ảnh y tế.
  • Phân loại: Phân loại toàn bộ hình ảnh dựa trên nội dung của chúng, tận dụng các biến thể của kiến trúc EfficientNet.
  • Ước tính tư thế: Phát hiện các điểm chính cụ thể trong khung hình ảnh hoặc video để theo dõi chuyển động hoặc tư thế.
  • Phát hiện đối tượng định hướng (OBB): Phát hiện các vật thể xoay với góc định hướng bổ sung để nâng cao độ chính xác.

Làm cách nào để sử dụng Ultralytics YOLOv8 để phát hiện đối tượng?

Sử dụng Ultralytics YOLOv8 Để phát hiện đối tượng, hãy làm theo các bước sau:

  1. Chuẩn bị tập dữ liệu của bạn ở định dạng thích hợp.
  2. Đào tạo YOLOv8 mô hình hóa bằng cách sử dụng tác vụ phát hiện.
  3. Sử dụng mô hình để đưa ra dự đoán bằng cách cung cấp hình ảnh hoặc khung video mới.

Ví dụ

from ultralytics import YOLO

model = YOLO("yolov8n.pt")  # Load pre-trained model
results = model.predict(source="image.jpg")  # Perform object detection
results[0].show()
yolo detect model=yolov8n.pt source='image.jpg'

Để biết hướng dẫn chi tiết hơn, hãy xem các ví dụ phát hiện của chúng tôi.

Lợi ích của việc sử dụng là gì YOLOv8 Đối với nhiệm vụ phân khúc?

Sử dụng YOLOv8 Đối với các nhiệm vụ phân đoạn cung cấp một số lợi thế:

  1. Độ chính xác cao: Nhiệm vụ phân đoạn tận dụng một biến thể của kiến trúc U-Net để đạt được phân đoạn chính xác.
  2. Tốc độ: YOLOv8 được tối ưu hóa cho các ứng dụng thời gian thực, cung cấp khả năng xử lý nhanh chóng ngay cả đối với hình ảnh có độ phân giải cao.
  3. Nhiều ứng dụng: Đó là lý tưởng cho hình ảnh y tế, lái xe tự động và các ứng dụng khác yêu cầu phân đoạn hình ảnh chi tiết.

Tìm hiểu thêm về các lợi ích và trường hợp sử dụng của YOLOv8 để phân đoạn trong phần phân đoạn.

Có thể Ultralytics YOLOv8 Xử lý ước tính tư thế và phát hiện điểm mấu chốt?

Có Ultralytics YOLOv8 có thể thực hiện ước tính tư thế và phát hiện điểm chính một cách hiệu quả với độ chính xác và tốc độ cao. Tính năng này đặc biệt hữu ích để theo dõi các chuyển động trong phân tích thể thao, chăm sóc sức khỏe và các ứng dụng tương tác giữa người và máy tính. YOLOv8 Phát hiện các điểm chính trong khung hình ảnh hoặc video, cho phép ước tính tư thế chính xác.

Để biết thêm chi tiết và mẹo triển khai, hãy truy cập ví dụ ước tính tư thế của chúng tôi.

Tại sao tôi nên chọn Ultralytics YOLOv8 để phát hiện đối tượng định hướng (OBB)?

Phát hiện đối tượng định hướng (OBB) với YOLOv8 Cung cấp độ chính xác nâng cao bằng cách phát hiện các đối tượng có tham số góc bổ sung. Tính năng này có lợi cho các ứng dụng yêu cầu bản địa hóa chính xác các đối tượng xoay, chẳng hạn như phân tích hình ảnh trên không và tự động hóa kho.

  • Tăng độ chính xác: Thành phần góc làm giảm dương tính giả cho các đối tượng xoay.
  • Ứng dụng đa năng: Hữu ích cho các nhiệm vụ trong phân tích không gian địa lý, robot, v.v.

Kiểm tra phần Phát hiện đối tượng định hướng để biết thêm chi tiết và ví dụ.



Đã tạo 2023-11-12, Cập nhật 2024-07-04
Tác giả: glenn-jocher (7), RizwanMunawar (1), AyushExel (1)

Ý kiến