Chuyển đến nội dung

Cắt Đối Tượng bằng Ultralytics YOLO11

Cắt đối tượng là gì?

Cắt đối tượng bằng Ultralytics YOLO11 bao gồm việc cô lập và trích xuất các đối tượng được phát hiện cụ thể từ hình ảnh hoặc video. Các khả năng của mô hình YOLO11 được sử dụng để xác định và phân định các đối tượng một cách chính xác, cho phép cắt chính xác để phân tích hoặc thao tác thêm.



Xem: Cắt Đối Tượng bằng Ultralytics YOLO

Ưu điểm của việc Cắt Đối tượng

  • Phân tích tập trung: YOLO11 tạo điều kiện thuận lợi cho việc cắt đối tượng có mục tiêu, cho phép kiểm tra hoặc xử lý chuyên sâu các mục riêng lẻ trong một cảnh.
  • Giảm dung lượng dữ liệu: Bằng cách chỉ trích xuất các đối tượng liên quan, việc cắt đối tượng giúp giảm thiểu kích thước dữ liệu, làm cho nó hiệu quả cho việc lưu trữ, truyền tải hoặc các tác vụ tính toán tiếp theo.
  • Độ chính xác được cải thiện : YOLO11 Độ chính xác phát hiện đối tượng đảm bảo rằng các đối tượng được cắt vẫn duy trì mối quan hệ không gian của chúng, bảo toàn tính toàn vẹn của thông tin hình ảnh để phân tích chi tiết.

Hình ảnh trực quan

Hành lý Sân bay
Băng chuyền hành lý tại sân bay được cắt bằng Ultralytics YOLO11
Cắt hành lý tại băng chuyền sân bay bằng Ultralytics YOLO11

Cắt Đối Tượng bằng Ultralytics YOLO

# Crop the objects
yolo solutions crop show=True

# Pass a source video
yolo solutions crop source="path/to/video.mp4"

# Crop specific classes
yolo solutions crop classes="[0, 2]"
import cv2

from ultralytics import solutions

cap = cv2.VideoCapture("path/to/video.mp4")
assert cap.isOpened(), "Error reading video file"

# Initialize object cropper
cropper = solutions.ObjectCropper(
    show=True,  # display the output
    model="yolo11n.pt",  # model for object cropping, e.g., yolo11x.pt.
    classes=[0, 2],  # crop specific classes such as person and car with the COCO pretrained model.
    # conf=0.5,  # adjust confidence threshold for the objects.
    # crop_dir="cropped-detections",  # set the directory name for cropped detections
)

# Process video
while cap.isOpened():
    success, im0 = cap.read()

    if not success:
        print("Video frame is empty or processing is complete.")
        break

    results = cropper(im0)

    # print(results)  # access the output

cap.release()
cv2.destroyAllWindows()  # destroy all opened windows

Khi bạn cung cấp tùy chọn crop_dir Theo lập luận, mọi đối tượng được cắt sẽ được ghi vào thư mục đó với tên tệp bao gồm tên và lớp của ảnh nguồn. Điều này giúp dễ dàng kiểm tra các phát hiện hoặc xây dựng các tập dữ liệu hạ nguồn mà không cần viết thêm mã.

ObjectCropper Các đối số

Đây là bảng với ObjectCropper các đối số:

Đối sốLoạiMặc địnhMô tả
modelstrNoneĐường dẫn đến một Ultralytics YOLO tập tin mô hình.
crop_dirstr'cropped-detections'Tên thư mục để lưu trữ các phát hiện đã cắt.

Hơn nữa, các đối số trực quan hóa sau đây có sẵn để sử dụng:

Đối sốLoạiMặc địnhMô tả
showboolFalseNếu True, hiển thị hình ảnh hoặc video đã chú thích trong một cửa sổ. Hữu ích để có phản hồi trực quan ngay lập tức trong quá trình phát triển hoặc thử nghiệm.
line_widthNone or intNoneChỉ định độ rộng đường của hộp giới hạn. Nếu None, độ rộng đường kẻ được tự động điều chỉnh dựa trên kích thước hình ảnh. Cung cấp tùy chỉnh trực quan để rõ ràng hơn.

Câu hỏi thường gặp

Cắt đối tượng trong Ultralytics YOLO11 là gì và nó hoạt động như thế nào?

Cắt đối tượng bằng Ultralytics YOLO11 bao gồm việc cô lập và trích xuất các đối tượng cụ thể từ hình ảnh hoặc video dựa trên khả năng phát hiện của YOLO11. Quá trình này cho phép phân tích tập trung, giảm khối lượng dữ liệu và tăng cường độ chính xác bằng cách tận dụng YOLO11 để xác định các đối tượng với độ chính xác cao và cắt chúng cho phù hợp. Để có hướng dẫn chuyên sâu, hãy tham khảo ví dụ về cắt đối tượng.

Tại sao tôi nên sử dụng Ultralytics YOLO11 để cắt đối tượng hơn các giải pháp khác?

Ultralytics YOLO11 nổi bật nhờ độ chính xác, tốc độ và dễ sử dụng. Nó cho phép phát hiện và cắt đối tượng chi tiết và chính xác, điều cần thiết cho phân tích tập trung và các ứng dụng cần tính toàn vẹn dữ liệu cao. Hơn nữa, YOLO11 tích hợp liền mạch với các công cụ như OpenVINOTensorRT cho các triển khai yêu cầu khả năng thời gian thực và tối ưu hóa trên các phần cứng khác nhau. Khám phá những lợi ích trong hướng dẫn về xuất mô hình.

Làm thế nào để giảm dung lượng dữ liệu của bộ dữ liệu của tôi bằng cách cắt đối tượng?

Bằng cách sử dụng Ultralytics YOLO11 Bằng cách chỉ cắt các đối tượng có liên quan khỏi hình ảnh hoặc video, bạn có thể giảm đáng kể kích thước dữ liệu, giúp lưu trữ và xử lý dữ liệu hiệu quả hơn. Quá trình này bao gồm việc đào tạo mô hình để detect các đối tượng cụ thể và sau đó sử dụng kết quả để cắt và chỉ lưu các phần này. Để biết thêm thông tin về cách khai thác Ultralytics YOLO11 khả năng của, hãy truy cập hướng dẫn bắt đầu nhanh của chúng tôi.

Tôi có thể sử dụng Ultralytics YOLO11 để phân tích video thời gian thực và cắt đối tượng không?

Đúng, Ultralytics YOLO11 có thể xử lý nguồn cấp dữ liệu video thời gian thực để detect và cắt xén các đối tượng một cách linh hoạt. Khả năng suy luận tốc độ cao của mô hình khiến nó trở nên lý tưởng cho các ứng dụng thời gian thực như giám sát , phân tích thể thao và hệ thống kiểm tra tự động. Hãy xem qua các chế độ theo dõidự đoán để hiểu cách triển khai xử lý thời gian thực.

Các yêu cầu về phần cứng để chạy YOLO11 hiệu quả cho việc cắt đối tượng là gì?

Ultralytics YOLO11 được tối ưu hóa cho cả hai CPU Và GPU môi trường, nhưng để đạt được hiệu suất tối ưu, đặc biệt là đối với suy luận thời gian thực hoặc khối lượng lớn, một chuyên dụng GPU (ví dụ, NVIDIA Tesla, dòng RTX) được khuyến nghị. Để triển khai trên các thiết bị nhẹ, hãy cân nhắc sử dụng CoreML cho iOS hoặc TFLite cho Android . Bạn có thể tìm thấy thêm thông tin chi tiết về các thiết bị và định dạng được hỗ trợ trong tùy chọn triển khai mô hình của chúng tôi.



📅 Được tạo cách đây 1 năm ✏️ Cập nhật cách đây 2 ngày
glenn-jocherRizwanMunawarMatthewNoyceUltralyticsAssistantIvorZhu331AyushExel

Bình luận