Làm mờ đối tượng bằng cách sử dụng Ultralytics YOLO11 🚀
Object Blurring là gì?
Làm mờ đối tượng bằng Ultralytics YOLO11 liên quan đến việc áp dụng hiệu ứng làm mờ cho các đối tượng cụ thể được phát hiện trong hình ảnh hoặc video. Điều này có thể đạt được bằng cách sử dụng các khả năng của mô hình YOLO11 để xác định và thao tác các đối tượng trong một cảnh nhất định.
Xem: Làm mờ đối tượng bằng cách sử dụng Ultralytics YOLO11
Ưu điểm của Object Blurring?
- Bảo vệ quyền riêng tư: Làm mờ đối tượng là một công cụ hiệu quả để bảo vệ quyền riêng tư bằng cách che giấu thông tin nhạy cảm hoặc nhận dạng cá nhân trong hình ảnh hoặc video.
- Lấy nét có chọn lọc : YOLO11 cho phép làm mờ có chọn lọc, giúp người dùng nhắm mục tiêu vào các đối tượng cụ thể, đảm bảo cân bằng giữa quyền riêng tư và giữ lại thông tin hình ảnh có liên quan.
- Xử lý thời gian thực : Hiệu quả của YOLO11 cho phép làm mờ vật thể theo thời gian thực, phù hợp với các ứng dụng yêu cầu tăng cường quyền riêng tư tức thời trong môi trường năng động.
Làm mờ đối tượng bằng ví dụ YOLO11
import cv2
from ultralytics import YOLO
from ultralytics.utils.plotting import Annotator, colors
model = YOLO("yolo11n.pt")
names = model.names
cap = cv2.VideoCapture("path/to/video/file.mp4")
assert cap.isOpened(), "Error reading video file"
w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))
# Blur ratio
blur_ratio = 50
# Video writer
video_writer = cv2.VideoWriter("object_blurring_output.avi", cv2.VideoWriter_fourcc(*"mp4v"), fps, (w, h))
while cap.isOpened():
success, im0 = cap.read()
if not success:
print("Video frame is empty or video processing has been successfully completed.")
break
results = model.predict(im0, show=False)
boxes = results[0].boxes.xyxy.cpu().tolist()
clss = results[0].boxes.cls.cpu().tolist()
annotator = Annotator(im0, line_width=2, example=names)
if boxes is not None:
for box, cls in zip(boxes, clss):
annotator.box_label(box, color=colors(int(cls), True), label=names[int(cls)])
obj = im0[int(box[1]) : int(box[3]), int(box[0]) : int(box[2])]
blur_obj = cv2.blur(obj, (blur_ratio, blur_ratio))
im0[int(box[1]) : int(box[3]), int(box[0]) : int(box[2])] = blur_obj
cv2.imshow("ultralytics", im0)
video_writer.write(im0)
if cv2.waitKey(1) & 0xFF == ord("q"):
break
cap.release()
video_writer.release()
cv2.destroyAllWindows()
Lập luận model.predict
Lý lẽ | Kiểu | Mặc định | Sự miêu tả |
---|---|---|---|
source | str | 'ultralytics/assets' | Chỉ định nguồn dữ liệu để suy luận. Có thể là đường dẫn hình ảnh, tệp video, thư mục, URL hoặc ID thiết bị cho nguồn cấp dữ liệu trực tiếp. Hỗ trợ nhiều định dạng và nguồn, cho phép ứng dụng linh hoạt trên nhiều loại đầu vào khác nhau . |
conf | float | 0.25 | Đặt ngưỡng tin cậy tối thiểu để phát hiện. Các đối tượng được phát hiện với độ tin cậy dưới ngưỡng này sẽ bị bỏ qua. Điều chỉnh giá trị này có thể giúp giảm dương tính giả. |
iou | float | 0.7 | Ngưỡng Giao điểm qua Liên hợp (IoU) cho Không triệt tiêu tối đa (NMS). Các giá trị thấp hơn dẫn đến ít phát hiện hơn bằng cách loại bỏ các hộp chồng chéo, hữu ích để giảm trùng lặp. |
imgsz | int or tuple | 640 | Xác định kích thước hình ảnh để suy luận. Có thể là một số nguyên duy nhất 640 để thay đổi kích thước hình vuông hoặc một bộ (chiều cao, chiều rộng). Kích thước phù hợp có thể cải thiện khả năng phát hiện sự chính xác và tốc độ xử lý. |
half | bool | False | Cho phép suy luận bán chính xác (FP16), có thể tăng tốc suy luận mô hình trên GPU được hỗ trợ với tác động tối thiểu đến độ chính xác. |
device | str | None | Chỉ định thiết bị để suy luận (ví dụ: cpu , cuda:0 hoặc 0 ). Cho phép người dùng lựa chọn giữa CPU, một cụ thể GPUhoặc các thiết bị điện toán khác để thực thi mô hình. |
max_det | int | 300 | Số lần phát hiện tối đa được phép cho mỗi hình ảnh. Giới hạn tổng số đối tượng mà mô hình có thể phát hiện trong một suy luận duy nhất, ngăn chặn đầu ra quá mức trong các cảnh dày đặc. |
vid_stride | int | 1 | Sải chân khung hình cho đầu vào video. Cho phép bỏ qua các khung hình trong video để tăng tốc độ xử lý với chi phí phân giải tạm thời. Giá trị 1 xử lý mọi khung, giá trị cao hơn bỏ qua khung. |
stream_buffer | bool | False | Xác định xem có nên xếp hàng các khung hình đến cho luồng video hay không. Nếu False , các khung cũ bị loại bỏ để chứa các khung mới (được tối ưu hóa cho các ứng dụng thời gian thực). Nếu `Đúng', xếp hàng các khung mới trong bộ đệm, đảm bảo không có khung nào bị bỏ qua, nhưng sẽ gây ra độ trễ nếu FPS suy luận thấp hơn FPS luồng. |
visualize | bool | False | Kích hoạt trực quan hóa các tính năng của mô hình trong quá trình suy luận, cung cấp thông tin chi tiết về những gì mô hình đang "nhìn thấy". Hữu ích cho việc gỡ lỗi và giải thích mô hình. |
augment | bool | False | Cho phép tăng thời gian kiểm tra (TTA) cho các dự đoán, có khả năng cải thiện độ mạnh phát hiện với chi phí là tốc độ suy luận. |
agnostic_nms | bool | False | Cho phép ngăn chặn không tối đa bất khả tri lớp (NMS), kết hợp các hộp chồng chéo của các lớp khác nhau. Hữu ích trong các tình huống phát hiện nhiều lớp trong đó sự chồng chéo lớp là phổ biến. |
classes | list[int] | None | Lọc các dự đoán cho một tập hợp ID lớp. Chỉ những phát hiện thuộc các lớp được chỉ định mới được trả về. Hữu ích để tập trung vào các đối tượng có liên quan trong các nhiệm vụ phát hiện nhiều lớp. |
retina_masks | bool | False | Trả về mặt nạ phân đoạn có độ phân giải cao. Các mặt nạ trả về (masks.data ) sẽ khớp với kích thước hình ảnh gốc nếu được bật. Nếu bị tắt, chúng sẽ có kích thước hình ảnh được sử dụng trong quá trình suy luận. |
embed | list[int] | None | Chỉ định các lớp để trích xuất các vectơ đặc điểm hoặc nhúng . Hữu ích cho các tác vụ hạ lưu như phân cụm hoặc tìm kiếm sự tương đồng. |
project | str | None | Tên của thư mục dự án nơi đầu ra dự đoán được lưu nếu save được bật. |
name | str | None | Tên của lần chạy dự đoán. Được sử dụng để tạo một thư mục con trong thư mục dự án, nơi lưu trữ các đầu ra dự đoán nếu save được bật. |
FAQ
Làm mờ vật thể là gì? Ultralytics YOLO11 là gì?
Làm mờ đối tượng bằng Ultralytics YOLO11 liên quan đến việc tự động phát hiện và áp dụng hiệu ứng làm mờ cho các đối tượng cụ thể trong hình ảnh hoặc video. Kỹ thuật này tăng cường quyền riêng tư bằng cách che giấu thông tin nhạy cảm trong khi vẫn giữ lại dữ liệu hình ảnh có liên quan. Khả năng xử lý thời gian thực của YOLO11 làm cho nó phù hợp với các ứng dụng yêu cầu bảo vệ quyền riêng tư ngay lập tức và điều chỉnh tiêu điểm chọn lọc.
Làm thế nào tôi có thể triển khai tính năng làm mờ đối tượng theo thời gian thực bằng YOLO11?
Để thực hiện làm mờ đối tượng theo thời gian thực với YOLO11, hãy làm theo hướng dẫn được cung cấp Python Ví dụ. Điều này liên quan đến việc sử dụng YOLO11 để phát hiện đối tượng và OpenCV để áp dụng hiệu ứng làm mờ. Sau đây là phiên bản đơn giản hóa:
import cv2
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
cap = cv2.VideoCapture("path/to/video/file.mp4")
while cap.isOpened():
success, im0 = cap.read()
if not success:
break
results = model.predict(im0, show=False)
for box in results[0].boxes.xyxy.cpu().tolist():
obj = im0[int(box[1]) : int(box[3]), int(box[0]) : int(box[2])]
im0[int(box[1]) : int(box[3]), int(box[0]) : int(box[2])] = cv2.blur(obj, (50, 50))
cv2.imshow("YOLO11 Blurring", im0)
if cv2.waitKey(1) & 0xFF == ord("q"):
break
cap.release()
cv2.destroyAllWindows()
Lợi ích của việc sử dụng là gì? Ultralytics YOLO11 để làm mờ vật thể?
Ultralytics YOLO11 cung cấp một số lợi thế cho việc làm mờ vật thể:
- Bảo vệ quyền riêng tư: Che khuất hiệu quả thông tin nhạy cảm hoặc có thể nhận dạng.
- Tập trung chọn lọc: Nhắm mục tiêu các đối tượng cụ thể để làm mờ, duy trì nội dung hình ảnh thiết yếu.
- Xử lý thời gian thực: Thực hiện làm mờ đối tượng hiệu quả trong môi trường động, phù hợp để cải tiến quyền riêng tư tức thì.
Để biết các ứng dụng chi tiết hơn, hãy kiểm tra các ưu điểm của phần làm mờ đối tượng.
Tôi có thể sử dụng Ultralytics YOLO11 sẽ làm mờ khuôn mặt trong video vì lý do riêng tư?
Đúng, Ultralytics YOLO11 có thể được cấu hình để phát hiện và làm mờ khuôn mặt trong video để bảo vệ quyền riêng tư. Bằng cách đào tạo hoặc sử dụng mô hình được đào tạo trước để nhận dạng khuôn mặt cụ thể, kết quả phát hiện có thể được xử lý bằng OpenCV để áp dụng hiệu ứng làm mờ. Tham khảo hướng dẫn của chúng tôi về phát hiện đối tượng bằng YOLO11 và sửa đổi mã để nhắm mục tiêu phát hiện khuôn mặt.
YOLO11 so sánh như thế nào với các mô hình phát hiện vật thể khác như Faster R-CNN trong việc làm mờ vật thể?
Ultralytics YOLO11 thường vượt trội hơn các mô hình như Faster R-CNN về mặt tốc độ, khiến nó phù hợp hơn với các ứng dụng thời gian thực. Mặc dù cả hai mô hình đều cung cấp khả năng phát hiện chính xác, nhưng kiến trúc của YOLO11 được tối ưu hóa để suy luận nhanh, điều này rất quan trọng đối với các tác vụ như làm mờ đối tượng theo thời gian thực. Tìm hiểu thêm về các khác biệt kỹ thuật và số liệu hiệu suất trong tài liệu YOLO11 của chúng tôi.