Phát hiện đối tượng tương tác: Gradio & Ultralytics YOLO11 🚀
Giới thiệu về Nhận dạng đối tượng tương tác
Giao diện Gradio này cung cấp một cách dễ dàng và tương tác để thực hiện phát hiện đối tượng bằng mô hình Ultralytics YOLO11. Người dùng có thể tải lên hình ảnh và điều chỉnh các tham số như ngưỡng tin cậy và ngưỡng giao nhau trên hợp (IoU) để nhận kết quả phát hiện theo thời gian thực.
Xem: Tích hợp Gradio với Ultralytics YOLO11
Tại sao nên sử dụng Gradio cho Object Detection?
- Giao diện Thân thiện với Người dùng: Gradio cung cấp một nền tảng đơn giản để người dùng tải lên hình ảnh và trực quan hóa kết quả phát hiện mà không cần bất kỳ yêu cầu viết mã nào.
- Điều chỉnh theo thời gian thực: Các tham số như độ tin cậy và ngưỡng IoU có thể được điều chỉnh ngay lập tức, cho phép phản hồi và tối ưu hóa kết quả phát hiện ngay lập tức.
- Khả năng truy cập rộng rãi: Bất kỳ ai cũng có thể truy cập giao diện web Gradio, khiến nó trở thành một công cụ tuyệt vời cho các bản trình diễn, mục đích giáo dục và các thử nghiệm nhanh.
Cách Cài Đặt Gradio
pip install gradio
Cách sử dụng giao diện
- Tải ảnh lên: Nhấp vào 'Tải ảnh lên' để chọn tệp hình ảnh để phát hiện đối tượng.
- Điều chỉnh Tham số:
- Ngưỡng Tin Cậy: Thanh trượt để đặt mức độ tin cậy tối thiểu để phát hiện các đối tượng.
- Ngưỡng IoU: Thanh trượt để đặt ngưỡng IoU để phân biệt các đối tượng khác nhau.
- Xem Kết Quả: Hình ảnh đã xử lý với các đối tượng được phát hiện và nhãn của chúng sẽ được hiển thị.
Các ví dụ về Trường hợp Sử dụng
- Ảnh mẫu 1: Phát hiện xe buýt với ngưỡng mặc định.
- Ảnh mẫu 2: Phát hiện trên ảnh thể thao với ngưỡng mặc định.
Ví dụ Sử dụng
Phần này cung cấp mã Python được sử dụng để tạo giao diện Gradio với mô hình Ultralytics YOLO11. Mã này hỗ trợ các tác vụ phân loại, tác vụ phát hiện, tác vụ phân đoạn và tác vụ điểm chính.
import gradio as gr
import PIL.Image as Image
from ultralytics import ASSETS, YOLO
model = YOLO("yolo11n.pt")
def predict_image(img, conf_threshold, iou_threshold):
"""Predicts objects in an image using a YOLO11 model with adjustable confidence and IOU thresholds."""
results = model.predict(
source=img,
conf=conf_threshold,
iou=iou_threshold,
show_labels=True,
show_conf=True,
imgsz=640,
)
for r in results:
im_array = r.plot()
im = Image.fromarray(im_array[..., ::-1])
return im
iface = gr.Interface(
fn=predict_image,
inputs=[
gr.Image(type="pil", label="Upload Image"),
gr.Slider(minimum=0, maximum=1, value=0.25, label="Confidence threshold"),
gr.Slider(minimum=0, maximum=1, value=0.45, label="IoU threshold"),
],
outputs=gr.Image(type="pil", label="Result"),
title="Ultralytics Gradio",
description="Upload images for inference. The Ultralytics YOLO11n model is used by default.",
examples=[
[ASSETS / "bus.jpg", 0.25, 0.45],
[ASSETS / "zidane.jpg", 0.25, 0.45],
],
)
if __name__ == "__main__":
iface.launch()
Giải thích các tham số
Tên tham số | Loại | Mô tả |
---|---|---|
img |
Image |
Hình ảnh mà trên đó việc phát hiện đối tượng sẽ được thực hiện. |
conf_threshold |
float |
Ngưỡng tin cậy để phát hiện đối tượng. |
iou_threshold |
float |
Ngưỡng Intersection-over-union để phân tách đối tượng. |
Các thành phần giao diện Gradio
Thành phần | Mô tả |
---|---|
Đầu vào hình ảnh | Để tải ảnh lên để phát hiện. |
Thanh trượt | Để điều chỉnh ngưỡng tin cậy và IoU. |
Đầu ra hình ảnh | Để hiển thị kết quả phát hiện. |
Câu hỏi thường gặp
Làm cách nào để sử dụng Gradio với Ultralytics YOLO11 để phát hiện đối tượng?
Để sử dụng Gradio với Ultralytics YOLO11 để phát hiện đối tượng, bạn có thể làm theo các bước sau:
- Cài đặt Gradio: Sử dụng lệnh
pip install gradio
. - Tạo giao diện: Viết một script python để khởi tạo giao diện Gradio. Bạn có thể tham khảo ví dụ mã được cung cấp trong tài liệu để biết chi tiết.
- Tải lên và Điều chỉnh: Tải ảnh của bạn lên và điều chỉnh ngưỡng tin cậy và IoU trên giao diện Gradio để nhận kết quả phát hiện đối tượng theo thời gian thực.
Đây là một đoạn mã tối thiểu để tham khảo:
import gradio as gr
from ultralytics import YOLO
model = YOLO("yolo11n.pt")
def predict_image(img, conf_threshold, iou_threshold):
results = model.predict(
source=img,
conf=conf_threshold,
iou=iou_threshold,
show_labels=True,
show_conf=True,
)
return results[0].plot() if results else None
iface = gr.Interface(
fn=predict_image,
inputs=[
gr.Image(type="pil", label="Upload Image"),
gr.Slider(minimum=0, maximum=1, value=0.25, label="Confidence threshold"),
gr.Slider(minimum=0, maximum=1, value=0.45, label="IoU threshold"),
],
outputs=gr.Image(type="pil", label="Result"),
title="Ultralytics Gradio YOLO11",
description="Upload images for YOLO11 object detection.",
)
iface.launch()
Những lợi ích của việc sử dụng Gradio cho phát hiện đối tượng Ultralytics YOLO11 là gì?
Sử dụng Gradio cho phát hiện đối tượng Ultralytics YOLO11 mang lại một số lợi ích:
- Giao diện Thân thiện với Người dùng: Gradio cung cấp một giao diện trực quan để người dùng tải lên hình ảnh và trực quan hóa kết quả phát hiện mà không cần bất kỳ nỗ lực viết mã nào.
- Điều chỉnh theo thời gian thực: Bạn có thể điều chỉnh linh hoạt các tham số phát hiện như độ tin cậy và ngưỡng IoU và thấy hiệu ứng ngay lập tức.
- Khả năng truy cập: Giao diện web có thể truy cập được đối với bất kỳ ai, làm cho nó hữu ích cho các thử nghiệm nhanh, mục đích giáo dục và trình diễn.
Để biết thêm chi tiết, bạn có thể đọc bài đăng trên blog về AI trong радиология giới thiệu các kỹ thuật trực quan tương tác tương tự.
Tôi có thể sử dụng Gradio và Ultralytics YOLO11 cùng nhau cho mục đích giáo dục không?
Có, Gradio và Ultralytics YOLO11 có thể được sử dụng cùng nhau một cách hiệu quả cho mục đích giáo dục. Giao diện web trực quan của Gradio giúp sinh viên và nhà giáo dục dễ dàng tương tác với các mô hình deep learning hiện đại như Ultralytics YOLO11 mà không cần kỹ năng lập trình nâng cao. Thiết lập này lý tưởng để trình bày các khái niệm chính trong object detection và computer vision, vì Gradio cung cấp phản hồi trực quan ngay lập tức, giúp hiểu tác động của các tham số khác nhau đến hiệu suất detection.
Làm cách nào để điều chỉnh ngưỡng tin cậy và IoU trong giao diện Gradio cho YOLO11?
Trong giao diện Gradio cho YOLO11, bạn có thể điều chỉnh ngưỡng tin cậy và IoU bằng cách sử dụng các thanh trượt được cung cấp. Các ngưỡng này giúp kiểm soát độ chính xác dự đoán và sự phân tách đối tượng:
- Ngưỡng Tin Cậy: Xác định mức độ tin cậy tối thiểu để phát hiện các đối tượng. Trượt để tăng hoặc giảm độ tin cậy cần thiết.
- Ngưỡng IoU: Đặt ngưỡng intersection-over-union để phân biệt giữa các đối tượng chồng chéo. Điều chỉnh giá trị này để tinh chỉnh sự phân tách đối tượng.
Để biết thêm thông tin về các tham số này, hãy truy cập phần giải thích tham số.
Một số ứng dụng thực tế của việc sử dụng Ultralytics YOLO11 với Gradio là gì?
Các ứng dụng thực tế của việc kết hợp Ultralytics YOLO11 với Gradio bao gồm:
- Trình diễn phát hiện đối tượng theo thời gian thực: Lý tưởng để giới thiệu cách phát hiện đối tượng hoạt động trong thời gian thực.
- Công cụ giáo dục: Hữu ích trong môi trường học thuật để giảng dạy các khái niệm về phát hiện đối tượng và thị giác máy tính.
- Phát triển bản mẫu: Hiệu quả để phát triển và thử nghiệm nhanh chóng các ứng dụng phát hiện đối tượng dạng bản mẫu.
- Cộng Đồng và Hợp Tác: Giúp dễ dàng chia sẻ mô hình với cộng đồng để nhận phản hồi và hợp tác.
Để biết các ví dụ về các trường hợp sử dụng tương tự, hãy xem blog của Ultralytics về giám sát hành vi động vật, blog này trình bày cách trực quan hóa tương tác có thể tăng cường nỗ lực bảo tồn động vật hoang dã.