Ultralytics YOLO11
Tổng quan
YOLO11 được Ultralytics phát hành vào ngày 10 tháng 9 năm 2024, mang lại độ chính xác, tốc độ và hiệu suất vượt trội. Dựa trên những tiến bộ ấn tượng của các phiên bản YOLO trước đó, YOLO11 giới thiệu những cải tiến đáng kể về kiến trúc và phương pháp đào tạo, trở thành lựa chọn linh hoạt cho nhiều tác vụ thị giác máy tính khác nhau. Để biết thông tin về mẫu model mới nhất của Ultralytics với khả năng suy luận không cần NMS đầu-cuối và triển khai tối ưu trên thiết bị cạnh, xem YOLO26.

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM
Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Khám phá và chạy các model YOLO11 trực tiếp trên Ultralytics Platform.
Các tính năng chính
- Trích xuất đặc trưng nâng cao: YOLO11 sử dụng kiến trúc backbone và neck cải tiến, giúp tăng cường khả năng trích xuất đặc trưng để phát hiện đối tượng chính xác hơn và đạt hiệu suất cao trong các tác vụ phức tạp.
- Tối ưu hóa cho hiệu suất và tốc độ: YOLO11 giới thiệu các thiết kế kiến trúc tinh chỉnh và quy trình đào tạo được tối ưu hóa, mang lại tốc độ xử lý nhanh hơn đồng thời duy trì sự cân bằng tối ưu giữa độ chính xác và hiệu suất.
- Độ chính xác cao hơn với ít tham số hơn: Với những tiến bộ trong thiết kế model, YOLO11m đạt mean Average Precision (mAP) cao hơn trên tập dữ liệu COCO trong khi sử dụng ít hơn 22% tham số so với YOLOv8m, giúp nó đạt hiệu quả tính toán mà không ảnh hưởng đến độ chính xác.
- Khả năng thích ứng trên nhiều môi trường: YOLO11 có thể được triển khai mượt mà trên nhiều môi trường khác nhau, bao gồm thiết bị cạnh (edge devices), nền tảng đám mây và các hệ thống hỗ trợ NVIDIA GPU, đảm bảo tính linh hoạt tối đa.
- Hỗ trợ nhiều loại tác vụ: Cho dù đó là phát hiện đối tượng, phân đoạn thực thể, phân loại hình ảnh, ước tính tư thế hay phát hiện đối tượng theo hướng (OBB), YOLO11 được thiết kế để phục vụ đa dạng các thách thức trong thị giác máy tính.
Các tác vụ và chế độ được hỗ trợ
YOLO11 phát triển dựa trên phạm vi model linh hoạt được thiết lập bởi các phiên bản Ultralytics YOLO trước đây, cung cấp khả năng hỗ trợ nâng cao cho nhiều tác vụ thị giác máy tính:
| Model | Tên tệp | Tác vụ | Inference | Validation | Training | Export |
|---|---|---|---|---|---|---|
| YOLO11 | yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt | Detection | ✅ | ✅ | ✅ | ✅ |
| YOLO11-seg | yolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.pt | Instance Segmentation | ✅ | ✅ | ✅ | ✅ |
| YOLO11-pose | yolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.pt | Pose/Keypoints | ✅ | ✅ | ✅ | ✅ |
| YOLO11-obb | yolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt | Oriented Detection | ✅ | ✅ | ✅ | ✅ |
| YOLO11-cls | yolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.pt | Classification | ✅ | ✅ | ✅ | ✅ |
Bảng này cung cấp cái nhìn tổng quan về các biến thể model YOLO11, thể hiện khả năng ứng dụng của chúng trong các tác vụ cụ thể và khả năng tương thích với các chế độ vận hành như Suy luận (Inference), Xác thực (Validation), Đào tạo (Training) và Xuất (Export). Sự linh hoạt này giúp YOLO11 phù hợp cho nhiều ứng dụng thị giác máy tính, từ phát hiện thời gian thực đến các tác vụ phân đoạn phức tạp.
Các chỉ số hiệu suất
Xem Tài liệu Detection để biết các ví dụ sử dụng với các model này đã được đào tạo trên COCO, bao gồm 80 lớp được đào tạo trước.
| Model | kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 ± 0.8 | 1.5 ± 0.0 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 ± 1.2 | 2.5 ± 0.0 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 ± 2.0 | 4.7 ± 0.1 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 ± 1.4 | 6.2 ± 0.1 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 ± 6.7 | 11.3 ± 0.2 | 56.9 | 194.9 |
Ví dụ sử dụng
Phần này cung cấp các ví dụ đơn giản về huấn luyện và suy luận với YOLO11. Để xem tài liệu đầy đủ về các chế độ này và các chế độ khác, hãy xem các trang tài liệu về Predict, Train, Val và Export.
Lưu ý rằng ví dụ dưới đây dành cho các model YOLO11 Detect cho tác vụ object detection. Đối với các tác vụ được hỗ trợ khác, hãy xem tài liệu về Segment, Classify, OBB và Pose.
PyTorch pretrained *.pt models as well as configuration *.yaml files can be passed to the YOLO() class to create a model instance in Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")Trích dẫn và Ghi nhận
Ultralytics chưa xuất bản bài báo nghiên cứu chính thức cho YOLO11 do tính chất phát triển nhanh chóng của các model này. Chúng tôi tập trung vào việc thúc đẩy công nghệ và giúp cho việc sử dụng trở nên dễ dàng hơn thay vì tạo ra tài liệu tĩnh. Để có thông tin cập nhật nhất về kiến trúc, tính năng và cách sử dụng YOLO, vui lòng tham khảo kho lưu trữ GitHub và tài liệu của chúng tôi.
Nếu bạn sử dụng YOLO11 hoặc bất kỳ phần mềm nào khác từ kho lưu trữ này trong công việc của mình, vui lòng trích dẫn theo định dạng sau:
@software{yolo11_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO11},
version = {11.0.0},
year = {2024},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}Xin lưu ý rằng DOI đang chờ xử lý và sẽ được thêm vào phần trích dẫn ngay khi có. Các model YOLO11 được cung cấp theo giấy phép AGPL-3.0 và Enterprise.
Câu hỏi thường gặp (FAQ)
Những cải tiến chính trong Ultralytics YOLO11 so với YOLOv8 là gì?
Ultralytics YOLO11 giới thiệu một số tiến bộ đáng kể so với YOLOv8. Những cải tiến chính bao gồm:
- Trích xuất đặc trưng nâng cao: YOLO11 sử dụng kiến trúc backbone và neck được cải tiến, tăng cường khả năng feature extraction để phát hiện đối tượng chính xác hơn.
- Tối ưu hóa hiệu suất và tốc độ: Các thiết kế kiến trúc được tinh chỉnh và pipeline huấn luyện được tối ưu hóa mang lại tốc độ xử lý nhanh hơn trong khi vẫn duy trì sự cân bằng giữa độ chính xác và hiệu suất.
- Độ chính xác cao hơn với ít tham số hơn: YOLO11m đạt được chỉ số mean Average Precision (mAP) cao hơn trên tập dữ liệu COCO với số lượng tham số ít hơn 22% so với YOLOv8m, giúp tối ưu hóa hiệu quả tính toán mà không làm giảm độ chính xác.
- Khả năng thích ứng trên nhiều môi trường: YOLO11 có thể được triển khai trên nhiều môi trường khác nhau, bao gồm thiết bị biên (edge devices), nền tảng đám mây và các hệ thống hỗ trợ GPU NVIDIA.
- Hỗ trợ đa dạng các tác vụ: YOLO11 hỗ trợ nhiều tác vụ thị giác máy tính như phát hiện đối tượng, instance segmentation, phân loại hình ảnh, ước tính tư thế (pose estimation) và phát hiện đối tượng theo hướng (OBB).
Làm thế nào để huấn luyện một model YOLO11 cho tác vụ phát hiện đối tượng?
Việc huấn luyện model YOLO11 cho tác vụ phát hiện đối tượng có thể được thực hiện bằng Python hoặc các lệnh CLI. Dưới đây là các ví dụ cho cả hai phương pháp:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)Để biết hướng dẫn chi tiết hơn, hãy tham khảo tài liệu Train.
Các model YOLO11 có thể thực hiện những tác vụ nào?
Các model YOLO11 rất linh hoạt và hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm:
- Object Detection: Xác định và định vị các đối tượng trong hình ảnh.
- Instance Segmentation: Phát hiện đối tượng và phân định ranh giới của chúng.
- Image Classification: Phân loại hình ảnh vào các nhóm định sẵn.
- Pose Estimation: Phát hiện và theo dõi các điểm khóa trên cơ thể người.
- Oriented Object Detection (OBB): Phát hiện đối tượng có xoay để đạt độ chính xác cao hơn.
Để biết thêm thông tin về từng tác vụ, hãy xem tài liệu về Detection, Instance Segmentation, Classification, Pose Estimation và Oriented Detection.
Làm thế nào YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn?
YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn nhờ những tiến bộ trong kỹ thuật thiết kế và tối ưu hóa model. Kiến trúc được cải tiến cho phép trích xuất và xử lý đặc trưng hiệu quả, dẫn đến chỉ số mean Average Precision (mAP) cao hơn trên các tập dữ liệu như COCO trong khi sử dụng ít hơn 22% tham số so với YOLOv8m. Điều này giúp YOLO11 đạt hiệu quả tính toán cao mà không làm giảm độ chính xác, phù hợp để triển khai trên các thiết bị có tài nguyên hạn chế.
YOLO11 có thể được triển khai trên thiết bị biên (edge devices) không?
Có, YOLO11 được thiết kế để có thể thích ứng trên nhiều môi trường khác nhau, bao gồm cả thiết bị biên. Kiến trúc tối ưu và khả năng xử lý hiệu quả giúp model này phù hợp để triển khai trên thiết bị biên, nền tảng đám mây và các hệ thống hỗ trợ GPU NVIDIA. Sự linh hoạt này đảm bảo YOLO11 có thể được sử dụng trong nhiều ứng dụng đa dạng, từ phát hiện thời gian thực trên thiết bị di động đến các tác vụ phân đoạn phức tạp trong môi trường đám mây. Để biết thêm chi tiết về các tùy chọn triển khai, hãy tham khảo tài liệu Export.