Link to this sectionUltralytics YOLO11#
Link to this sectionTổng quan#
YOLO11 được Ultralytics phát hành vào ngày 10 tháng 9 năm 2024, mang đến accuracy, tốc độ và hiệu suất vượt trội. Kế thừa những tiến bộ ấn tượng của các phiên bản YOLO trước đó, YOLO11 giới thiệu những cải tiến đáng kể về kiến trúc và phương pháp huấn luyện, biến nó thành một lựa chọn linh hoạt cho nhiều tác vụ computer vision. Để biết thêm về mô hình Ultralytics mới nhất với khả năng suy luận end-to-end không cần NMS và triển khai edge tối ưu, hãy xem YOLO26.

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM
Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Khám phá và chạy các mô hình YOLO11 trực tiếp trên Ultralytics Platform.
Link to this sectionTính năng chính#
- Trích xuất đặc trưng nâng cao: YOLO11 sử dụng kiến trúc backbone và neck được cải tiến, giúp tăng cường khả năng feature extraction để nhận diện đối tượng chính xác hơn và thực hiện các tác vụ phức tạp tốt hơn.
- Tối ưu hóa cho hiệu suất và tốc độ: YOLO11 giới thiệu các thiết kế kiến trúc tinh chỉnh và các pipeline huấn luyện được tối ưu hóa, mang lại tốc độ xử lý nhanh hơn đồng thời duy trì sự cân bằng tối ưu giữa độ chính xác và hiệu suất.
- Độ chính xác cao hơn với ít tham số hơn: Với những tiến bộ trong thiết kế mô hình, YOLO11m đạt mean Average Precision (mAP) cao hơn trên tập dữ liệu COCO trong khi sử dụng ít tham số hơn 22% so với YOLOv8m, giúp tối ưu hóa khả năng tính toán mà không làm giảm độ chính xác.
- Khả năng thích ứng trên nhiều môi trường: YOLO11 có thể được triển khai liền mạch trên nhiều môi trường khác nhau, bao gồm các thiết bị edge, nền tảng cloud và các hệ thống hỗ trợ NVIDIA GPU, đảm bảo sự linh hoạt tối đa.
- Hỗ trợ đa dạng các tác vụ: Cho dù đó là nhận diện đối tượng, phân đoạn instance, phân loại ảnh, ước tính tư thế (pose estimation), hay nhận diện đối tượng theo hướng (OBB), YOLO11 được thiết kế để đáp ứng các thách thức đa dạng trong computer vision.
Link to this sectionCác tác vụ và chế độ được hỗ trợ#
YOLO11 được xây dựng dựa trên hệ sinh thái mô hình linh hoạt đã được thiết lập bởi các phiên bản Ultralytics YOLO trước đó, cung cấp sự hỗ trợ nâng cao cho nhiều tác vụ computer vision:
| Mô hình | Tên tệp | Tác vụ | Suy luận | Validation | Huấn luyện | Xuất (Export) |
|---|---|---|---|---|---|---|
| YOLO11 | yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.pt | Phát hiện | ✅ | ✅ | ✅ | ✅ |
| YOLO11-seg | yolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.pt | Phân đoạn Instance | ✅ | ✅ | ✅ | ✅ |
| YOLO11-pose | yolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.pt | Tư thế/Điểm khóa | ✅ | ✅ | ✅ | ✅ |
| YOLO11-obb | yolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.pt | Phát hiện theo hướng | ✅ | ✅ | ✅ | ✅ |
| YOLO11-cls | yolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.pt | Phân loại | ✅ | ✅ | ✅ | ✅ |
Bảng này cung cấp tổng quan về các biến thể mô hình YOLO11, giới thiệu khả năng áp dụng của chúng trong các tác vụ cụ thể và tính tương thích với các chế độ vận hành như Inference, Validation, Training và Export. Sự linh hoạt này giúp YOLO11 phù hợp cho nhiều ứng dụng trong computer vision, từ nhận diện thời gian thực đến các tác vụ phân đoạn phức tạp.
Link to this sectionChỉ số hiệu suất#
Xem Tài liệu Phát hiện để biết các ví dụ sử dụng với các mô hình này đã được huấn luyện trên COCO, bao gồm 80 lớp đã được huấn luyện trước.
| Mô hình | kích thước (pixel) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 ± 0.8 | 1.5 ± 0.0 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 ± 1.2 | 2.5 ± 0.0 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 ± 2.0 | 4.7 ± 0.1 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 ± 1.4 | 6.2 ± 0.1 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 ± 6.7 | 11.3 ± 0.2 | 56.9 | 194.9 |
Link to this sectionVí dụ Sử dụng#
Phần này cung cấp các ví dụ đơn giản về huấn luyện và dự đoán với YOLO11. Để biết tài liệu đầy đủ về các chế độ này và các chế độ khác, hãy xem các trang tài liệu về Predict, Train, Val và Export.
Lưu ý rằng ví dụ dưới đây dành cho các mô hình YOLO11 Detect cho nhận diện đối tượng. Đối với các tác vụ được hỗ trợ bổ sung, hãy xem tài liệu về Segment, Classify, OBB và Pose.
Các mô hình PyTorch đã được huấn luyện trước với định dạng *.pt cũng như các tệp cấu hình *.yaml có thể được truyền vào lớp YOLO() để tạo một thực thể mô hình trong Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")Link to this sectionTrích dẫn và Ghi nhận#
Ultralytics chưa xuất bản bài báo nghiên cứu chính thức cho YOLO11 do bản chất phát triển nhanh chóng của các mô hình này. Chúng tôi tập trung vào việc thúc đẩy công nghệ và làm cho nó dễ sử dụng hơn thay vì tạo ra tài liệu tĩnh. Để biết thông tin cập nhật nhất về kiến trúc, tính năng và cách sử dụng YOLO, vui lòng tham khảo kho lưu trữ GitHub và tài liệu của chúng tôi.
Nếu bạn sử dụng YOLO11 hoặc bất kỳ phần mềm nào khác từ kho lưu trữ này trong công việc của mình, vui lòng trích dẫn nó theo định dạng sau:
@software{yolo11_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO11},
version = {11.0.0},
year = {2024},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}Vui lòng lưu ý rằng DOI đang chờ xử lý và sẽ được thêm vào phần trích dẫn ngay khi có. Các mô hình YOLO11 được cung cấp theo giấy phép AGPL-3.0 và Enterprise.
Link to this sectionCâu hỏi thường gặp#
Link to this sectionNhững cải tiến chính trong Ultralytics YOLO11 so với YOLOv8 là gì?#
Ultralytics YOLO11 giới thiệu một số tiến bộ đáng kể so với YOLOv8. Những cải tiến chính bao gồm:
- Trích xuất đặc trưng nâng cao: YOLO11 sử dụng kiến trúc backbone và neck cải tiến, nâng cao khả năng trích xuất đặc trưng để nhận diện đối tượng chính xác hơn.
- Tối ưu hóa hiệu suất và tốc độ: Các thiết kế kiến trúc tinh chỉnh và quy trình huấn luyện được tối ưu hóa mang lại tốc độ xử lý nhanh hơn trong khi vẫn duy trì sự cân bằng giữa độ chính xác và hiệu suất.
- Độ chính xác cao hơn với ít tham số hơn: YOLO11m đạt được mAP (mean Average Precision) cao hơn trên tập dữ liệu COCO với ít hơn 22% tham số so với YOLOv8m, giúp nó hiệu quả về mặt tính toán mà không làm giảm độ chính xác.
- Khả năng thích ứng với nhiều môi trường: YOLO11 có thể được triển khai trên nhiều môi trường khác nhau, bao gồm các thiết bị biên (edge devices), nền tảng đám mây và các hệ thống hỗ trợ GPU NVIDIA.
- Hỗ trợ đa dạng các tác vụ: YOLO11 hỗ trợ nhiều tác vụ thị giác máy tính như nhận diện đối tượng, phân đoạn đối tượng, phân loại hình ảnh, ước tính tư thế và nhận diện đối tượng có hướng (OBB).
Link to this sectionLàm thế nào để huấn luyện mô hình YOLO11 cho tác vụ nhận diện đối tượng?#
Việc huấn luyện mô hình YOLO11 để nhận diện đối tượng có thể được thực hiện bằng Python hoặc các lệnh CLI. Dưới đây là các ví dụ cho cả hai phương pháp:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)Để biết thêm hướng dẫn chi tiết, hãy tham khảo tài liệu Train.
Link to this sectionCác mô hình YOLO11 có thể thực hiện những tác vụ nào?#
Các mô hình YOLO11 rất linh hoạt và hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm:
- Nhận diện đối tượng (Object Detection): Xác định và định vị đối tượng trong một hình ảnh.
- Phân đoạn đối tượng (Instance Segmentation): Phát hiện đối tượng và phân định ranh giới của chúng.
- Phân loại hình ảnh: Phân loại hình ảnh vào các lớp đã xác định trước.
- Ước tính tư thế (Pose Estimation): Phát hiện và theo dõi các điểm chính trên cơ thể người.
- Nhận diện đối tượng có hướng (OBB): Phát hiện đối tượng có xoay để đạt độ chính xác cao hơn.
Để biết thêm thông tin về từng tác vụ, hãy xem tài liệu về Detection, Instance Segmentation, Classification, Pose Estimation và Oriented Detection.
Link to this sectionLàm thế nào YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn?#
YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn thông qua các tiến bộ trong thiết kế mô hình và kỹ thuật tối ưu hóa. Kiến trúc cải tiến cho phép trích xuất và xử lý đặc trưng hiệu quả, dẫn đến chỉ số mAP cao hơn trên các tập dữ liệu như COCO trong khi sử dụng ít hơn 22% tham số so với YOLOv8m. Điều này làm cho YOLO11 hiệu quả về mặt tính toán mà không ảnh hưởng đến độ chính xác, giúp nó phù hợp để triển khai trên các thiết bị hạn chế về tài nguyên.
Link to this sectionYOLO11 có thể được triển khai trên các thiết bị biên không?#
Có, YOLO11 được thiết kế để có khả năng thích ứng với nhiều môi trường khác nhau, bao gồm cả các thiết bị biên. Kiến trúc được tối ưu hóa và khả năng xử lý hiệu quả của nó giúp nó phù hợp để triển khai trên các thiết bị biên, nền tảng đám mây và các hệ thống hỗ trợ GPU NVIDIA. Sự linh hoạt này đảm bảo YOLO11 có thể được sử dụng trong nhiều ứng dụng đa dạng, từ nhận diện thời gian thực trên thiết bị di động đến các tác vụ phân đoạn phức tạp trong môi trường đám mây. Để biết thêm chi tiết về các tùy chọn triển khai, hãy tham khảo tài liệu Export.