Ultralytics YOLO11

Q: How do I train a YOLO11 model for object detection?

Việc huấn luyện mô hình YOLO11 để phát hiện đối tượng có thể được thực hiện bằng các lệnh Python hoặc CLI. Dưới đây là các ví dụ cho cả hai phương pháp: Để biết hướng dẫn chi tiết hơn, hãy tham khảo tài liệu Huấn luyện.

Q: Can YOLO11 be deployed on edge devices?

Có, YOLO11 được thiết kế để có khả năng thích ứng trên nhiều môi trường khác nhau, bao gồm cả các thiết bị biên. Kiến trúc được tối ưu hóa và khả năng xử lý hiệu quả giúp nó phù hợp để triển khai trên các thiết bị biên, nền tảng đám mây và hệ thống hỗ trợ NVIDIA GPU. Tính linh hoạt này đảm bảo rằng YOLO11 có thể được sử dụng trong nhiều ứng dụng khác nhau, từ phát hiện theo thời gian thực trên thiết bị di động đến các tác vụ phân đoạn phức tạp trong môi trường đám mây. Để biết thêm chi tiết về các tùy chọn triển khai, hãy tham khảo tài liệu Xuất.

Tổng quan

YOLO11 được Ultralytics phát hành vào ngày 10 tháng 9 năm 2024, mang lại độ chính xác, tốc độ và hiệu quả vượt trội. Dựa trên những tiến bộ ấn tượng của các phiên bản YOLO trước đó, YOLO11 giới thiệu những cải tiến đáng kể về kiến trúc và phương pháp huấn luyện, khiến nó trở thành lựa chọn linh hoạt cho nhiều tác vụ thị giác máy tính. Để biết mô hình Ultralytics mới nhất với suy luận NMS-free end-to-end và triển khai biên tối ưu, hãy xem YOLO26.

Biểu đồ so sánh Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast được tạo bởi NotebookLM

Xem: Cách Sử Dụng Ultralytics YOLO11 để Phát Hiện và Theo Dõi Đối Tượng | Cách Đánh Giá Hiệu Năng | YOLO11 ĐÃ RA MẮT🚀

Thử mặc Ultralytics Nền tảng

Khám phá và chạy YOLO11 các mô hình trực tiếp trên Nền tảng Ultralytics .

Các tính năng chính

Cải thiện trích xuất đặc trưng: YOLO11 sử dụng backbone và kiến trúc neck được cải tiến, giúp tăng cường khả năng trích xuất đặc trưng để phát hiện đối tượng chính xác hơn và thực hiện các tác vụ phức tạp.
Tối Ưu Hóa cho Hiệu Quả và Tốc Độ: YOLO11 giới thiệu các thiết kế kiến trúc tinh tế và quy trình huấn luyện được tối ưu hóa, mang lại tốc độ xử lý nhanh hơn và duy trì sự cân bằng tối ưu giữa độ chính xác và hiệu suất.
Độ chính xác cao hơn với ít tham số hơn: Với những tiến bộ trong thiết kế mô hình, YOLO11m đạt được mean Average Precision (mAP) cao hơn trên tập dữ liệu COCO, đồng thời sử dụng ít hơn 22% tham số so với YOLOv8m, giúp nó hiệu quả về mặt tính toán mà không ảnh hưởng đến độ chính xác.
Khả Năng Thích Ứng Cao Trong Mọi Môi Trường: YOLO11 có thể được triển khai liền mạch trên nhiều môi trường khác nhau, bao gồm các thiết bị biên, nền tảng đám mây và các hệ thống hỗ trợ NVIDIA GPU, đảm bảo tính linh hoạt tối đa.
Hỗ Trợ Nhiều Tác Vụ Đa Dạng: Cho dù đó là phát hiện đối tượng, phân vùng thể hiện, phân loại hình ảnh, ước tính tư thế hoặc phát hiện đối tượng theo hướng (OBB), YOLO11 được thiết kế để đáp ứng một loạt các thách thức về thị giác máy tính.

Các Tác vụ và Chế độ được Hỗ trợ

YOLO11 được xây dựng dựa trên dải mô hình đa năng đã được thiết lập bởi các bản phát hành Ultralytics YOLO trước đó, mang lại sự hỗ trợ nâng cao trên nhiều tác vụ thị giác máy tính khác nhau:

Mô hình	Tên tập tin	Tác vụ	Suy luận	Xác thực	Huấn luyện	Xuất
YOLO11	`yolo11n.pt` `yolo11s.pt` `yolo11m.pt` `yolo11l.pt` `yolo11x.pt`	Phát hiện vật thể	✅	✅	✅	✅
YOLO11-seg	`yolo11n-seg.pt` `yolo11s-seg.pt` `yolo11m-seg.pt` `yolo11l-seg.pt` `yolo11x-seg.pt`	Phân đoạn thực thể	✅	✅	✅	✅
YOLO11-pose	`yolo11n-pose.pt` `yolo11s-pose.pt` `yolo11m-pose.pt` `yolo11l-pose.pt` `yolo11x-pose.pt`	Tư thế/Điểm chính	✅	✅	✅	✅
YOLO11-obb	`yolo11n-obb.pt` `yolo11s-obb.pt` `yolo11m-obb.pt` `yolo11l-obb.pt` `yolo11x-obb.pt`	Phát hiện theo hướng (Oriented Detection)	✅	✅	✅	✅
YOLO11-cls	`yolo11n-cls.pt` `yolo11s-cls.pt` `yolo11m-cls.pt` `yolo11l-cls.pt` `yolo11x-cls.pt`	Phân loại (Classification)	✅	✅	✅	✅

Bảng này cung cấp tổng quan về các biến thể mô hình YOLO11, thể hiện khả năng ứng dụng của chúng trong các tác vụ cụ thể và khả năng tương thích với các chế độ hoạt động như Suy luận, Xác thực, Huấn luyện và Xuất. Sự linh hoạt này làm cho YOLO11 phù hợp với nhiều ứng dụng trong thị giác máy tính, từ phát hiện theo thời gian thực đến các tác vụ phân vùng phức tạp.

Các chỉ số hiệu suất

Hiệu suất

Phát hiện (COCO)Phân đoạn (COCO)Phân loại (ImageNet)Ước tính tư thế (COCO)OBB (DOTAv1)

Xem Tài liệu Detection để biết các ví dụ sử dụng với các mô hình này được huấn luyện trên COCO, bao gồm 80 lớp được huấn luyện trước.

Mô hình	Kích thước ^(pixels)	mAP^val 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1 ± 0.8	1.5 ± 0.0	2.6	6.5
YOLO11s	640	47.0	90.0 ± 1.2	2.5 ± 0.0	9.4	21.5
YOLO11m	640	51.5	183.2 ± 2.0	4.7 ± 0.1	20.1	68.0
YOLO11l	640	53.4	238.6 ± 1.4	6.2 ± 0.1	25.3	86.9
YOLO11x	640	54.7	462.8 ± 6.7	11.3 ± 0.2	56.9	194.9

Xem Tài liệu Segmentation để biết ví dụ sử dụng với các mô hình này được huấn luyện trên COCO, bao gồm 80 lớp đã được huấn luyện trước.

Mô hình	Kích thước ^(pixels)	mAP^box 50-95	mAP^mask 50-95	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n-seg	640	38.9	32.0	65.9 ± 1.1	1.8 ± 0.0	2.9	9.7
YOLO11s-seg	640	46.6	37.8	117.6 ± 4.9	2.9 ± 0.0	10.1	33.0
YOLO11m-seg	640	51.5	41.5	281.6 ± 1.2	6.3 ± 0.1	22.4	113.2
YOLO11l-seg	640	53.4	42.9	344.2 ± 3.2	7.8 ± 0.2	27.6	132.2
YOLO11x-seg	640	54.7	43.8	664.5 ± 3.2	15.8 ± 0.7	62.1	296.4

Xem Tài liệu Classification để biết ví dụ sử dụng với các mô hình này được huấn luyện trên ImageNet, bao gồm 1000 lớp đã được huấn luyện trước.

Mô hình	Kích thước ^(pixels)	acc ^top1	acc ^top5	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^{(B) ở 224}
YOLO11n-cls	224	70.0	89.4	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO11s-cls	224	75.4	92.7	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO11m-cls	224	77.3	93.9	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO11l-cls	224	78.3	94.3	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO11x-cls	224	79.5	94.9	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Xem Tài liệu Ước tính Tư thế để biết các ví dụ sử dụng với các mô hình này được huấn luyện trên COCO, bao gồm 1 lớp được huấn luyện trước là 'person'.

Mô hình	Kích thước ^(pixels)	mAP^pose 50-95	mAP^pose 50	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n-pose	640	50.0	81.0	52.4 ± 0.5	1.7 ± 0.0	2.9	7.4
YOLO11s-pose	640	58.9	86.3	90.5 ± 0.6	2.6 ± 0.0	9.9	23.1
YOLO11m-pose	640	64.9	89.4	187.3 ± 0.8	4.9 ± 0.1	20.9	71.4
YOLO11l-pose	640	66.1	89.9	247.7 ± 1.1	6.4 ± 0.1	26.1	90.3
YOLO11x-pose	640	69.5	91.1	488.0 ± 13.9	12.1 ± 0.2	58.8	202.8

Xem Tài liệu Oriented Detection để biết ví dụ sử dụng với các mô hình này được huấn luyện trên DOTAv1, bao gồm 15 lớp đã được huấn luyện trước.

Mô hình	Kích thước ^(pixels)	mAP^test 50	Tốc độ ^{CPU ONNX (ms)}	Tốc độ ^{T4 TensorRT10 (ms)}	Tham số ^(M)	FLOPs ^(B)
YOLO11n-obb	1024	78.4	117.6 ± 0.8	4.4 ± 0.0	2.7	16.8
YOLO11s-obb	1024	79.5	219.4 ± 4.0	5.1 ± 0.0	9.7	57.1
YOLO11m-obb	1024	80.9	562.8 ± 2.9	10.1 ± 0.4	20.9	182.8
YOLO11l-obb	1024	81.0	712.5 ± 5.0	13.5 ± 0.6	26.1	231.2
YOLO11x-obb	1024	81.3	1408.6 ± 7.7	28.6 ± 1.0	58.8	519.1

Ví dụ sử dụng

Phần này cung cấp các ví dụ đơn giản về huấn luyện và suy luận YOLO11. Để xem toàn bộ tài liệu về các chế độ này và các chế độ khác, hãy tham khảo các trang tài liệu Dự đoán, Huấn luyện, Đánh giá và Xuất.

Lưu ý rằng ví dụ dưới đây dành cho các mô hình Phát hiện YOLO11 để phát hiện đối tượng. Để biết thêm các tác vụ được hỗ trợ, hãy xem các tài liệu Phân đoạn, Phân loại, OBB và Tạo dáng.

Ví dụ

PythonCLI

PyTorch đã được huấn luyện trước *.pt các mô hình cũng như cấu hình *.yaml các tệp có thể được chuyển đến YOLO() class để tạo một thể hiện mô hình trong Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Các lệnh CLI có sẵn để chạy trực tiếp các mô hình:

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO11n model and run inference on the 'bus.jpg' image
yolo predict model=yolo11n.pt source=path/to/bus.jpg

Trích dẫn và Lời cảm ơn

Ấn phẩm Ultralytics YOLO11

Ultralytics chưa công bố bài báo nghiên cứu chính thức nào cho YOLO11 do tính chất phát triển nhanh chóng của các mô hình. Chúng tôi tập trung vào việc nâng cao công nghệ và giúp công nghệ này dễ sử dụng hơn, thay vì tạo ra tài liệu tĩnh. Để biết thông tin cập nhật nhất về kiến trúc, tính năng và cách sử dụng YOLO, vui lòng tham khảo kho lưu trữ GitHub và tài liệu của chúng tôi.

Nếu bạn sử dụng YOLO11 hoặc bất kỳ phần mềm nào khác từ kho lưu trữ này trong công việc của mình, vui lòng trích dẫn nó theo định dạng sau:

BibTeX

@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Xin lưu ý rằng DOI đang chờ xử lý và sẽ được thêm vào trích dẫn sau khi có. Các mô hình YOLO11 được cung cấp theo giấy phép AGPL-3.0 và Doanh nghiệp.

Câu hỏi thường gặp

Những cải tiến chính trong Ultralytics YOLO11 so với YOLOv8 là gì?

Ultralytics YOLO11 giới thiệu một số tiến bộ đáng kể so với YOLOv8. Các cải tiến chính bao gồm:

Trích xuất Đặc trưng Nâng cao: YOLO11 sử dụng kiến trúc backbone và neck được cải tiến, tăng cường khả năng trích xuất đặc trưng để phát hiện đối tượng chính xác hơn.
Tối ưu hóa Hiệu quả và Tốc độ: Thiết kế kiến trúc được tinh chỉnh và quy trình huấn luyện được tối ưu hóa mang lại tốc độ xử lý nhanh hơn đồng thời duy trì sự cân bằng giữa độ chính xác và hiệu suất.
Độ chính xác cao hơn với ít tham số hơn: YOLO11m đạt được mean Average Precision (mAP) cao hơn trên tập dữ liệu COCO với ít hơn 22% tham số so với YOLOv8m, giúp nó hiệu quả về mặt tính toán mà không ảnh hưởng đến độ chính xác.
Khả năng Thích ứng trên Nhiều Môi trường: YOLO11 có thể được triển khai trên nhiều môi trường khác nhau, bao gồm các thiết bị biên, nền tảng đám mây và các hệ thống hỗ trợ NVIDIA GPU.
Phạm vi Rộng các Tác vụ Được Hỗ trợ: YOLO11 hỗ trợ nhiều tác vụ thị giác máy tính khác nhau như phát hiện đối tượng, phân đoạn thể hiện, phân loại hình ảnh, ước tính tư thế và phát hiện đối tượng theo hướng (OBB).

Làm cách nào để huấn luyện mô hình YOLO11 để phát hiện đối tượng?

Huấn luyện mô hình YOLO11 để phát hiện đối tượng có thể được thực hiện bằng các lệnh Python hoặc CLI. Dưới đây là các ví dụ cho cả hai phương pháp:

Ví dụ

PythonCLI

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

Để biết hướng dẫn chi tiết hơn, hãy tham khảo tài liệu Huấn luyện.

Các mô hình YOLO11 có thể thực hiện những tác vụ nào?

Các mô hình YOLO11 rất linh hoạt và hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm:

Phát hiện đối tượng: Xác định và định vị các đối tượng trong một hình ảnh.
Phân đoạn thể hiện: Phát hiện các đối tượng và phân định ranh giới của chúng.
Phân loại hình ảnh: Phân loại hình ảnh vào các lớp được xác định trước.
Ước tính tư thế: Phát hiện và theo dõi các điểm chính trên cơ thể người.
Phát hiện đối tượng theo hướng (OBB): Phát hiện các đối tượng có xoay để có độ chính xác cao hơn.

Để biết thêm thông tin về từng tác vụ, hãy xem tài liệu Phát hiện, Phân đoạn thể hiện, Phân loại, Ước tính tư thế và Phát hiện theo hướng.

YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn bằng cách nào?

YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn thông qua những tiến bộ trong thiết kế mô hình và kỹ thuật tối ưu hóa. Kiến trúc cải tiến cho phép trích xuất và xử lý đặc trưng hiệu quả, dẫn đến mean Average Precision (mAP) cao hơn trên các tập dữ liệu như COCO, đồng thời sử dụng ít hơn 22% tham số so với YOLOv8m. Điều này giúp YOLO11 hiệu quả về mặt tính toán mà không ảnh hưởng đến độ chính xác, làm cho nó phù hợp để triển khai trên các thiết bị có tài nguyên hạn chế.

YOLO11 có thể được triển khai trên các thiết bị biên không?

Có, YOLO11 được thiết kế để thích ứng trên nhiều môi trường khác nhau, bao gồm cả các thiết bị biên. Kiến trúc được tối ưu hóa và khả năng xử lý hiệu quả giúp nó phù hợp để triển khai trên các thiết bị biên, nền tảng đám mây và các hệ thống hỗ trợ NVIDIA GPU. Tính linh hoạt này đảm bảo rằng YOLO11 có thể được sử dụng trong các ứng dụng đa dạng, từ phát hiện theo thời gian thực trên thiết bị di động đến các tác vụ phân đoạn phức tạp trong môi trường đám mây. Để biết thêm chi tiết về các tùy chọn triển khai, hãy tham khảo tài liệu Xuất.

📅 Được tạo 1 năm trước ✍️ Cập nhật 18 ngày trước