Ultralytics YOLO11

Tổng quan

YOLO11 là phiên bản mới nhất của Ultralytics YOLO loạt các máy dò vật thể thời gian thực, định nghĩa lại những gì có thể với độ chính xác , tốc độ và hiệu quả tiên tiến. Xây dựng dựa trên những tiến bộ ấn tượng của trước đây YOLO phiên bản, YOLO11 mang đến những cải tiến đáng kể về kiến trúc và phương pháp đào tạo, khiến nó trở thành lựa chọn linh hoạt cho nhiều tác vụ thị giác máy tính .

Ultralytics YOLO11 Biểu đồ so sánh

Ultralytics YOLO11 🚀 Podcast được tạo bởi NotebookLM

Đồng hồ: Cách sử dụng Ultralytics YOLO11 để Phát hiện và Theo dõi Đối tượng | Cách Đánh giá Chuẩn | YOLO11 ĐÃ PHÁT HÀNH🚀

Các tính năng chính

Trích xuất tính năng nâng cao: YOLO11 sử dụng kiến trúc xương sống và cổ được cải tiến, giúp tăng cường khả năng trích xuất tính năng để phát hiện đối tượng chính xác hơn và thực hiện tác vụ phức tạp.
Được tối ưu hóa cho hiệu quả và tốc độ: YOLO11 giới thiệu các thiết kế kiến trúc tinh tế và quy trình đào tạo được tối ưu hóa, mang lại tốc độ xử lý nhanh hơn và duy trì sự cân bằng tối ưu giữa độ chính xác và hiệu suất.
Độ chính xác cao hơn với ít tham số hơn: Với những tiến bộ trong thiết kế mô hình, YOLO11m đạt được Độ chính xác trung bình (mAP) cao hơn trên tập dữ liệu COCO trong khi sử dụng ít hơn 22% tham số so với YOLOv8m , giúp tính toán hiệu quả mà không ảnh hưởng đến độ chính xác.
Khả năng thích ứng trong nhiều môi trường: YOLO11 có thể được triển khai liền mạch trên nhiều môi trường khác nhau, bao gồm các thiết bị biên, nền tảng đám mây và hệ thống hỗ trợ NVIDIA GPU đảm bảo tính linh hoạt tối đa.
Phạm vi rộng các tác vụ được hỗ trợ: Cho dù đó là phát hiện đối tượng, phân đoạn thể hiện, phân loại hình ảnh, ước tính tư thế hay phát hiện đối tượng theo hướng (OBB), YOLO11 được thiết kế để giải quyết nhiều thách thức khác nhau về thị giác máy tính.

Nhiệm vụ và chế độ được hỗ trợ

YOLO11 xây dựng dựa trên phạm vi mô hình đa dạng được giới thiệu trong YOLOv8 , cung cấp hỗ trợ nâng cao cho nhiều tác vụ thị giác máy tính khác nhau:

Người mẫu	Tên tập tin	Nhiệm vụ	Suy luận	Xác thực	Đào tạo	Xuất khẩu
YOLO11	`yolo11n.pt` `yolo11s.pt` `yolo11m.pt` `yolo11l.pt` `yolo11x.pt`	Phát hiện	✅	✅	✅	✅
YOLO11 -phân đoạn	`yolo11n-seg.pt` `yolo11s-seg.pt` `yolo11m-seg.pt` `yolo11l-seg.pt` `yolo11x-seg.pt`	Phân đoạn trường hợp	✅	✅	✅	✅
YOLO11 -tư thế	`yolo11n-pose.pt` `yolo11s-pose.pt` `yolo11m-pose.pt` `yolo11l-pose.pt` `yolo11x-pose.pt`	Tư thế/Điểm chính	✅	✅	✅	✅
YOLO11 -obb	`yolo11n-obb.pt` `yolo11s-obb.pt` `yolo11m-obb.pt` `yolo11l-obb.pt` `yolo11x-obb.pt`	Phát hiện định hướng	✅	✅	✅	✅
YOLO11 -cls	`yolo11n-cls.pt` `yolo11s-cls.pt` `yolo11m-cls.pt` `yolo11l-cls.pt` `yolo11x-cls.pt`	Phân loại	✅	✅	✅	✅

Bảng này cung cấp tổng quan về YOLO11 các biến thể mô hình, thể hiện khả năng ứng dụng của chúng trong các nhiệm vụ cụ thể và khả năng tương thích với các chế độ hoạt động như Suy luận, Xác thực, Đào tạo và Xuất. Tính linh hoạt này làm cho YOLO11 phù hợp với nhiều ứng dụng trong thị giác máy tính, từ phát hiện thời gian thực đến các tác vụ phân đoạn phức tạp.

Số liệu hiệu suất

Hiệu suất

Phát hiện (COCO)Phân đoạn (COCO)Phân loại (ImageNet)Tư thế (COCO)OBB (DOTAv1)

Xem Tài liệu phát hiện để biết các ví dụ sử dụng với các mô hình được đào tạo trên COCO , bao gồm 80 lớp được đào tạo trước.

Người mẫu	kích cỡ ^{(điểm ảnh)}	^{giá trị} mAP ^50-95	Tốc độ ^{CPU ONNX (bệnh đa xơ cứng)}	Tốc độ ^{T4 TensorRT10 (bệnh đa xơ cứng)}	tham số ^(Nam)	Thất bại ^(B)
YOLO11n	640	39.5	56,1 ± 0,8	1,5 ± 0,0	2.6	6.5
YOLO11s	640	47.0	90,0 ± 1,2	2,5 ± 0,0	9.4	21.5
YOLO11m	640	51.5	183,2 ± 2,0	4,7 ± 0,1	20.1	68.0
YOLO11l	640	53.4	238,6 ± 1,4	6,2 ± 0,1	25.3	86.9
YOLO11x	640	54.7	462,8 ± 6,7	11,3 ± 0,2	56.9	194.9

Xem Segmentation Docs để biết các ví dụ sử dụng với các mô hình được đào tạo trên COCO , bao gồm 80 lớp được đào tạo trước.

Người mẫu	kích cỡ ^{(điểm ảnh)}	^hộp mAP ^50-95	^{mặt nạ} mAP ^50-95	Tốc độ ^{CPU ONNX (bệnh đa xơ cứng)}	Tốc độ ^{T4 TensorRT10 (bệnh đa xơ cứng)}	tham số ^(Nam)	Thất bại ^(B)
YOLO11n-phân đoạn	640	38.9	32.0	65,9 ± 1,1	1,8 ± 0,0	2.9	10.4
YOLO11s-phân đoạn	640	46.6	37.8	117,6 ± 4,9	2,9 ± 0,0	10.1	35.5
YOLO11m-đoạn	640	51.5	41.5	281,6 ± 1,2	6,3 ± 0,1	22.4	123.3
YOLO11l-phân đoạn	640	53.4	42.9	344,2 ± 3,2	7,8 ± 0,2	27.6	142.2
YOLO11x-phân đoạn	640	54.7	43.8	664,5 ± 3,2	15,8 ± 0,7	62.1	319.0

Xem Tài liệu phân loại để biết ví dụ sử dụng với các mô hình được đào tạo trên ImageNet , bao gồm 1000 lớp được đào tạo trước.

Người mẫu	kích cỡ ^{(điểm ảnh)}	theo ^{đầu trang1}	theo ^top5	Tốc độ ^{CPU ONNX (bệnh đa xơ cứng)}	Tốc độ ^{T4 TensorRT10 (bệnh đa xơ cứng)}	tham số ^(Nam)	Thất bại ^{(B) ở 224}
YOLO11n-cls	224	70.0	89.4	5,0 ± 0,3	1,1 ± 0,0	1.6	0.5
YOLO11s-cls	224	75.4	92.7	7,9 ± 0,2	1,3 ± 0,0	5.5	1.6
YOLO11m-cls	224	77.3	93.9	17,2 ± 0,4	2,0 ± 0,0	10.4	5.0
YOLO11l-cls	224	78.3	94.3	23,2 ± 0,3	2,8 ± 0,0	12.9	6.2
YOLO11x-cls	224	79.5	94.9	41,4 ± 0,9	3,8 ± 0,0	28.4	13.7

Xem Tài liệu ước tính tư thế để biết các ví dụ sử dụng với các mô hình được đào tạo trên COCO , bao gồm 1 lớp được đào tạo trước, 'người'.

Người mẫu	kích cỡ ^{(điểm ảnh)}	^{tư thế} mAP ^50-95	^{tư thế} mAP ⁵⁰	Tốc độ ^{CPU ONNX (bệnh đa xơ cứng)}	Tốc độ ^{T4 TensorRT10 (bệnh đa xơ cứng)}	tham số ^(Nam)	Thất bại ^(B)
YOLO11n-tư thế	640	50.0	81.0	52,4 ± 0,5	1,7 ± 0,0	2.9	7.6
YOLO11s-tư thế	640	58.9	86.3	90,5 ± 0,6	2,6 ± 0,0	9.9	23.2
YOLO11m-tư thế	640	64.9	89.4	187,3 ± 0,8	4,9 ± 0,1	20.9	71.7
YOLO11l-tư thế	640	66.1	89.9	247,7 ± 1,1	6,4 ± 0,1	26.2	90.7
YOLO11x-tư thế	640	69.5	91.1	488,0 ± 13,9	12,1 ± 0,2	58.8	203.3

Xem Tài liệu phát hiện định hướng để biết các ví dụ sử dụng với các mô hình được đào tạo trên DOTAv1 , bao gồm 15 lớp được đào tạo trước.

Người mẫu	kích cỡ ^{(điểm ảnh)}	^{kiểm tra} mAP ⁵⁰	Tốc độ ^{CPU ONNX (bệnh đa xơ cứng)}	Tốc độ ^{T4 TensorRT10 (bệnh đa xơ cứng)}	tham số ^(Nam)	Thất bại ^(B)
YOLO11n-obb	1024	78.4	117,6 ± 0,8	4,4 ± 0,0	2.7	17.2
YOLO11s-obb	1024	79.5	219,4 ± 4,0	5,1 ± 0,0	9.7	57.5
YOLO11m-obb	1024	80.9	562,8 ± 2,9	10,1 ± 0,4	20.9	183.5
YOLO11l-obb	1024	81.0	712,5 ± 5,0	13,5 ± 0,6	26.2	232.0
YOLO11x-obb	1024	81.3	1408,6 ± 7,7	28,6 ± 1,0	58.8	520.2

Ví dụ sử dụng

Phần này cung cấp đơn giản YOLO11 ví dụ về đào tạo và suy luận. Để biết tài liệu đầy đủ về các chế độ này và các chế độ khác, hãy xem các trang tài liệu Predict , Train , Val và Export .

Lưu ý rằng ví dụ dưới đây là dành cho YOLO11 Phát hiện mô hình để phát hiện đối tượng . Để biết thêm các tác vụ được hỗ trợ, hãy xem tài liệu Segment , Classify , OBB và Pose .

Ví dụ

PythonCLI

PyTorch được đào tạo trước *.pt mô hình cũng như cấu hình *.yaml các tập tin có thể được chuyển đến YOLO() lớp để tạo một thể hiện mô hình trong Python :

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

CLI các lệnh có sẵn để chạy trực tiếp các mô hình:

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO11n model and run inference on the 'bus.jpg' image
yolo predict model=yolo11n.pt source=path/to/bus.jpg

Trích dẫn và Lời cảm ơn

Ultralytics YOLO11 Xuất bản

Ultralytics chưa công bố một bài báo nghiên cứu chính thức nào YOLO11 do bản chất phát triển nhanh chóng của các mô hình. Chúng tôi tập trung vào việc cải tiến công nghệ và làm cho nó dễ sử dụng hơn, thay vì tạo ra tài liệu tĩnh. Để biết thông tin mới nhất về YOLO kiến trúc, tính năng và cách sử dụng, vui lòng tham khảo kho lưu trữ và tài liệu GitHub của chúng tôi.

Nếu bạn sử dụng YOLO11 hoặc bất kỳ phần mềm nào khác từ kho lưu trữ này trong tác phẩm của bạn, vui lòng trích dẫn theo định dạng sau:

BibTeX

@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0002-7603-6750, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Xin lưu ý rằng DOI đang chờ xử lý và sẽ được thêm vào trích dẫn khi có sẵn. YOLO11 các mô hình được cung cấp theo giấy phép AGPL-3.0 và Enterprise .

CÂU HỎI THƯỜNG GẶP

Những cải tiến chính trong là gì? Ultralytics YOLO11 so với các phiên bản trước?

Ultralytics YOLO11 giới thiệu một số tiến bộ đáng kể so với các phiên bản trước. Những cải tiến chính bao gồm:

Trích xuất tính năng nâng cao: YOLO11 sử dụng kiến trúc xương sống và cổ được cải tiến, tăng cường khả năng trích xuất tính năng để phát hiện đối tượng chính xác hơn.
Hiệu quả và tốc độ được tối ưu hóa: Thiết kế kiến trúc tinh tế và quy trình đào tạo được tối ưu hóa mang lại tốc độ xử lý nhanh hơn trong khi vẫn duy trì sự cân bằng giữa độ chính xác và hiệu suất.
Độ chính xác cao hơn với ít tham số hơn: YOLO11m đạt được Độ chính xác trung bình (mAP) cao hơn trên tập dữ liệu COCO với ít hơn 22% tham số so với YOLOv8m , giúp tính toán hiệu quả mà không ảnh hưởng đến độ chính xác.
Khả năng thích ứng trong nhiều môi trường: YOLO11 có thể được triển khai trên nhiều môi trường khác nhau, bao gồm các thiết bị biên, nền tảng đám mây và hệ thống hỗ trợ NVIDIA GPU.
Phạm vi rộng các nhiệm vụ được hỗ trợ: YOLO11 hỗ trợ nhiều tác vụ thị giác máy tính khác nhau như phát hiện đối tượng, phân đoạn trường hợp , phân loại hình ảnh, ước tính tư thế và phát hiện đối tượng theo hướng (OBB).

Làm thế nào để tôi đào tạo một YOLO11 mô hình phát hiện vật thể?

Đào tạo một YOLO11 mô hình để phát hiện đối tượng có thể được thực hiện bằng cách sử dụng Python hoặc CLI lệnh. Dưới đây là ví dụ cho cả hai phương pháp:

Ví dụ

PythonCLI

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

Để biết hướng dẫn chi tiết hơn, hãy tham khảo tài liệu Train .

Những nhiệm vụ nào có thể YOLO11 mô hình thực hiện?

YOLO11 Các mô hình rất linh hoạt và hỗ trợ nhiều tác vụ thị giác máy tính, bao gồm:

Phát hiện đối tượng: Xác định và định vị các đối tượng trong hình ảnh.
Phân đoạn trường hợp: Phát hiện đối tượng và phân định ranh giới của chúng.
Phân loại hình ảnh : Phân loại hình ảnh thành các lớp được xác định trước.
Ước tính tư thế: Phát hiện và theo dõi các điểm chính trên cơ thể con người.
Phát hiện đối tượng định hướng (OBB): Phát hiện đối tượng bằng cách xoay để có độ chính xác cao hơn.

Để biết thêm thông tin về từng nhiệm vụ, hãy xem tài liệu Phát hiện , Phân đoạn trường hợp , Phân loại , Ước tính tư thế và Phát hiện định hướng .

Làm thế nào YOLO11 đạt được độ chính xác cao hơn với ít thông số hơn?

YOLO11 đạt được độ chính xác cao hơn với ít tham số hơn thông qua những tiến bộ trong thiết kế mô hình và các kỹ thuật tối ưu hóa. Kiến trúc được cải tiến cho phép trích xuất và xử lý tính năng hiệu quả, dẫn đến Độ chính xác trung bình (mAP) cao hơn trên các tập dữ liệu như COCO trong khi sử dụng ít hơn 22% tham số so với YOLOv8m . Điều này làm cho YOLO11 có hiệu quả tính toán mà không ảnh hưởng đến độ chính xác, do đó phù hợp để triển khai trên các thiết bị có nguồn lực hạn chế.

Có thể YOLO11 có thể triển khai trên các thiết bị biên không?

Đúng, YOLO11 được thiết kế để thích ứng với nhiều môi trường khác nhau, bao gồm các thiết bị biên. Kiến trúc được tối ưu hóa và khả năng xử lý hiệu quả của nó làm cho nó phù hợp để triển khai trên các thiết bị biên, nền tảng đám mây và các hệ thống hỗ trợ NVIDIA GPU. Sự linh hoạt này đảm bảo rằng YOLO11 có thể được sử dụng trong nhiều ứng dụng khác nhau, từ phát hiện thời gian thực trên thiết bị di động đến các tác vụ phân đoạn phức tạp trong môi trường đám mây. Để biết thêm chi tiết về các tùy chọn triển khai, hãy tham khảo tài liệu Xuất .

📅 Được tạo ra cách đây 6 tháng ✏️ Đã cập nhật cách đây 1 tháng