YOLO11 so với YOLOv10 : Kết nối sự tiến hóa và cuộc cách mạng trong phát hiện đối tượng thời gian thực
Lĩnh vực thị giác máy tính được định hình bởi sự lặp lại nhanh chóng và những bước tiến đột phá. YOLO11 và YOLOv10 đại diện cho hai triết lý khác biệt trong quá trình tiến hóa này. Trong khi đó, YOLO11 tinh chỉnh những gì đã được thiết lập và vững chắc. Ultralytics Kiến trúc hướng đến tính linh hoạt tối đa và khả năng sẵn sàng sản xuất. YOLOv10 đã giới thiệu những khái niệm mang tính cách mạng như NMS - Chương trình đào tạo miễn phí đã ảnh hưởng đến các mô hình mới hơn như YOLO26 .
Bản so sánh toàn diện này sẽ phân tích các quyết định về kiến trúc, chỉ số hiệu năng và các trường hợp sử dụng lý tưởng cho cả hai mô hình, giúp các nhà phát triển lựa chọn công cụ phù hợp cho dự án thị giác máy tính tiếp theo của họ.
Tổng quan về các chỉ số hiệu suất
Cả hai mô hình đều cung cấp những khả năng ấn tượng, nhưng chúng ưu tiên các khía cạnh khác nhau của quy trình suy luận. Bảng dưới đây nêu bật các số liệu thống kê hiệu năng chính trên các tập dữ liệu chuẩn.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Tìm hiểu sâu về kiến trúc
YOLO11 : Sức mạnh đa năng
YOLO11 , được phát hành bởi Ultralytics Ra mắt vào tháng 9 năm 2024, sản phẩm này được xây dựng dựa trên nền tảng thử nghiệm thực tế rộng rãi. Nó sử dụng kiến trúc xương sống và cổ được nâng cao, được thiết kế để giàu tính năng , cho phép nó vượt trội không chỉ trong phát hiện đối tượng mà còn trong các tác vụ phức tạp hơn như phân đoạn đối tượng và ước tính tư thế .
Các tính năng kiến trúc chính bao gồm:
- Khối C3k2: Một phiên bản được cải tiến của khối điều tiết CSP nhằm tối ưu hóa luồng gradient và hiệu quả tham số.
- Cải thiện khả năng chú ý không gian: Nâng cao khả năng tập trung của mô hình vào các vật thể nhỏ hoặc bị che khuất một phần, một yêu cầu quan trọng đối với phân tích ảnh chụp từ trên không .
- Thiết kế không cần neo: Giảm độ phức tạp của việc điều chỉnh siêu tham số và cải thiện khả năng khái quát hóa trên các tập dữ liệu đa dạng.
YOLOv10: Tiên phong End-to-End
YOLOv10 , được phát triển bởi các nhà nghiên cứu tại Đại học Thanh Hoa, đã gây chú ý với trọng tâm là loại bỏ hiện tượng ức chế không tối đa (Non-Maximum Suppression). NMS bước xử lý hậu kỳ. Sự thay đổi kiến trúc này giải quyết một nút thắt cổ chai lâu nay trong các quy trình triển khai, nơi mà NMS Độ trễ có thể thay đổi khó lường tùy thuộc vào số lượng đối tượng được phát hiện.
Các đổi mới chính bao gồm:
- NMS - Huấn luyện miễn phí: Việc sử dụng các phép gán kép nhất quán trong quá trình huấn luyện cho phép mô hình dự đoán chính xác một hộp cho mỗi đối tượng, loại bỏ nhu cầu về NMS suy luận.
- Thiết kế hiệu quả-chính xác toàn diện: Kiến trúc này bao gồm các đầu phân loại nhẹ và lấy mẫu giảm kích thước tách rời kênh không gian để giảm chi phí tính toán.
- Thiết kế khối dựa trên thứ hạng: Tối ưu hóa các giai đoạn của mô hình để giảm sự dư thừa, giảm số phép tính FLOP mà không làm giảm độ chính xác.
Hệ sinh thái và Dễ sử dụng
Mặc dù các chỉ số thô rất quan trọng, nhưng trải nghiệm của nhà phát triển thường quyết định sự thành công của dự án.
Lợi thế của Ultralytics
YOLO11 Là một thành viên chính thức của hệ sinh thái Ultralytics , mang lại những lợi thế đáng kể cho quy trình làm việc của doanh nghiệp và nghiên cứu:
- API thống nhất: Giống nhau Python Giao diện hỗ trợ phát hiện, phân đoạn, phân loại, OBB và ước tính tư thế. Việc chuyển đổi giữa các tác vụ rất đơn giản, chỉ cần thay đổi tệp mô hình.
- Tích hợp nền tảng: Kết nối liền mạch với Nền tảng Ultralytics để quản lý tập dữ liệu, trực quan hóa các lần chạy huấn luyện và triển khai đến các thiết bị biên.
- Tính linh hoạt khi xuất khẩu: Hỗ trợ tích hợp xuất khẩu sang ONNX , TensorRT , CoreML , Và OpenVINO Đảm bảo mô hình của bạn hoạt động hiệu quả trên mọi phần cứng.
Quy trình làm việc tinh gọn
Sử dụng Ultralytics Việc sử dụng mô hình có nghĩa là bạn dành ít thời gian hơn để viết mã lặp đi lặp lại và dành nhiều thời gian hơn để giải quyết các vấn đề cụ thể trong lĩnh vực của mình. Chỉ cần một vài dòng mã là đủ để huấn luyện một mô hình hiện đại.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset with minimal configuration
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference and display results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
YOLOv10 Tích hợp
YOLOv10 cũng được hỗ trợ trong phạm vi Ultralytics Gói này cho phép người dùng tận dụng cùng một cú pháp tiện lợi. Tuy nhiên, với tư cách là một đóng góp học thuật, nó có thể không nhận được tần suất cập nhật cụ thể cho từng nhiệm vụ (như OBB hoặc các cải tiến theo dõi) so với gói cốt lõi. Ultralytics các mô hình. Nó là một lựa chọn tuyệt vời cho các nhiệm vụ phát hiện thuần túy, nơi mà... NMS Kiến trúc không phụ thuộc vào thành phần mang lại lợi thế cụ thể về độ trễ.
Các ứng dụng thực tế
Việc lựa chọn giữa các mô hình này thường phụ thuộc vào những ràng buộc cụ thể của môi trường triển khai của bạn.
Các kịch bản lý tưởng cho YOLO11
YOLO11 Tính linh hoạt của nó khiến nó trở thành lựa chọn ưu tiên cho các ứng dụng phức tạp, đa diện:
- Bán lẻ thông minh: Đồng thời track khách hàng (Pose) và theo dõi lượng hàng tồn kho trên kệ (Detection) để tối ưu hóa bố cục cửa hàng và hàng tồn kho.
- Robot tự hành: Sử dụng hộp giới hạn định hướng (OBB) để giúp robot nắm bắt các vật thể không được căn chỉnh hoàn toàn theo chiều ngang.
- Nông nghiệp: Triển khai các mô hình phân đoạn để xác định chính xác các bệnh trên lá cây trồng, trong trường hợp các khung bao đơn giản không đủ.
Các kịch bản lý tưởng cho YOLOv10
YOLOv10 Nổi bật trong môi trường mà độ trễ xử lý hậu kỳ là một nút thắt cổ chai quan trọng:
- Đếm đám đông mật độ cao: Trong các tình huống có hàng trăm đối tượng, NMS có thể trở nên chậm. YOLOv10 Thiết kế toàn diện của nó duy trì tốc độ ổn định bất kể số lượng đối tượng.
- Hệ thống nhúng: Dành cho các thiết bị có tài nguyên hạn chế CPU chu kỳ xử lý hậu kỳ, việc loại bỏ NMS Giải phóng các nguồn lực quý giá.
Kết luận: Bạn nên chọn mô hình nào?
YOLO11 vẫn là công cụ đa năng mạnh mẽ nhất dành cho phần lớn các nhà phát triển. Sự cân bằng giữa tốc độ, độ chính xác và khả năng hỗ trợ nhiều tác vụ xử lý hình ảnh – được hỗ trợ bởi tài liệu toàn diện của Ultralytics – khiến nó trở thành lựa chọn an toàn và mạnh mẽ cho việc triển khai thương mại.
YOLOv10 cung cấp một giải pháp thay thế hấp dẫn cho các quy trình chỉ tập trung vào phát hiện, đặc biệt là trong trường hợp cần loại bỏ... NMS Mang lại lợi ích thiết thực về độ ổn định độ trễ.
Tuy nhiên, đối với những ai tìm kiếm công nghệ tiên tiến nhất, chúng tôi khuyên bạn nên khám phá YOLO26 . Được phát hành vào tháng 1 năm 2026, YOLO26 kết hợp hiệu quả những ưu điểm tốt nhất của cả hai thế giới: nó áp dụng thiết kế hoàn toàn không cần NMS do tiên phong bởi YOLOv10 đồng thời vẫn giữ được sự phong phú về tính năng, tính linh hoạt trong công việc và khả năng hỗ trợ hệ sinh thái của YOLO11 Với các tối ưu hóa như huấn luyện MuSGD và loại bỏ DFL , YOLO26 mang lại hiệu suất vượt trội cho cả triển khai ở biên và trên đám mây.
Các Mô hình Khác để Khám phá
- YOLO26 : Mẫu đồng hồ hiện đại nhất từ... Ultralytics (Tháng 1 năm 2026), có sự góp mặt của... NMS - kiến trúc tự do và CPU các tối ưu hóa.
- YOLOv8 : Một tiêu chuẩn công nghiệp được áp dụng rộng rãi, nổi tiếng về độ tin cậy và khả năng tương thích cao.
- RT-DETR : Một thiết bị dò dựa trên biến áp cung cấp độ chính xác cao, lý tưởng cho các tình huống cần thiết. GPU Nguồn tài nguyên dồi dào.
- SAM 2 : Mô hình phân đoạn mọi thứ của Meta, hoàn hảo cho các tác vụ phân đoạn không cần dữ liệu huấn luyện khi dữ liệu huấn luyện khan hiếm.