YOLO11 so với YOLOv5 Sự tiến hóa của phát hiện đối tượng thời gian thực
Sự tiến hóa của YOLO (You Only Look Once) là một dòng thời gian thể hiện sự đổi mới nhanh chóng trong lĩnh vực thị giác máy tính. YOLOv5 , được phát hành vào năm 2020 bởi Ultralytics đã tạo ra một cuộc cách mạng trong lĩnh vực này bằng cách giúp việc phát hiện đối tượng hiệu suất cao trở nên dễ tiếp cận thông qua một API cực kỳ thân thiện với người dùng và mạnh mẽ. PyTorch Việc triển khai. Đến cuối năm 2024, YOLO11 nổi lên như một công cụ mạnh mẽ được hoàn thiện, dựa trên nhiều năm phản hồi và những tiến bộ về kiến trúc để mang lại hiệu quả và độ chính xác vượt trội.
Bài so sánh này sẽ phân tích những tiến bộ kỹ thuật giữa hai mô hình mang tính biểu tượng này, giúp các nhà phát triển hiểu rõ khi nào nên duy trì hệ thống cũ và khi nào nên nâng cấp lên kiến trúc mới nhất.
Phân tích các chỉ số hiệu suất
Bước nhảy vọt từ YOLOv5 ĐẾN YOLO11 Điều này được thể hiện rõ nhất thông qua hiệu suất của chúng trên các bài kiểm tra chuẩn. YOLO11 giới thiệu các tối ưu hóa đáng kể cho phép nó đạt được Độ chính xác trung bình cao hơn ( mAP ) đồng thời duy trì hoặc giảm tải tính toán.
| Mô hình | Kích thước (pixels) | mAPval 50-95 | Tốc độ CPU ONNX (ms) | Tốc độ T4 TensorRT10 (ms) | Tham số (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Những Điểm Chính
- Tăng độ chính xác: YOLO11n đạt được mAP ấn tượng 39,5% , vượt trội hơn hẳn so với YOLOv5n (28,0%). mAP Điều này làm cho kích thước nhỏ nhất trở nên nhỏ nhất. YOLO11 Mô hình này khả thi cho các tác vụ phức tạp mà trước đây đòi hỏi các mô hình lớn hơn và chậm hơn.
- Hiệu quả tính toán: Mặc dù độ chính xác cao hơn, YOLO11 Các mô hình nói chung yêu cầu ít phép tính FLOP hơn. Ví dụ, YOLO11x sử dụng ít hơn khoảng 20% phép tính FLOP so với YOLOv5x trong khi vẫn mang lại kết quả phát hiện vượt trội.
- Hiệu năng CPU : CPU ONNX tốc độ cho YOLO11 Chúng nhanh hơn đáng kể, một yếu tố quan trọng đối với việc triển khai trên các thiết bị biên như Raspberry Pi .
YOLO11: Hiệu quả và tính linh hoạt được tinh chỉnh
Được phát hành vào tháng 9 năm 2024, YOLO11 đại diện cho đỉnh cao của những cải tiến lặp đi lặp lại trong Ultralytics YOLO Nguồn gốc của nó. Nó được thiết kế không chỉ để phát hiện thô mà còn để hỗ trợ một quy trình xử lý hình ảnh thống nhất bao gồm phân đoạn, ước tính tư thế và hộp giới hạn định hướng (OBB).
Thông số kỹ thuật:
- Tác giả: Glenn Jocher và Jing Qiu
- Tổ chức:Ultralytics
- Ngày: 2024-09-27
- Liên kết:GitHub, Tài liệu
Điểm nổi bật về kiến trúc
YOLO11 Giới thiệu khối C3k2 , một phiên bản tinh chỉnh của cơ chế thắt cổ chai Cross Stage Partial (CSP) giúp tối ưu hóa luồng gradient. Ngoài ra, nó sử dụng C2PSA (Cross-Stage Partial with Spatial Attention) trong phần phát hiện, tăng cường khả năng tập trung vào các đặc điểm quan trọng trong các cảnh phức tạp. Không giống như YOLOv5 YOLO11 là một kiến trúc không cần anchor , giúp đơn giản hóa quá trình huấn luyện bằng cách loại bỏ nhu cầu tính toán các anchor box cho các tập dữ liệu cụ thể, dẫn đến khả năng khái quát hóa tốt hơn.
Tại sao chọn YOLO11?
YOLO11 là lựa chọn được khuyến nghị cho hầu hết các ứng dụng thương mại mới. Nó có sự cân bằng giữa độ chính xác cao ( mAP Với ưu điểm vượt trội và mức tiêu thụ tài nguyên thấp, nó trở nên lý tưởng cho việc phân tích dữ liệu thời gian thực trong lĩnh vực bán lẻ, thành phố thông minh và chăm sóc sức khỏe.
YOLOv5 Tiêu chuẩn ngành
YOLOv5 Được phát hành vào giữa năm 2020, mô hình này đã thiết lập tiêu chuẩn về tính dễ sử dụng trong ngành công nghiệp AI. Đây là mô hình đầu tiên biến quá trình "huấn luyện, thẩm định, triển khai" thành một trải nghiệm liền mạch trong một kho lưu trữ duy nhất, thiết lập triết lý lấy người dùng làm trung tâm. Ultralytics được biết đến cho đến ngày nay.
Thông số kỹ thuật:
- Tác giả: Glenn Jocher
- Tổ chức:Ultralytics
- Ngày: 2020-06-26
- Liên kết:GitHub, Tài liệu
Điểm nổi bật về kiến trúc
YOLOv5 Nó sử dụng kiến trúc xương sống CSPDarknet và là một bộ dò dựa trên điểm neo . Mặc dù rất hiệu quả, các phương pháp dựa trên điểm neo có thể nhạy cảm với việc điều chỉnh siêu tham số liên quan đến kích thước hộp. Mặc dù đã có tuổi đời, YOLOv5 Nó vẫn là một công cụ đáng tin cậy, đặc biệt trong những trường hợp phần cứng cũ hoặc các chứng nhận phần mềm cụ thể khiến các dự án bị ràng buộc vào các phiên bản khung phần mềm cũ hơn.
Sự khác biệt về kiến trúc và đào tạo
Hệ sinh thái và Dễ sử dụng
Một trong những ưu điểm mạnh nhất của cả hai mô hình là khả năng tích hợp vào hệ sinh thái Ultralytics . Cho dù bạn đang sử dụng YOLOv5 hoặc YOLO11 Bạn sẽ được hưởng lợi từ API thống nhất, tài liệu đầy đủ và hỗ trợ xuất mô hình liền mạch sang các định dạng như... TensorRT , CoreML , Và OpenVINO .
Tuy nhiên, YOLO11 hưởng lợi từ những bản cập nhật mới nhất trong ultralytics Python gói phần mềm này cung cấp khả năng tích hợp chặt chẽ hơn với các công cụ như... Nền tảng Ultralytics Dùng cho đào tạo trên nền tảng đám mây và quản lý tập dữ liệu.
Hiệu quả huấn luyện
YOLO11 Thông thường, mô hình này hội tụ nhanh hơn trong quá trình huấn luyện nhờ kiến trúc và hàm mất mát được cải tiến. Yêu cầu về bộ nhớ của nó cũng được tối ưu hóa cao. Không giống như các mô hình transformer khổng lồ đòi hỏi lượng VRAM lớn, YOLO11 (Và YOLOv5 ) có thể được huấn luyện hiệu quả trên các GPU dành cho người tiêu dùng.
Đây là cách bạn có thể huấn luyện một YOLO11 mô hình sử dụng Ultralytics Python bưu kiện:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset
# fast, efficient, and low-memory usage
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Tính linh hoạt
Trong khi YOLOv5 YOLO11 được cập nhật sau này trong vòng đời của nó để hỗ trợ phân đoạn và phân loại, nhưng ngay từ đầu nó đã được xây dựng với mục tiêu thực hiện các tác vụ này. Nếu dự án của bạn yêu cầu chuyển đổi giữa Phát hiện đối tượng , Phân đoạn đối tượng , Ước tính tư thế hoặc Hộp giới hạn định hướng (OBB) , YOLO11 mang lại trải nghiệm liền mạch và hiệu quả hơn trên tất cả các phương thức này.
Kết luận: Nên sử dụng mô hình nào?
Đối với phần lớn người dùng bắt đầu một dự án ngày nay, YOLO11 là lựa chọn tối ưu. Nó mang lại sự cải tiến "miễn phí": độ chính xác tốt hơn và tốc độ tương đương hoặc nhanh hơn mà không làm tăng độ phức tạp. YOLOv5 Nó vẫn là một điểm tham chiếu tuyệt vời cho nghiên cứu và bảo trì hệ thống cũ, nhưng lại tụt hậu khi so sánh từng chỉ số một với các kiến trúc hiện đại.
Xu hướng tiên tiến: YOLO26
Nếu bạn đang tìm kiếm công nghệ thị giác máy tính tiên tiến nhất (tính đến tháng 1 năm 2026), bạn nên tìm hiểu về YOLO26 .
YOLO26 được xây dựng dựa trên nền tảng của YOLO11 nhưng lại giới thiệu thiết kế End-to-End NMS -Free , loại bỏ nhu cầu xử lý hậu kỳ Non-Maximum Suppression. Điều này dẫn đến việc triển khai đơn giản hơn và tốc độ suy luận nhanh hơn, đặc biệt là trên... CPU - các thiết bị biên giới hạn. Với những cải tiến như trình tối ưu hóa MuSGD và ProgLoss , YOLO26 cung cấp khả năng suy luận CPU nhanh hơn tới 43% so với các thế hệ trước.
Các Mô hình Khác để Khám phá
- RT-DETR : Một bộ dò dựa trên biến áp, có độ chính xác vượt trội khi tốc độ thời gian thực không phải là yếu tố quan trọng.
- YOLO -World : Lý tưởng cho việc phát hiện từ vựng mở, nơi bạn cần... detect Các đối tượng không có trong tập dữ liệu huấn luyện.