So sánh kỹ thuật: YOLOv5 so với YOLO11
Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, cân bằng giữa nhu cầu về độ chính xác, tốc độ và hiệu quả tài nguyên. Trang này cung cấp so sánh kỹ thuật chi tiết giữa hai mô hình mang tính bước ngoặt từ Ultralytics: Ultralytics YOLOv5 được áp dụng rộng rãi và Ultralytics YOLO11 hiện đại. Trong khi YOLOv5 đặt ra một tiêu chuẩn công nghiệp về hiệu suất và dễ sử dụng, YOLO11 đại diện cho sự phát triển tiếp theo, cung cấp độ chính xác vượt trội, tính linh hoạt cao hơn và hiệu quả nâng cao trong cùng một hệ sinh thái Ultralytics mạnh mẽ.
Ultralytics YOLOv5: Tiêu chuẩn công nghiệp đã được thiết lập
Được phát hành vào năm 2020, YOLOv5 nhanh chóng trở thành một trong những mô hình phát hiện đối tượng phổ biến nhất trên thế giới. Danh tiếng của nó được xây dựng dựa trên sự kết hợp đặc biệt giữa tốc độ, độ tin cậy và tính thân thiện với người dùng, khiến nó trở thành lựa chọn hàng đầu cho vô số nhà phát triển và nhà nghiên cứu.
Chi tiết kỹ thuật:
- Tác giả: Glenn Jocher
- Tổ chức: Ultralytics
- Date: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Tài liệu: https://docs.ultralytics.com/models/yolov5/
Kiến trúc và các tính năng chính
YOLOv5 được xây dựng trên PyTorch và có backbone CSPDarknet53 kết hợp với neck PANet để tổng hợp đặc trưng hiệu quả. Kiến trúc của nó có khả năng mở rộng cao, cung cấp một loạt các mô hình từ YOLOv5n nhỏ và nhanh đến YOLOv5x lớn và chính xác. Một đặc điểm chính của YOLOv5 là head phát hiện dựa trên anchor, rất hiệu quả vào thời điểm phát hành.
Điểm mạnh
- Tốc độ suy luận vượt trội: YOLOv5 được tối ưu hóa cao để suy luận nhanh chóng, khiến nó trở thành một lựa chọn mạnh mẽ cho các ứng dụng thời gian thực, đặc biệt là trên phần cứng GPU.
- Hệ sinh thái trưởng thành: Là một mô hình đã được thiết lập tốt, YOLOv5 được hưởng lợi từ một cộng đồng lớn, các hướng dẫn mở rộng và hỗ trợ rộng rãi của bên thứ ba. Nó đã được thử nghiệm qua nhiều môi trường sản xuất.
- Dễ sử dụng: Nổi tiếng với API đơn giản và tài liệu đầy đủ, YOLOv5 cho phép tạo mẫu và triển khai nhanh chóng. Mô hình được tích hợp liền mạch vào hệ sinh thái Ultralytics, bao gồm Ultralytics HUB để huấn luyện không cần code.
- Hiệu quả huấn luyện: YOLOv5 cung cấp quy trình huấn luyện hiệu quả với các trọng số đã được huấn luyện trước có sẵn, cho phép chuyển giao học tập hiệu quả và chu kỳ phát triển nhanh hơn.
Điểm yếu
- Phát hiện dựa trên Anchor: Việc dựa vào các hộp anchor được xác định trước đôi khi có thể yêu cầu điều chỉnh cẩn thận cho các bộ dữ liệu có các đối tượng có hình dạng bất thường, một hạn chế được giải quyết bởi các bộ dò tìm không cần anchor mới hơn.
- Giới hạn độ chính xác: Mặc dù vẫn rất chính xác, hiệu suất của nó trên các chuẩn đánh giá như COCO đã bị vượt qua bởi các kiến trúc gần đây hơn như YOLO11.
Các trường hợp sử dụng lý tưởng
YOLOv5 vẫn là một lựa chọn tuyệt vời cho các ứng dụng mà tốc độ và tính ổn định là tối quan trọng:
- Điện toán biên: Các biến thể nhỏ hơn của nó là hoàn hảo để triển khai trên các thiết bị có tài nguyên hạn chế như Raspberry Pi và NVIDIA Jetson.
- Giám sát thời gian thực: Cung cấp năng lượng cho các hệ thống an ninh và các ứng dụng giám sát đòi hỏi FPS cao.
- Tự động hóa công nghiệp: Được sử dụng để kiểm soát chất lượng và tự động hóa quy trình trong môi trường sản xuất.
Ultralytics YOLO11: Sự Phát triển Tiếp theo trong AI Thị giác
YOLO11 là mô hình hiện đại nhất từ Ultralytics, được thiết kế để vượt qua các giới hạn về những gì có thể trong thị giác máy tính. Nó được xây dựng dựa trên thành công của các phiên bản tiền nhiệm, bao gồm YOLOv8, để mang lại những cải tiến đáng kể về độ chính xác, tốc độ và tính linh hoạt.
Chi tiết kỹ thuật:
- Tác giả: Glenn Jocher, Jing Qiu
- Tổ chức: Ultralytics
- Ngày: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Tài liệu: https://docs.ultralytics.com/models/yolo11/
Kiến trúc và các tính năng chính
YOLO11 giới thiệu một kiến trúc mạng được tinh chỉnh với khả năng trích xuất đặc trưng nâng cao và thiết kế được tinh giản. Một tiến bộ lớn là detection head không neo, giúp cải thiện khả năng tổng quát hóa và đơn giản hóa quy trình huấn luyện. Thiết kế hiện đại này cho phép YOLO11 đạt được độ chính xác cao hơn với việc sử dụng tham số hiệu quả hơn, dẫn đến tốc độ suy luận nhanh hơn và nhu cầu tính toán thấp hơn.
Điểm mạnh
- Hiệu suất vượt trội: YOLO11 đặt ra một tiêu chuẩn mới về độ chính xác, đạt được điểm số mAP cao hơn YOLOv5 trên tất cả các kích thước mô hình.
- Tính Linh Hoạt Cao: YOLO11 là một framework đa nhiệm thực thụ, hỗ trợ nhận diện đối tượng, phân vùng thể hiện (instance segmentation), phân loại ảnh, ước tính tư thế và hộp giới hạn xoay (OBB) trong một mô hình thống nhất duy nhất.
- Hiệu quả vượt trội: Mô hình có hiệu suất cao, mang lại sự cân bằng tốt hơn giữa tốc độ và độ chính xác. Đáng chú ý, nó thể hiện khả năng suy luận nhanh hơn đáng kể trên CPU so với YOLOv5, giúp nó có thể truy cập được đối với nhiều loại phần cứng hơn. Nó cũng đòi hỏi ít bộ nhớ hơn cho quá trình huấn luyện và suy luận so với nhiều kiến trúc khác.
- Trải nghiệm người dùng được sắp xếp hợp lý: Là một phần của hệ sinh thái Ultralytics, YOLO11 duy trì cam kết về tính dễ sử dụng với Python API đơn giản, CLI mạnh mẽ và tài liệu mở rộng.
Điểm yếu
- Nhu cầu tính toán cho các mô hình lớn: Mặc dù rất hiệu quả, các mô hình YOLO11 lớn nhất (ví dụ: YOLO11x) vẫn đòi hỏi tài nguyên tính toán đáng kể để đạt được độ chính xác tối đa.
- Tích Hợp Đang Phát Triển: Là một mô hình mới hơn, hệ sinh thái các công cụ và tích hợp của bên thứ ba đang phát triển nhanh chóng nhưng có thể chưa rộng lớn như YOLOv5 đã được thiết lập từ lâu.
Các trường hợp sử dụng lý tưởng
YOLO11 là lựa chọn lý tưởng cho các dự án mới đòi hỏi mức độ chính xác và tính linh hoạt cao nhất:
- Robot học nâng cao: Cho phép tương tác và điều hướng đối tượng chính xác trong môi trường phức tạp, năng động.
- Chăm sóc sức khỏe và Chẩn đoán hình ảnh y tế: Hỗ trợ các tác vụ như phát hiện khối u, nơi độ chính xác cao là rất quan trọng.
- Thành Phố Thông Minh: Cung cấp năng lượng cho quản lý giao thông tinh vi và hệ thống an toàn công cộng.
- Phân tích bán lẻ: Cải thiện quản lý hàng tồn kho và phân tích hành vi khách hàng với độ chính xác cao hơn.
Đối mặt hiệu năng: YOLOv5 so với YOLO11
Các số liệu hiệu năng cho thấy rõ những cải tiến đạt được với YOLO11. Nhìn chung, các mô hình YOLO11 mang lại sự tăng cường đáng kể về mAP trong khi vẫn duy trì hoặc thậm chí cải thiện tốc độ suy luận. Ví dụ: YOLO11s đạt mAP là 47.0, tương đương với YOLOv5l, nhưng với số lượng tham số ít hơn nhiều và tốc độ suy luận CPU nhanh hơn đáng kể. Tương tự, YOLO11m vượt trội hơn YOLOv5x về độ chính xác (51.5 so với 50.7 mAP) đồng thời nhanh hơn hơn 4 lần trên CPU.
Mô hình | Kích thước (pixels) |
mAPval 50-95 |
Tốc độ CPU ONNX (ms) |
Tốc độ T4 TensorRT10 (ms) |
Tham số (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Kết luận: Bạn nên chọn mô hình nào?
Trong khi YOLOv5 vẫn là một mô hình vững chắc và đáng tin cậy, YOLO11 là phiên bản kế nhiệm rõ ràng và là lựa chọn được khuyến nghị cho hầu hết các dự án mới. Nó mang lại một bước nhảy vọt đáng kể về hiệu suất, cung cấp độ chính xác cao hơn, tính linh hoạt tác vụ lớn hơn và hiệu quả được cải thiện mà không làm mất đi tính dễ sử dụng đã làm cho các phiên bản tiền nhiệm của nó trở nên phổ biến.
-
Chọn YOLOv5 nếu bạn đang làm việc trên một dự án kế thừa đã sử dụng nó hoặc nếu ràng buộc chính của bạn là triển khai trên phần cứng mà các tối ưu hóa tốc độ GPU cụ thể của nó mang lại lợi thế quan trọng.
-
Chọn YOLO11 cho bất kỳ ứng dụng mới nào. Độ chính xác vượt trội, thiết kế không neo, khả năng đa nhiệm và hiệu suất tuyệt vời trên cả CPU và GPU làm cho nó trở thành giải pháp mạnh mẽ hơn, linh hoạt hơn và có khả năng thích ứng với tương lai.
Cả hai mô hình đều được hỗ trợ bởi hệ sinh thái Ultralytics mạnh mẽ, đảm bảo trải nghiệm phát triển suôn sẻ với sự hỗ trợ và tài liệu tuyệt vời.
Khám Phá Các So Sánh Mô Hình Khác
Nếu bạn quan tâm đến việc so sánh hiệu quả của các mô hình này so với các kiến trúc hàng đầu khác, hãy xem các trang so sánh khác của chúng tôi:
- So sánh YOLO11 và YOLOv8
- YOLOv8 so sánh với YOLOv5
- So sánh YOLO11 và YOLOv10
- YOLOv5 so sánh với YOLOv7
- RT-DETR so với YOLOv5