Chuyển đến nội dung

YOLO11 so với YOLOv5: Sự phát triển kỹ thuật trong phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, cân bằng giữa nhu cầu về độ chính xác, tốc độ và tính dễ triển khai. Trang này cung cấp so sánh kỹ thuật toàn diện giữa hai mô hình mang tính bước ngoặt từ Ultralytics: Ultralytics YOLO11 hiện đại và Ultralytics YOLOv5 được áp dụng rộng rãi. Trong khi YOLOv5 đặt ra một tiêu chuẩn ngành về hiệu suất và khả năng sử dụng, YOLO11 đại diện cho bước tiến hóa tiếp theo, mang lại độ chính xác vượt trội, tính linh hoạt nâng cao và những cải tiến kiến trúc mới nhất, tất cả đều nằm trong hệ sinh thái Ultralytics mạnh mẽ và thân thiện với người dùng.

Ultralytics YOLO11: Tiêu chuẩn Mới Nhất

YOLO11, được tạo ra bởi Glenn Jocher và Jing Qiu, là mô hình mới nhất và tiên tiến nhất trong series Ultralytics YOLO. Được phát hành vào năm 2024, nó xây dựng dựa trên nền tảng vững chắc của các phiên bản tiền nhiệm như YOLOv8 để thiết lập một chuẩn mực mới về hiệu suất và hiệu quả. Nó được thiết kế không chỉ để phát hiện đối tượng mà còn là một framework toàn diện cho vô số các tác vụ thị giác máy tính.

Kiến trúc và các tính năng chính

YOLO11 giới thiệu những cải tiến kiến trúc đáng kể, bao gồm một detection head không neo và cấu trúc mạng được tối ưu hóa. Lựa chọn thiết kế hiện đại này đơn giản hóa quy trình huấn luyện bằng cách loại bỏ nhu cầu xác định trước các hộp neo, dẫn đến khả năng tổng quát hóa tốt hơn trên các bộ dữ liệu khác nhau. Mô hình đạt được độ chính xác trung bình (mAP) cao hơn YOLOv5 với ít tham số và yêu cầu tính toán (FLOP) hơn trong nhiều trường hợp, thể hiện hiệu quả vượt trội.

Một tính năng nổi bật của YOLO11 là tính linh hoạt. Đây là một framework (khung) thống nhất, hỗ trợ nguyên bản object detection (phát hiện đối tượng), instance segmentation (phân đoạn thể hiện), image classification (phân loại ảnh), pose estimation (ước tính tư thế)oriented bounding boxes (OBB) (khung giới hạn xoay). Khả năng đa nhiệm này làm cho nó trở thành một công cụ vô cùng mạnh mẽ và linh hoạt cho các hệ thống AI phức tạp.

Điểm mạnh

  • Độ chính xác vượt trội: Cung cấp điểm số mAP cao hơn đáng kể so với YOLOv5, thiết lập một tiêu chuẩn hiệu suất mới.
  • Hiệu quả cao: Đạt được độ chính xác tốt hơn với kiến trúc hiệu quả hơn, thường đòi hỏi ít tham số và FLOPs hơn.
  • Thiết kế không mỏ neo (Anchor-Free): Đơn giản hóa quá trình huấn luyện và cải thiện hiệu suất bằng cách loại bỏ sự phụ thuộc vào cấu hình hộp mỏ neo.
  • Tính linh hoạt đa nhiệm: Một khuôn khổ duy nhất cho nhiều tác vụ thị giác, hợp lý hóa quá trình phát triển cho các ứng dụng đa diện.
  • Hệ sinh thái được duy trì tốt: Hưởng lợi từ quá trình phát triển liên tục, tài liệu mở rộng, sự hỗ trợ mạnh mẽ từ cộng đồng và tích hợp liền mạch với các công cụ như Ultralytics HUB cho MLOps.
  • Hiệu quả huấn luyện: Cung cấp quy trình huấn luyện hiệu quả với các trọng số đã được huấn luyện trước có sẵn và thường yêu cầu mức sử dụng bộ nhớ thấp hơn so với các kiến trúc phức tạp hơn như transformer.

Điểm yếu

  • Là một mô hình tiên tiến, các biến thể lớn hơn của YOLO11 có thể đòi hỏi tính toán chuyên sâu, yêu cầu phần cứng GPU hiện đại để có hiệu suất tối ưu.

Các trường hợp sử dụng lý tưởng

YOLO11 là lựa chọn lý tưởng cho các dự án mới đòi hỏi độ chính xác và tính linh hoạt cao nhất:

  • Robotics tiên tiến: Dành cho tương tác và điều hướng đối tượng chính xác trong môi trường động.
  • Tự động hóa công nghiệp: Kiểm soát chất lượng và phát hiện lỗi với độ chính xác cao.
  • Chăm sóc sức khỏe: Hỗ trợ trong phân tích hình ảnh y tế cho các tác vụ như phát hiện khối u.
  • Thành Phố Thông Minh: Cung cấp năng lượng cho các hệ thống phức tạp để quản lý giao thông và an toàn công cộng.

Tìm hiểu thêm về YOLO11

YOLOv5: Nền tảng làm việc Đa năng và đã được Thiết lập

Được Glenn Jocher phát hành vào năm 2020 tại Ultralytics, YOLOv5 nhanh chóng trở thành một trong những mô hình phát hiện đối tượng phổ biến nhất trên thế giới. Nó được đánh giá cao nhờ sự cân bằng vượt trội giữa tốc độ và độ chính xác, tính dễ sử dụng và việc triển khai mạnh mẽ, được ghi chép đầy đủ trong PyTorch.

Kiến trúc và các tính năng chính

YOLOv5 sử dụng kiến trúc dựa trên backbone CSPDarknet53 và neck PANet để tổng hợp đặc trưng hiệu quả. Detection head của nó dựa trên anchor, đây là một phương pháp tiêu chuẩn và hiệu quả tại thời điểm phát hành. Một trong những thế mạnh lớn nhất của YOLOv5 là khả năng mở rộng, cung cấp một loạt các mô hình từ phiên bản 'n' (nano) nhỏ nhất đến phiên bản 'x' (extra-large) lớn nhất, cho phép các nhà phát triển dễ dàng đánh đổi giữa tốc độ và độ chính xác.

Điểm mạnh

  • Tốc độ suy luận vượt trội: Được tối ưu hóa cao cho hiệu suất thời gian thực, khiến nó trở thành lựa chọn hàng đầu cho các ứng dụng trên thiết bị biên như NVIDIA Jetson.
  • Dễ sử dụng: Nổi tiếng với API đơn giản, hướng dẫn chi tiết và quy trình làm việc hợp lý để huấn luyện và triển khai.
  • Hệ sinh thái trưởng thành: Được hỗ trợ bởi một cộng đồng lớn, nhiều năm phát triển tích cực và vô số triển khai thực tế, đảm bảo tính ổn định và độ tin cậy.
  • Tính linh hoạt: Phạm vi kích thước mô hình rộng giúp nó có thể thích ứng với hầu hết mọi ràng buộc về phần cứng.

Điểm yếu

  • Độ chính xác thấp hơn: Mặc dù vẫn mạnh mẽ, nhưng độ chính xác của nó đã bị vượt qua bởi các mô hình mới hơn như YOLO11.
  • Phát hiện dựa trên Anchor: Dựa vào các hộp anchor được xác định trước, đôi khi có thể yêu cầu điều chỉnh thủ công để có hiệu suất tối ưu trên các bộ dữ liệu tùy chỉnh so với các bộ dò tìm không cần anchor hiện đại.

Các trường hợp sử dụng lý tưởng

YOLOv5 vẫn là một lựa chọn tuyệt vời cho các tình huống cụ thể:

  • Điện toán biên: Triển khai trên các thiết bị hạn chế về tài nguyên như Raspberry Pi, nơi tốc độ suy luận là ưu tiên hàng đầu.
  • Tạo mẫu Nhanh chóng: Sự đơn giản và tốc độ của nó làm cho nó trở nên hoàn hảo để xây dựng và thử nghiệm nhanh chóng các ứng dụng chứng minh khái niệm.
  • Hệ thống cũ: Duy trì hoặc cập nhật các dự án hiện có được xây dựng trên nền tảng YOLOv5.
  • Giám sát thời gian thực: Cung cấp năng lượng cho các hệ thống an ninh nơi FPS cao là rất quan trọng.

Tìm hiểu thêm về YOLOv5

Hiệu năng và điểm chuẩn: YOLO11 so với YOLOv5

Các số liệu hiệu năng cho thấy rõ sự phát triển từ YOLOv5 lên YOLO11. Trên tập dữ liệu COCO, các mô hình YOLO11 liên tục đạt được điểm mAP cao hơn so với các mô hình YOLOv5 có kích thước tương đương. Ví dụ: YOLO11m đạt 51.5 mAP, vượt trội đáng kể so với 45.4 mAP của YOLOv5m. Hơn nữa, YOLO11 thường đạt được điều này với hiệu quả tính toán cao hơn. Đáng chú ý, mô hình nhỏ nhất, YOLO11n, chạy nhanh hơn trên CPU so với YOLOv5n đồng thời mang lại mức tăng lớn 11.5 điểm về mAP.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Kết luận: Bạn nên chọn mô hình nào?

Việc lựa chọn giữa YOLO11 và YOLOv5 phụ thuộc vào nhu cầu cụ thể của dự án.

YOLOv5 là một mô hình đã được chứng minh, đáng tin cậy và cực kỳ nhanh. Nó vẫn là một lựa chọn tuyệt vời cho các ứng dụng mà tốc độ là ưu tiên tuyệt đối, đặc biệt là trên phần cứng cũ hoặc có tài nguyên hạn chế. Sự hoàn thiện và hỗ trợ cộng đồng rộng lớn của nó cung cấp một nền tảng ổn định cho nhiều dự án.

Tuy nhiên, đối với gần như tất cả các dự án mới, YOLO11 là lựa chọn rõ ràng và được khuyến nghị. Nó thể hiện một bước tiến đáng kể, mang lại độ chính xác hiện đại, hiệu quả vượt trội và tính linh hoạt tuyệt vời. Kiến trúc không neo và hỗ trợ gốc cho nhiều tác vụ thị giác khiến nó trở thành một giải pháp mạnh mẽ hơn, linh hoạt hơn và đảm bảo cho tương lai. Bằng cách chọn YOLO11, các nhà phát triển đang tận dụng những tiến bộ mới nhất trong AI để xây dựng các ứng dụng thị giác máy tính có khả năng và chính xác hơn, đồng thời hưởng lợi từ hệ sinh thái Ultralytics được sắp xếp hợp lý và được duy trì tốt.

Khám Phá Các So Sánh Mô Hình Khác

Nếu bạn quan tâm đến việc so sánh hiệu quả của các mô hình này so với các kiến trúc hàng đầu khác, hãy xem các trang so sánh khác của chúng tôi:



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận