Chuyển đến nội dung

YOLO11 so với YOLOv8: So sánh Chi tiết

Khi lựa chọn một mô hình thị giác máy tính, đặc biệt là cho phát hiện đối tượng, việc hiểu rõ điểm mạnh và điểm yếu của các kiến trúc khác nhau là điều cần thiết. Trang này cung cấp một so sánh kỹ thuật chi tiết giữa Ultralytics YOLO11Ultralytics YOLOv8, hai mô hình hiện đại được thiết kế để phát hiện đối tượng và các tác vụ thị giác khác. Chúng ta sẽ phân tích các sắc thái kiến trúc, điểm chuẩn hiệu suất và các ứng dụng phù hợp của chúng để hướng dẫn bạn đưa ra quyết định sáng suốt cho dự án AI tiếp theo của mình.

Ultralytics YOLO11

Tác giả: Glenn Jocher, Jing Qiu
Tổ chức: Ultralytics
Ngày: 27-09-2024
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 đại diện cho sự phát triển mới nhất trong dòng YOLO, được thiết kế để tăng cường độ chính xác và hiệu quả. Dựa trên nền tảng vững chắc của các mô hình YOLO trước đây, YOLO11 giới thiệu các cải tiến về kiến trúc nhằm nâng cao độ chính xác phát hiện đồng thời duy trì hiệu suất thời gian thực vượt trội. Đây là một mô hình rất linh hoạt, hỗ trợ nhiều tác vụ khác nhau bao gồm phân đoạn thể hiện, phân loại hình ảnh, ước tính tư thế và hộp giới hạn theo hướng (OBB).

Kiến trúc và các tính năng chính

YOLO11 kết hợp những tiến bộ trong cấu trúc mạng để tối ưu hóa quá trình trích xuất và xử lý đặc trưng. Nó đạt được độ chính xác cao hơn với ít tham số và FLOP hơn so với các phiên bản tiền nhiệm như YOLOv8, như được hiển thị trong bảng hiệu suất bên dưới. Hiệu quả này chuyển thành tốc độ suy luận nhanh hơn và giảm nhu cầu tính toán, giúp nó phù hợp để triển khai trên các nền tảng khác nhau, từ thiết bị biên đến cơ sở hạ tầng đám mây mạnh mẽ. Một ưu điểm chính của YOLO11 là khả năng tích hợp liền mạch vào hệ sinh thái Ultralytics được duy trì tốt, cung cấp các quy trình huấn luyện hiệu quả, trọng số được huấn luyện trước có sẵn và mức sử dụng bộ nhớ thấp hơn so với nhiều loại mô hình khác.

Điểm mạnh

  • Độ chính xác vượt trội: Đạt được điểm mAP vượt trội, liên tục vượt trội YOLOv8 ở các kích thước mô hình tương tự.
  • Suy luận hiệu quả cao: Cung cấp tốc độ xử lý nhanh hơn đáng kể, đặc biệt là trên CPU, điều này rất quan trọng đối với các ứng dụng thời gian thực trong môi trường hạn chế về tài nguyên.
  • Tính linh hoạt đa nhiệm: Một khuôn khổ thống nhất duy nhất hỗ trợ nhiều tác vụ thị giác máy tính, đơn giản hóa quy trình làm việc phát triển.
  • Được tối ưu hóa và có khả năng mở rộng: Hoạt động tốt trên các phần cứng khác nhau với mức sử dụng bộ nhớ hiệu quả và dấu chân tính toán nhỏ hơn.
  • Dễ sử dụng: Hưởng lợi từ Ultralytics API được tinh giản, tài liệu đầy đủ và hỗ trợ cộng đồng tích cực trên GitHubDiscord.

Điểm yếu

  • Là một mô hình mới hơn, ban đầu nó có thể có ít tích hợp của bên thứ ba hơn so với YOLOv8 đã được thiết lập.
  • Các mô hình lớn nhất (ví dụ: YOLO11x) vẫn đòi hỏi tài nguyên tính toán đáng kể, một đặc điểm chung của các trình dò tìm có độ chính xác cao.

Các Trường hợp Sử dụng

Sự cân bằng vượt trội giữa độ chính xác và hiệu quả của YOLO11 khiến nó trở thành lựa chọn lý tưởng cho các ứng dụng đòi hỏi khả năng phát hiện đối tượng nhanh và chính xác, chẳng hạn như:

  • Robot: Cho phép điều hướng và tương tác đối tượng trong môi trường động cho các hệ thống tự động.
  • Hệ thống An ninh: Nâng cao hệ thống an ninh tiên tiến để phát hiện xâm nhập và giám sát theo thời gian thực.
  • Phân tích Bán lẻ: Cải thiện quản lý hàng tồn kho và phân tích hành vi khách hàng cho AI trong bán lẻ.
  • Tự động hóa công nghiệp: Hỗ trợ kiểm soát chất lượng và phát hiện lỗi trong sản xuất.

Tìm hiểu thêm về YOLO11

Ultralytics YOLOv8

Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 đã thiết lập một tiêu chuẩn mới cho việc phát hiện đối tượng thời gian thực khi phát hành, nhanh chóng trở thành một trong những mô hình thị giác phổ biến nhất trên thế giới. Nó giới thiệu những thay đổi kiến trúc quan trọng, chẳng hạn như đầu dò tìm không cần mỏ neo và mô-đun xương sống C2f, mang lại một bước nhảy vọt đáng kể về hiệu suất so với các phiên bản trước. Giống như YOLO11, YOLOv8 là một mô hình đa nhiệm linh hoạt đã được xác thực rộng rãi trên vô số ứng dụng thực tế.

Kiến trúc và các tính năng chính

Thiết kế của YOLOv8 tập trung vào sự cân bằng mạnh mẽ giữa tốc độ và độ chính xác. Cách tiếp cận không cần anchor giúp giảm số lượng dự đoán hộp, đơn giản hóa quy trình hậu xử lý và cải thiện tốc độ suy luận. Mô hình này có khả năng mở rộng cao, với các biến thể từ phiên bản 'n' (nano) nhẹ cho thiết bị di động và AI biên đến phiên bản 'x' (cực lớn) mạnh mẽ để có độ chính xác tối đa. YOLOv8 được tích hợp hoàn toàn vào hệ sinh thái Ultralytics, được hưởng lợi từ API đơn giản, hướng dẫn toàn diện và các công cụ như Ultralytics HUB để đào tạo và triển khai không cần code.

Điểm mạnh

  • Hiệu suất đã được chứng minh: Một mô hình có độ tin cậy cao và được áp dụng rộng rãi, mang lại kết quả tốt trên tất cả các tác vụ được hỗ trợ.
  • Sự đánh đổi tốc độ-độ chính xác tuyệt vời: Cung cấp sự cân bằng tuyệt vời, biến nó thành một lựa chọn phù hợp cho nhiều ứng dụng.
  • Hệ sinh thái trưởng thành: Hưởng lợi từ hỗ trợ cộng đồng rộng rãi, hướng dẫn và tích hợp của bên thứ ba được xây dựng kể từ khi phát hành.
  • Tính linh hoạt: Hỗ trợ cùng một loạt các tác vụ thị giác rộng rãi như YOLO11, khiến nó trở thành một giải pháp tất cả trong một mạnh mẽ.

Điểm yếu

  • Mặc dù vẫn là một người biểu diễn hàng đầu, nhưng nó thường bị YOLO11 vượt qua cả về độ chính xác và tốc độ suy luận CPU trên tất cả các kích thước mô hình.
  • Các mô hình lớn hơn có số lượng tham số và FLOP cao hơn so với các mô hình YOLO11 tương ứng, dẫn đến yêu cầu tính toán lớn hơn.

Các Trường hợp Sử dụng

YOLOv8 vẫn là một mô hình đáng gờm và có tính ứng dụng cao, vượt trội trong các ứng dụng mà nó đã được triển khai và thử nghiệm rộng rãi:

Tìm hiểu thêm về YOLOv8

So sánh hiệu năng trực tiếp: YOLO11 so với YOLOv8

Sự khác biệt chính giữa YOLO11 và YOLOv8 nằm ở các chỉ số hiệu suất. YOLO11 liên tục mang lại độ chính xác cao hơn (mAP) với kiến trúc hiệu quả hơn, dẫn đến ít tham số và FLOPs hơn. Tối ưu hóa kiến trúc này đặc biệt rõ ràng ở tốc độ suy luận trên CPU, trong đó các mô hình YOLO11 nhanh hơn đáng kể so với các mô hình YOLOv8 tương đương. Mặc dù YOLOv8n có lợi thế hơn một chút về độ trễ GPU, nhưng các mô hình YOLO11 từ 's' đến 'x' cũng nhanh hơn trên GPU, khiến YOLO11 trở thành lựa chọn vượt trội cho hầu hết các dự án mới.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Sự phát triển kiến trúc và hệ sinh thái

YOLO11 là một sự phát triển trực tiếp của YOLOv8, xây dựng dựa trên các nguyên tắc thiết kế thành công của nó đồng thời giới thiệu các tối ưu hóa có mục tiêu. Cả hai mô hình đều có chung triết lý cốt lõi là nhanh, chính xác và dễ sử dụng. Chúng được phát triển và duy trì trong kho lưu trữ Ultralytics thống nhất, đảm bảo trải nghiệm người dùng nhất quán và được sắp xếp hợp lý.

Hệ sinh thái dựng chung này là một lợi thế lớn cho các nhà phát triển. Việc chuyển một dự án từ YOLOv8 sang YOLO11 rất đơn giản, cho phép các nhóm tận dụng hiệu suất của mô hình mới với số lượng thay đổi mã tối thiểu. Hệ sinh thái cung cấp:

  • API đơn giản và nhất quán để huấn luyện, xác thựcdự đoán.
  • Tài liệu phong phú với nhiều hướng dẫn và ví dụ.
  • Efficient training workflows với các trọng số được huấn luyện trước có sẵn trên các bộ dữ liệu như COCO.
  • Yêu cầu bộ nhớ thấp hơn trong quá trình huấn luyện và suy luận so với các loại mô hình khác như Transformer.
  • Một cộng đồng mã nguồn mở sôi động để hỗ trợ và cộng tác.

Kết luận: Bạn nên chọn mô hình nào?

Đối với các dự án mới hoặc những dự án đòi hỏi hiệu suất tốt nhất có thể, YOLO11 là lựa chọn rõ ràng. Nó cung cấp độ chính xác vượt trội và tốc độ suy luận nhanh hơn, đặc biệt là trên CPU, với kiến trúc hiệu quả hơn. Những tiến bộ của nó làm cho nó trở thành công nghệ hiện đại mới nhất để phát hiện đối tượng theo thời gian thực.

YOLOv8 vẫn là một mô hình tuyệt vời và có độ tin cậy cao. Đây là một lựa chọn tuyệt vời cho các dự án hiện có đã được tối ưu hóa cho kiến trúc của nó hoặc trong các tình huống mà hồ sơ theo dõi rộng rãi và số lượng lớn các tích hợp của bên thứ ba là một cân nhắc quan trọng.

Cuối cùng, cả hai mô hình đều đại diện cho đỉnh cao của việc phát hiện đối tượng theo thời gian thực và sự lựa chọn tùy thuộc vào nhu cầu dự án cụ thể của bạn. Tuy nhiên, với những ưu điểm vượt trội về hiệu suất và khả năng tích hợp liền mạch vào hệ sinh thái Ultralytics, YOLO11 sẵn sàng trở thành tiêu chuẩn mới cho các nhà phát triển và nhà nghiên cứu.

Khám phá các Mô hình Khác

Mặc dù YOLO11 và YOLOv8 là những lựa chọn hàng đầu, lĩnh vực thị giác máy tính không ngừng phát triển. Bạn cũng có thể quan tâm đến việc so sánh chúng với các mô hình mạnh mẽ khác có sẵn trong hệ sinh thái Ultralytics, chẳng hạn như YOLOv10, YOLOv9RT-DETR dựa trên transformer. Khám phá đầy đủ so sánh mô hình của chúng tôi để tìm ra sự phù hợp hoàn hảo cho dự án của bạn.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận