Chuyển đến nội dung

So sánh kỹ thuật chi tiết YOLOv6-3.0 và YOLOv8

Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, ảnh hưởng trực tiếp đến hiệu suất, hiệu quả và khả năng mở rộng của bất kỳ dự án thị giác máy tính nào. Trang này cung cấp so sánh kỹ thuật toàn diện giữa YOLOv6-3.0, được phát triển bởi Meituan và Ultralytics YOLOv8, mô hình hiện đại từ Ultralytics. Chúng ta sẽ đi sâu vào sự khác biệt về kiến trúc, số liệu hiệu suất và các trường hợp sử dụng lý tưởng của chúng để giúp bạn chọn framework tốt nhất cho nhu cầu của mình. Mặc dù cả hai mô hình đều mạnh mẽ, YOLOv8 nổi bật nhờ tính linh hoạt vượt trội, dễ sử dụng và hệ sinh thái mạnh mẽ, được duy trì tốt.

YOLOv6-3.0

Tác giả: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, và Xiangxiang Chu
Tổ chức: Meituan
Ngày: 13-01-2023
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Tài liệu: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0 là một khung phát hiện đối tượng được thiết kế tập trung mạnh vào các ứng dụng công nghiệp. Quá trình phát triển của nó ưu tiên việc tạo ra sự cân bằng hiệu quả giữa tốc độ suy luận và độ chính xác phát hiện, làm cho nó trở thành một lựa chọn khả thi cho các tình huống triển khai thực tế, nơi hiệu suất là rất quan trọng.

Kiến trúc và các tính năng chính

YOLOv6-3.0 giới thiệu một số cải tiến kiến trúc nhằm tăng cường hiệu quả. Nó có thiết kế mạng nhận biết phần cứng với backbone tái tham số hóa hiệu quả và neck được đơn giản hóa (Rep-PAN). Quá trình huấn luyện kết hợp tự chưng cất để cải thiện hiệu suất mà không làm tăng chi phí suy luận. Khung này cũng cung cấp các mô hình chuyên dụng như YOLOv6Lite, được tối ưu hóa cho việc triển khai trên thiết bị di động và dựa trên CPU.

Điểm mạnh

  • Tốc độ suy luận GPU cao: Các mô hình YOLOv6-3.0 thể hiện tốc độ suy luận tuyệt vời trên GPU, đặc biệt khi được tối ưu hóa với TensorRT, khiến chúng phù hợp cho các ứng dụng thời gian thực với phần cứng GPU chuyên dụng.
  • Hỗ trợ lượng tử hóa: Framework cung cấp hỗ trợ tốt và hướng dẫn cho lượng tử hóa mô hình, điều này có lợi cho việc triển khai các mô hình trên phần cứng bị hạn chế về tài nguyên.
  • Tập trung vào công nghiệp: Mô hình được thiết kế đặc biệt cho các trường hợp sử dụng trong công nghiệp, vượt trội trong các tình huống mà tốc độ là mối quan tâm hàng đầu.

Điểm yếu

  • Tính linh hoạt hạn chế: YOLOv6 chủ yếu là một trình phát hiện đối tượng. Nó thiếu sự hỗ trợ tích hợp cho các tác vụ thị giác máy tính khác như phân đoạn thể hiện, ước tính tư thế hoặc phân loại hình ảnh, là những tính năng tiêu chuẩn trong YOLOv8.
  • Sử dụng tài nguyên cao hơn: Để đạt được mức độ chính xác tương đương, các mô hình YOLOv6 thường có nhiều tham số và FLOPs hơn so với các mô hình YOLOv8, điều này có thể dẫn đến yêu cầu tính toán tăng lên.
  • Hệ sinh thái và Bảo trì: Mặc dù là mã nguồn mở, hệ sinh thái xung quanh YOLOv6 không toàn diện hoặc được duy trì tích cực như nền tảng Ultralytics. Điều này có thể dẫn đến việc cập nhật chậm hơn, ít tích hợp hơn và ít hỗ trợ từ cộng đồng hơn.

Tìm hiểu thêm về YOLOv6

Ultralytics YOLOv8

Tác giả: Glenn Jocher, Ayush Chaurasia và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
Arxiv: Không có
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 là một mô hình hiện đại, tiên tiến, được xây dựng dựa trên thành công của các phiên bản YOLO trước đó. Nó được thiết kế để nhanh chóng, chính xác và dễ sử dụng, cung cấp một nền tảng toàn diện cho một loạt các tác vụ thị giác máy tính. Kiến trúc và hệ sinh thái tập trung vào nhà phát triển của nó làm cho nó trở thành lựa chọn được khuyến nghị cho hầu hết các ứng dụng.

Kiến trúc và các tính năng chính

YOLOv8 giới thiệu những cải tiến kiến trúc đáng kể, bao gồm backbone mới, detection head không neo (anchor-free) mới và hàm mất mát (loss function) mới. Điều này tạo ra một mô hình không chỉ chính xác hơn mà còn hiệu quả hơn về mặt tham số và tải tính toán. Là một detector không neo (anchor-free), YOLOv8 đơn giản hóa lớp đầu ra và cải thiện khả năng tổng quát hóa.

Điểm mạnh

  • Cân bằng hiệu suất vượt trội: YOLOv8 đạt được sự cân bằng vượt trội giữa tốc độ và độ chính xác. Như được hiển thị trong bảng bên dưới, nó thường mang lại điểm mAP cao hơn với số lượng tham số và FLOPs ít hơn so với YOLOv6, khiến nó có hiệu quả cao.
  • Tính Linh hoạt Vượt trội: YOLOv8 là một framework đa nhiệm hỗ trợ object detection (phát hiện đối tượng), instance segmentation (phân vùng thể hiện), image classification (phân loại ảnh), pose estimation (ước tính tư thế)object tracking (theo dõi đối tượng) ngay khi xuất xưởng. Tính linh hoạt này cho phép các nhà phát triển sử dụng một framework duy nhất và nhất quán cho nhiều ứng dụng.
  • Dễ sử dụng: Hệ sinh thái Ultralytics được thiết kế để mang lại trải nghiệm người dùng tối ưu. Với Python API và CLI đơn giản, tài liệu phong phú và trọng số đã được huấn luyện trước luôn sẵn sàng, việc bắt đầu với YOLOv8 trở nên vô cùng đơn giản.
  • Hệ sinh thái được duy trì tốt: YOLOv8 được hỗ trợ bởi sự phát triển tích cực từ Ultralytics, đảm bảo cập nhật thường xuyên, hỗ trợ cộng đồng mạnh mẽ thông qua GitHubDiscord, và tích hợp liền mạch với các công cụ như Ultralytics HUB để huấn luyện và triển khai không cần code.
  • Hiệu Quả Huấn Luyện: Mô hình được thiết kế cho quy trình huấn luyện hiệu quả. Nó thường yêu cầu ít bộ nhớ hơn so với các kiến trúc khác, đặc biệt là các mô hình dựa trên transformer, và được hưởng lợi từ các chiến lược tăng cường dữ liệu được tối ưu hóa.

Điểm yếu

  • Phát Hiện Vật Thể Nhỏ: Giống như hầu hết các detector một giai đoạn, YOLOv8 đôi khi có thể gặp khó khăn trong việc phát hiện các vật thể cực kỳ nhỏ hoặc dày đặc so với các detector hai giai đoạn chuyên dụng.

Tìm hiểu thêm về YOLOv8

So sánh hiệu suất

Bảng sau so sánh các số liệu hiệu suất của các mô hình YOLOv8 và YOLOv6-3.0 khác nhau trên bộ dữ liệu COCO val2017. Giá trị hoạt động tốt nhất trong mỗi cột được đánh dấu bằng chữ in đậm.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Từ dữ liệu hiệu suất, một số hiểu biết quan trọng xuất hiện:

  • Độ chính xác so với Hiệu quả: Các mô hình YOLOv8 liên tục đạt được điểm mAP tương đương hoặc tốt hơn một chút với số lượng tham số và FLOP ít hơn đáng kể. Ví dụ: YOLOv8m đạt được mAP cao hơn (50,2 so với 50,0) so với YOLOv6-3.0m trong khi sử dụng ít hơn ~26% tham số và ~8% FLOP.
  • Tốc độ CPU so với GPU: YOLOv6-3.0 cho thấy tốc độ suy luận rất cạnh tranh trên GPU NVIDIA T4 với TensorRT. Tuy nhiên, YOLOv8 thể hiện hiệu suất CPU tuyệt vời với ONNX, một lợi thế quan trọng để triển khai trên nhiều thiết bị biên và phiên bản đám mây hơn mà không cần GPU chuyên dụng.
  • Giá trị tổng thể: YOLOv8 cung cấp một gói toàn diện hơn. Hiệu quả kiến trúc của nó chuyển thành yêu cầu tài nguyên thấp hơn cho một mức độ chính xác nhất định, đây là một lợi ích lớn cho các ứng dụng thực tế.

Kết luận và Đề xuất

Trong khi YOLOv6-3.0 là một công cụ phát hiện đối tượng có khả năng với tốc độ GPU ấn tượng cho các ứng dụng công nghiệp, Ultralytics YOLOv8 là lựa chọn vượt trội cho phần lớn người dùng và dự án.

Những ưu điểm chính của YOLOv8—tính linh hoạt đa nhiệm, sự cân bằng vượt trội giữa tốc độ và độ chính xác, yêu cầu tài nguyên thấp hơn và hệ sinh thái thân thiện với người dùng—khiến nó trở thành một công cụ mạnh mẽ và linh hoạt hơn. Cho dù bạn là một nhà nghiên cứu đang thúc đẩy ranh giới của AI hay một nhà phát triển xây dựng các giải pháp thực tế, mạnh mẽ, YOLOv8 cung cấp một nền tảng toàn diện, hiệu quả và có khả năng thích ứng với tương lai hơn.

Khám phá các mô hình khác

Đối với những ai quan tâm đến việc khám phá thêm, Ultralytics cung cấp một loạt các mô hình. Bạn có thể so sánh YOLOv8 với các phiên bản tiền nhiệm như YOLOv5YOLOv7, hoặc khám phá các mô hình hiện đại mới nhất như YOLOv10YOLO11. Ngoài ra, các so sánh với các kiến trúc khác như RT-DETR có sẵn trong tài liệu Ultralytics.



📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận