Bỏ qua nội dung

YOLOv6-3.0 so với DAMO- YOLO : So sánh kỹ thuật để phát hiện đối tượng

Việc lựa chọn mô hình phát hiện đối tượng tối ưu là một quyết định quan trọng trong các dự án thị giác máy tính. Trang này cung cấp so sánh kỹ thuật chi tiết giữa YOLOv6-3.0DAMO- YOLO , hai mô hình nổi bật được công nhận về hiệu quả và độ chính xác trong các tác vụ phát hiện đối tượng. Chúng tôi sẽ khám phá các sắc thái kiến trúc, chuẩn hiệu suất và tính phù hợp của chúng đối với các ứng dụng khác nhau để hướng dẫn lựa chọn của bạn.

Tổng quan về YOLOv6-3.0

YOLOv6-3.0 của Meituan tập trung vào các ứng dụng công nghiệp, cân bằng giữa hiệu suất cao và độ chính xác. Phiên bản 3.0 của YOLOv6, được trình bày chi tiết trong một bài báo phát hành vào ngày 2023-01-13 ( YOLOv6 v3.0: A Full-Scale Reloading ), tinh chỉnh kiến trúc của nó để tăng cường hiệu suất và độ bền. Nó được thiết kế để nhận biết phần cứng, đảm bảo hoạt động hiệu quả trên nhiều nền tảng khác nhau.

Kiến trúc và các tính năng chính

YOLOv6-3.0, tác giả Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu và Xiangxiang Chu từ Meituan, nhấn mạnh kiến trúc hợp lý để đạt được tốc độ và hiệu quả. Các tính năng chính bao gồm:

  • Nền tảng tham số hóa hiệu quả : Cho phép suy luận nhanh hơn.
  • Khối lai : Đạt được sự cân bằng giữa độ chính xác và hiệu quả tính toán.
  • Chiến lược đào tạo được tối ưu hóa : Cải thiện sự hội tụ của mô hình và hiệu suất tổng thể.

Hiệu suất và các trường hợp sử dụng

YOLOv6-3.0 đặc biệt phù hợp với các tình huống công nghiệp đòi hỏi sự kết hợp giữa tốc độ và độ chính xác. Thiết kế tối ưu của nó giúp nó hiệu quả cho:

  • Tự động hóa công nghiệp : Kiểm soát chất lượng và giám sát quy trình trong sản xuất .
  • Bán lẻ thông minh : Quản lý hàng tồn kho và hệ thống thanh toán tự động.
  • Triển khai Edge : Ứng dụng trên các thiết bị có tài nguyên hạn chế như camera thông minh.

Điểm mạnh:

  • Tập trung vào công nghiệp: Phù hợp với những thách thức triển khai công nghiệp thực tế.
  • Hiệu suất cân bằng: Mang lại sự cân bằng mạnh mẽ giữa tốc độ và độ chính xác.
  • Tối ưu hóa phần cứng: Hiệu suất hiệu quả trên nhiều nền tảng phần cứng khác nhau.

Điểm yếu:

  • Đánh đổi về độ chính xác: Có thể ưu tiên tốc độ và hiệu quả hơn là đạt được độ chính xác cao nhất so với một số mô hình chuyên dụng.
  • Quy mô cộng đồng: Cộng đồng có thể nhỏ hơn và ít tài nguyên hơn so với các mô hình được áp dụng rộng rãi hơn như YOLOv8 .

Tìm hiểu thêm về YOLOv6

DAMO- YOLO Tổng quan

DAMO- YOLO , do Alibaba Group phát triển và được trình bày chi tiết trong một bài báo ngày 23-11-2022 ( DAMO- YOLO : Suy nghĩ lại về hồi quy hộp giới hạn với sự tiến hóa tách rời ), được thiết kế để có hiệu suất cao, tập trung vào cả hiệu quả và khả năng mở rộng. Được tạo ra bởi Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang và Xiuyu Sun, DAMO- YOLO sử dụng cấu trúc đầu tách rời để tách biệt các tác vụ phân loại và hồi quy, giúp tăng tốc độ.

Kiến trúc và các tính năng chính

DAMO- YOLO được thiết kế để có khả năng mở rộng và độ chính xác cao. Các khía cạnh kiến trúc chính của nó bao gồm:

  • Cấu trúc đầu tách rời : Tách biệt phân loại và hồi quy để cải thiện tốc độ.
  • Backbone dựa trên NAS : Sử dụng Tìm kiếm kiến trúc nơ-ron để tối ưu hóa hiệu suất.
  • Gán nhãn AlignedOTA : Tinh chỉnh quy trình đào tạo để có độ chính xác cao hơn.

Hiệu suất và các trường hợp sử dụng

DAMO- YOLO lý tưởng cho các ứng dụng đòi hỏi độ chính xác cao và thích ứng với các hạn chế về tài nguyên khác nhau do kích thước mô hình có thể mở rộng của nó. Nó vượt trội ở:

  • Các tình huống có độ chính xác cao : Lái xe tự động và hệ thống an ninh tiên tiến.
  • Môi trường hạn chế về tài nguyên : Có thể triển khai trên các thiết bị biên do có nhiều biến thể mô hình nhỏ hơn.
  • Kiểm tra công nghiệp : Kiểm soát chất lượng trong đó độ chính xác là tối quan trọng.

Điểm mạnh:

  • Độ chính xác cao: Đạt được điểm mAP ấn tượng để phát hiện chính xác.
  • Khả năng mở rộng: Cung cấp nhiều kích thước mô hình khác nhau để phù hợp với các nhu cầu tính toán khác nhau.
  • Suy luận hiệu quả: Được tối ưu hóa để suy luận nhanh, phù hợp với các tác vụ thời gian thực.

Điểm yếu:

  • Độ phức tạp: Đầu tách rời và các kỹ thuật tiên tiến có thể làm cho kiến trúc trở nên phức tạp hơn.
  • Tài liệu trong Ultralytics : Là một tổ chức phi lợi nhuận Ultralytics mô hình, tài liệu trực tiếp trong Ultralytics hệ sinh thái có hạn.

Tìm hiểu thêm về DAMO- YOLO

Bảng so sánh mô hình

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0 giây 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLO 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

Lưu ý : Điểm chuẩn tốc độ có thể thay đổi tùy theo phần cứng, cấu hình phần mềm và các kỹ thuật tối ưu hóa cụ thể được sử dụng. CPU ONNX tốc độ không có trong bảng này.

Phần kết luận

Cả YOLOv6-3.0 và DAMO- YOLO là các mô hình phát hiện đối tượng mạnh mẽ, mỗi mô hình đều có những lợi thế riêng. YOLOv6-3.0 vượt trội trong các ứng dụng công nghiệp đòi hỏi sự cân bằng giữa tốc độ và hiệu suất hiệu quả trên các phần cứng khác nhau. DAMO- YOLO được thiết kế riêng cho các tình huống ưu tiên độ chính xác cao và khả năng mở rộng, đáp ứng nhiều tài nguyên tính toán khác nhau.

Đối với người dùng trong Ultralytics hệ sinh thái, các mô hình như Ultralytics YOLOv8YOLO11 tiên tiến cung cấp hiệu suất tiên tiến với tài liệu toàn diện và hỗ trợ cộng đồng. Hãy cân nhắc khám phá YOLO -NASRT-DETR để có các phương pháp tiếp cận kiến trúc thay thế cho việc phát hiện đối tượng, như được nêu chi tiết trong Tài liệu Ultralytics YOLO của chúng tôi.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận