Bỏ qua nội dung

YOLOv10 so với YOLOv7: So sánh chi tiết

Việc lựa chọn mô hình phát hiện đối tượng phù hợp rất quan trọng đối với các dự án thị giác máy tính. Ultralytics YOLO cung cấp một loạt các mô hình được thiết kế riêng cho các nhu cầu khác nhau. Trang này cung cấp so sánh kỹ thuật giữa YOLOv10 và YOLOv7, hai lựa chọn phổ biến cho các tác vụ phát hiện đối tượng. Chúng tôi sẽ phân tích kiến trúc, số liệu hiệu suất và ứng dụng lý tưởng của chúng để giúp bạn đưa ra quyết định sáng suốt.

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

YOLOv10

YOLOv10, được giới thiệu vào tháng 5 năm 2024 bởi các nhà nghiên cứu từ Đại học Thanh Hoa, đại diện cho công nghệ tiên tiến nhất trong phát hiện đối tượng theo thời gian thực. Được nêu chi tiết trong bài báo Arxiv của họ, " YOLOv10: Phát hiện đối tượng đầu cuối theo thời gian thực ", Ao Wang, Hui Chen, Lihao Liu, et al. trình bày YOLOv10 là một tiến bộ đáng kể tập trung vào cả hiệu quả và độ chính xác. Bản triển khai chính thức có sẵn trên GitHub . YOLOv10 được thiết kế để triển khai đầu cuối, giải quyết các vấn đề trước đây YOLO sự phụ thuộc của các phiên bản vào chế độ NMS (Non-Maximum Suppression).

Kiến trúc và các tính năng chính:

YOLOv10 tự hào có một số cải tiến về kiến trúc nhằm tăng tốc độ và giảm sự dư thừa tính toán. Các tính năng chính bao gồm phương pháp tiếp cận không neo và thiết kế không NMS, hợp lý hóa hậu xử lý và tăng tốc suy luận. Mô hình áp dụng chiến lược thiết kế toàn diện thúc đẩy hiệu quả-độ chính xác, tối ưu hóa các thành phần khác nhau để giảm thiểu chi phí và tăng khả năng. Điều này tạo ra một mô hình không chỉ nhanh hơn mà còn duy trì độ chính xác cạnh tranh, khiến nó phù hợp với các thiết bị biên và ứng dụng thời gian thực.

Tiêu chuẩn và số liệu hiệu suất:

Như được thể hiện trong bảng so sánh, các mô hình YOLOv10, đặc biệt là các biến thể YOLOv10n và YOLOv10s, cung cấp tốc độ suy luận ấn tượng trên TensorRT , đạt lần lượt 1,56ms và 2,66ms. YOLOv10n đạt mAPval50-95 là 39,5 với chỉ 2,3M tham số và 6,7B FLOP, trong khi YOLOv10x đạt 54,4 mAPval50-95. Các số liệu này làm nổi bật khả năng của YOLOv10 trong việc cung cấp hiệu suất tiên tiến với các tài nguyên tính toán được tối ưu hóa. Để hiểu sâu hơn về YOLO số liệu hiệu suất, tham khảo Ultralytics tài liệu về số liệu hiệu suất YOLO .

Các trường hợp sử dụng:

Sự tập trung vào hiệu suất và hiệu quả theo thời gian thực của YOLOv10 khiến nó trở nên lý tưởng cho các ứng dụng yêu cầu phát hiện đối tượng nhanh chóng với tài nguyên tính toán hạn chế. Các trường hợp sử dụng phù hợp bao gồm:

  • Ứng dụng AI biên: Triển khai trên các thiết bị biên để xử lý thời gian thực trong các tình huống như camera thông minh và thiết bị IoT.
  • Robot: Cho phép nhận dạng vật thể nhanh hơn và hiệu quả hơn để điều hướng và tương tác trong các hệ thống robot, như đã thảo luận trong Vai trò của AI trong robot .
  • Hệ thống tự động: Ứng dụng trong xe tự hành và máy bay không người lái khi độ trễ thấp đóng vai trò quan trọng để vận hành an toàn và hiệu quả.
  • Hệ thống di động và nhúng: Phát hiện đối tượng trong các ứng dụng di động và hệ thống nhúng có sức mạnh tính toán hạn chế.

Điểm mạnh:

  • Hiệu quả cao: Thiết kế không cần NMS và kiến trúc được tối ưu hóa để suy luận nhanh hơn và giảm độ trễ.
  • Độ chính xác cạnh tranh: Duy trì độ chính xác cao trong khi cải thiện đáng kể tốc độ.
  • Triển khai toàn diện: Được thiết kế để phát hiện đối tượng theo thời gian thực, liền mạch toàn diện.
  • Kích thước mô hình nhỏ hơn: Kiến trúc hiệu quả dẫn đến kích thước mô hình nhỏ hơn và ít tham số hơn so với một số kiến trúc tiền nhiệm.

Điểm yếu:

  • Tương đối mới: Là một mô hình mới hơn, YOLOv10 có thể có cộng đồng nhỏ hơn và ít ví dụ triển khai hơn so với các mô hình đã được thiết lập lâu đời hơn như YOLOv7.
  • Điều chỉnh hiệu suất: Để đạt được hiệu suất tối ưu có thể cần phải tinh chỉnh và thử nghiệm với nhiều cấu hình và kích thước mô hình khác nhau, như được nêu chi tiết trong mẹo đào tạo mô hình .

Tìm hiểu thêm về YOLOv10

YOLOv7

YOLOv7, được giới thiệu vào tháng 7 năm 2022 bởi Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao, là một mô hình phát hiện đối tượng được đánh giá cao, nổi tiếng về hiệu quả và độ chính xác. Mô hình được trình bày chi tiết trong bài báo Arxiv, " YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors " và kho lưu trữ GitHub chính thức cung cấp thông tin chi tiết về việc triển khai. YOLOv7 xây dựng dựa trên các YOLO phiên bản, kết hợp các cải tiến về kiến trúc để tối đa hóa hiệu suất mà không làm tăng đáng kể chi phí tính toán.

Kiến trúc và các tính năng chính:

YOLOv7 kết hợp một số cải tiến về kiến trúc để nâng cao hiệu suất và hiệu quả. Các tính năng chính bao gồm:

  • Mạng tổng hợp lớp hiệu quả mở rộng (E-ELAN): Nâng cao khả năng học tập và luồng gradient của mạng.
  • Tỷ lệ mô hình cho các mô hình dựa trên nối kết: Cung cấp hướng dẫn về tỷ lệ chiều sâu và chiều rộng hiệu quả.
  • Đầu phụ và đầu dò từ thô đến tinh: Cải thiện hiệu quả đào tạo và độ chính xác phát hiện.

Các tính năng này góp phần giúp YOLOv7 đạt được kết quả tiên tiến về tốc độ và độ chính xác, trở thành lựa chọn đáng tin cậy cho nhiều nhiệm vụ phát hiện vật thể khác nhau.

Tiêu chuẩn và số liệu hiệu suất:

YOLOv7 cho thấy sự cân bằng mạnh mẽ giữa tốc độ và độ chính xác. Như thể hiện trong bảng, YOLOv7l đạt được mAPval50-95 là 51,4, trong khi YOLOv7x đạt 53,1 mAPval50-95. Mặc dù chậm hơn một chút so với YOLOv10n và YOLOv10s trong TensorRT tốc độ suy luận, các mô hình YOLOv7 vẫn cung cấp hiệu suất cạnh tranh, đặc biệt là khi xem xét các kích thước mô hình YOLOv7 lớn hơn. Để biết số liệu chi tiết, hãy tham khảo tài liệu YOLOv7 .

Các trường hợp sử dụng:

Sự cân bằng giữa độ chính xác và hiệu quả của YOLOv7 khiến nó phù hợp với các ứng dụng yêu cầu phát hiện đối tượng đáng tin cậy trong các tình huống thời gian thực. Các trường hợp sử dụng lý tưởng bao gồm:

  • Xe tự hành: Phát hiện vật thể mạnh mẽ trong môi trường lái xe phức tạp, rất quan trọng đối với AI trong xe tự lái .
  • Hệ thống giám sát tiên tiến: Độ chính xác cao để xác định các mối đe dọa an ninh tiềm ẩn trong hệ thống an ninh .
  • Robot: Nhận dạng vật thể chính xác để thao tác và điều hướng trong robot, tương tự như YOLOv10, nhưng có khả năng ưu tiên độ chính xác trong một số tình huống nhất định.
  • Tự động hóa công nghiệp: Kiểm soát chất lượng và phát hiện lỗi trong các quy trình sản xuất, nơi độ chính xác là tối quan trọng.

Điểm mạnh:

  • mAP cao: Đạt được Độ chính xác trung bình cao, cho thấy độ chính xác phát hiện đối tượng tuyệt vời.
  • Suy luận hiệu quả: Được thiết kế để suy luận nhanh, phù hợp với các ứng dụng thời gian thực.
  • Đã phát triển và trưởng thành: YOLOv7 được hưởng lợi từ cộng đồng lớn hơn và sử dụng rộng rãi, cung cấp nhiều tài nguyên và hỗ trợ hơn.
  • Kích thước mô hình dễ quản lý: Mang lại sự cân bằng tốt giữa kích thước mô hình và hiệu suất.

Điểm yếu:

  • Độ phức tạp: Kiến trúc phức tạp hơn một số mô hình đơn giản hơn, có khả năng đòi hỏi nhiều chuyên môn hơn để tinh chỉnh và tối ưu hóa.
  • Tốn nhiều tài nguyên hơn so với mô hình Nano: Mặc dù hiệu quả, nhưng mô hình này tốn nhiều tài nguyên tính toán hơn so với các mô hình nhỏ hơn như YOLOv10n, đặc biệt là trong môi trường cực kỳ hạn chế về tài nguyên.

Tìm hiểu thêm về YOLOv7

Khác YOLO Mô hình

Bên cạnh YOLOv10 và YOLOv7, Ultralytics cung cấp một loạt các YOLO mô hình, mỗi mô hình có điểm mạnh riêng. Hãy cân nhắc khám phá YOLOv8 để có tùy chọn linh hoạt và thân thiện với người dùng, YOLOv9 để có những tiến bộ trong kiến trúc mạng và YOLO11 để có hiệu suất tiên tiến mới nhất. Bạn cũng có thể so sánh YOLOv7 với các mô hình khác như YOLOv5YOLOX để hiểu được những đánh đổi cụ thể của chúng.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận