Bỏ qua nội dung

YOLOv9 so với YOLOv10: So sánh kỹ thuật chi tiết

Ultralytics cam kết mở rộng ranh giới của tầm nhìn máy tính và một phần quan trọng của việc này là phát triển và tinh chỉnh YOLO mô hình. Trang này cung cấp so sánh kỹ thuật chi tiết giữa YOLOv9YOLOv10 , hai mô hình phát hiện đối tượng tiên tiến. Chúng tôi sẽ đi sâu vào các sắc thái kiến trúc, chuẩn hiệu suất và ứng dụng phù hợp của chúng để hỗ trợ bạn lựa chọn mô hình tối ưu cho các tác vụ thị giác máy tính cụ thể của mình.

YOLOv9: Thông tin Gradient có thể lập trình

YOLOv9 , được giới thiệu vào tháng 2 năm 2024 bởi Chien-Yao Wang và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Academia Sinica, Đài Loan, đại diện cho một bước tiến đáng kể trong việc phát hiện đối tượng hiệu quả. Đổi mới cốt lõi của YOLOv9 nằm ở Thông tin Gradient có thể lập trình (PGI) , được thiết kế để giải quyết tình trạng mất thông tin trong quá trình học sâu. Điều này đạt được thông qua các kỹ thuật như Mạng tổng hợp lớp hiệu quả tổng quát (GELAN) , đảm bảo rằng mô hình học chính xác những gì bạn muốn nó học.

Kiến trúc và các tính năng chính: YOLOv9 tận dụng GELAN để tăng cường trích xuất tính năng và duy trì tính toàn vẹn của thông tin trên toàn bộ mạng. Cách tiếp cận này dẫn đến một mô hình không chỉ chính xác mà còn hiệu quả về tham số, khiến nó phù hợp với các triển khai có tài nguyên tính toán hạn chế. YOLOv9 được triển khai từ bài báo "YOLOv9: Học những gì bạn muốn học bằng cách sử dụng thông tin Gradient có thể lập trình ".

Chỉ số hiệu suất: YOLOv9 chứng minh hiệu suất ấn tượng trên tập dữ liệu COCO. Ví dụ, YOLOv9c đạt được mAPval50-95 là 53,0% với 25,3M tham số và 102,1B FLOP. Kiến trúc của mô hình được thiết kế để đạt hiệu quả, cho phép đạt được độ chính xác cao với ít tham số và phép tính hơn so với các mô hình trước đó.

Điểm mạnh:

  • Độ chính xác cao: Đạt được độ chính xác tiên tiến nhất trong việc phát hiện đối tượng.
  • Hiệu quả tham số: Sử dụng các tham số và tính toán hiệu quả nhờ GELAN và PGI.
  • Phương pháp tiếp cận mới: Giới thiệu thông tin Gradient có thể lập trình để học tốt hơn.

Điểm yếu:

  • Tương đối mới: Là một mô hình mới hơn, nó có thể có cộng đồng nhỏ hơn và ít ví dụ triển khai hơn so với các mô hình đã được thiết lập trước đó.

Các trường hợp sử dụng: YOLOv9 rất phù hợp cho các ứng dụng đòi hỏi độ chính xác và hiệu quả cao, chẳng hạn như:

  • Robot tiên tiến: Phát hiện vật thể trong các hệ thống robot phức tạp.
  • Phân tích hình ảnh có độ phân giải cao: Các tình huống đòi hỏi phân tích chi tiết các hình ảnh lớn.
  • Môi trường hạn chế tài nguyên: Thiết bị biên và ứng dụng di động có sức mạnh tính toán bị hạn chế.

Tìm hiểu thêm về YOLOv9

Tác giả và tài nguyên:

YOLOv10: Thiết kế hướng đến hiệu quả toàn diện - độ chính xác

YOLOv10 , được phát hành vào tháng 5 năm 2024 bởi Ao Wang, Hui Chen, Lihao Liu, et al. từ Đại học Thanh Hoa, được thiết kế để phát hiện đối tượng đầu cuối theo thời gian thực, nhấn mạnh hiệu quả và tốc độ tối đa. YOLOv10 giới thiệu một số cải tiến phương pháp chính để nâng cao cả độ chính xác và hiệu suất, bao gồm Gán kép nhất quán cho đào tạo không có NMS và Thiết kế mô hình thúc đẩy hiệu quả-độ chính xác toàn diện .

Kiến trúc và các tính năng chính: Kiến trúc của YOLOv10 được thiết kế tỉ mỉ để giảm thiểu sự dư thừa tính toán và tối đa hóa hiệu suất. Các cải tiến hiệu quả chính bao gồm Đầu phân loại nhẹ , Giảm mẫu tách kênh không gianThiết kế khối được hướng dẫn theo thứ hạng . Độ chính xác được tăng cường thông qua Tích chập hạt nhân lớnTự chú ý một phần (PSA) . Những cải tiến này cho phép YOLOv10 đạt được tốc độ và hiệu quả tiên tiến mà không làm giảm độ chính xác. YOLOv10 được trình bày chi tiết trong bài báo " YOLOv10: Phát hiện đối tượng đầu cuối theo thời gian thực ".

Chỉ số hiệu suất: YOLOv10 thiết lập chuẩn mực mới trong phát hiện đối tượng theo thời gian thực. Ví dụ, YOLOv10-S được báo cáo là nhanh hơn 1,8 lần so với RT-DETR -R18 với AP tương đương trên tập dữ liệu COCO. YOLOv10-B cho thấy độ trễ ít hơn 46% và ít hơn 25% tham số so với YOLOv9-C trong khi vẫn duy trì mức hiệu suất tương tự. YOLOv10-N đạt được độ trễ ấn tượng chỉ 1,84ms trên T4 GPU .

Điểm mạnh:

  • Hiệu quả cực cao: Được tối ưu hóa để giảm thiểu độ trễ và chi phí tính toán.
  • Đào tạo không cần NMS: Các nhiệm vụ kép nhất quán cho phép triển khai toàn diện mà không cần loại bỏ tối đa, giúp giảm thời gian suy luận.
  • Tốc độ cao: Đạt được tốc độ suy luận nhanh hơn đáng kể so với trước đây YOLO các phiên bản và mẫu khác.
  • Độ chính xác tốt: Duy trì độ chính xác cạnh tranh trong khi vẫn ưu tiên hiệu quả.

Điểm yếu:

  • Mô hình rất mới: Là một mô hình rất mới, nó vẫn đang được phát triển tích cực và sự hỗ trợ của cộng đồng đang ngày càng tăng.

Các trường hợp sử dụng: YOLOv10 lý tưởng cho các ứng dụng đòi hỏi hiệu suất và hiệu quả theo thời gian thực là tối quan trọng:

  • Điện toán biên: Triển khai trên các thiết bị biên có tài nguyên hạn chế.
  • Phân tích video thời gian thực: Ứng dụng yêu cầu phát hiện đối tượng ngay lập tức trong luồng video.
  • Hệ thống di động và nhúng: Tích hợp vào các ứng dụng di động và hệ thống nhúng nơi tốc độ và mức tiêu thụ điện năng là rất quan trọng.

Tìm hiểu thêm về YOLOv10

Tác giả và tài nguyên:

Bảng so sánh

Người mẫu kích cỡ
(điểm ảnh)
giá trị mAP
50-95
Tốc độ
CPU ONNX
(bệnh đa xơ cứng)
Tốc độ
T4 TensorRT10
(bệnh đa xơ cứng)
tham số
(Nam)
Thất bại
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

Phần kết luận

Cả YOLOv9 và YOLOv10 đều là những tiến bộ tiên tiến trong phát hiện đối tượng, mỗi loại đều có thế mạnh riêng. YOLOv9 vượt trội về độ chính xác và hiệu quả tham số thông qua Programmable Gradient Information, khiến nó phù hợp với phân tích phức tạp và chi tiết. Mặt khác, YOLOv10 ưu tiên tốc độ và hiệu suất thời gian thực với thiết kế toàn diện hướng đến hiệu quả-độ chính xác và đào tạo không cần NMS, khiến nó trở nên lý tưởng cho các ứng dụng biên và thời gian thực.

Đối với người dùng tìm kiếm sự cân bằng giữa độ trưởng thành và tính linh hoạt, Ultralytics YOLOv8 vẫn là một lựa chọn mạnh mẽ. Đối với những người quan tâm đến những tiến bộ mới nhất và độ chính xác cao nhất, Ultralytics YOLO11 cũng là một lựa chọn hấp dẫn, dựa trên thế mạnh của các sản phẩm trước đó YOLO lặp lại. Cuối cùng, mô hình tốt nhất phụ thuộc vào các yêu cầu cụ thể của dự án, cân bằng giữa độ chính xác, tốc độ và hạn chế về tài nguyên.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận