Bỏ qua nội dung

YOLOv9 so với YOLOv5 : So sánh chi tiết

Trang này cung cấp một so sánh kỹ thuật giữa YOLOv9 và YOLOv5 , hai mô hình phổ biến trong YOLO loạt, tập trung vào khả năng phát hiện đối tượng của chúng. Chúng tôi đi sâu vào sự khác biệt về kiến trúc, số liệu hiệu suất, phương pháp đào tạo và các trường hợp sử dụng phù hợp để giúp bạn chọn đúng mô hình cho các tác vụ thị giác máy tính của mình.

YOLOv9: Thông tin Gradient có thể lập trình

YOLOv9, được giới thiệu vào tháng 2 năm 2024 bởi Chien-Yao Wang và Hong-Yuan Mark Liao từ Viện Khoa học Thông tin, Academia Sinica, Đài Loan, đại diện cho một bước tiến đáng kể trong việc phát hiện đối tượng theo thời gian thực. Mô hình được trình bày chi tiết trong bài báo " YOLOv9: Học những gì bạn muốn học bằng cách sử dụng thông tin Gradient có thể lập trình " và mã có sẵn trên GitHub .

Kiến trúc và Đổi mới: YOLOv9 giới thiệu hai đổi mới chính: Programmable Gradient Information (PGI) và Generalized Efficient Layer Aggregation Network (GELAN). PGI giải quyết tình trạng mất thông tin trong các mạng sâu, cho phép mô hình học hiệu quả hơn, trong khi GELAN tối ưu hóa kiến trúc mạng để cải thiện việc sử dụng tham số và hiệu quả tính toán. Sự kết hợp này dẫn đến độ chính xác được nâng cao mà không làm tăng chi phí tính toán theo tỷ lệ.

Hiệu suất: YOLOv9 đạt được hiệu suất tiên tiến nhất trên tập dữ liệu MS COCO, chứng minh độ chính xác và hiệu quả vượt trội so với trước đây YOLO phiên bản và các trình phát hiện đối tượng thời gian thực khác. Ví dụ, YOLOv9c đạt được 53,0 mAP val 50-95 với 25,3M tham số.

Các trường hợp sử dụng: YOLOv9 lý tưởng cho các ứng dụng đòi hỏi độ chính xác và hiệu quả cao, chẳng hạn như:

  • Phát hiện vật thể có độ chính xác cao: Các tình huống đòi hỏi độ chính xác cao, như lái xe tự động, giám sát tiên tiến và tầm nhìn của robot.
  • Môi trường hạn chế về tài nguyên: Trong khi đào tạo đòi hỏi nhiều tài nguyên hơn YOLOv5 , kiến trúc hiệu quả cho phép triển khai trên các thiết bị biên với tốc độ suy luận được tối ưu hóa.

Điểm mạnh:

  • Độ chính xác cao: Đạt được điểm mAP cao, đặc biệt là ở các mẫu như YOLOv9e.
  • Thiết kế hiệu quả: GELAN và PGI góp phần nâng cao hiệu quả tính toán và tham số so với các mô hình trước đây có độ chính xác tương tự.

Điểm yếu:

  • Nhu cầu về nguồn lực đào tạo cao hơn: Đào tạo các mô hình YOLOv9 đòi hỏi nhiều nguồn lực tính toán và thời gian hơn so với YOLOv5 .
  • Mô hình tương đối mới hơn: Là một mô hình mới hơn, cộng đồng và tài liệu vẫn đang phát triển so với các mô hình đã được thiết lập trước đó YOLOv5 .

Tìm hiểu thêm về YOLOv9

YOLOv5 : Tính linh hoạt và tốc độ

Ultralytics YOLOv5 , do Glenn Jocher biên soạn và phát hành vào tháng 6 năm 2020, nổi tiếng vì tốc độ, tính dễ sử dụng và tính linh hoạt. Mặc dù không có bài báo arXiv cụ thể, thông tin chi tiết có sẵn trong tài liệu Ultralytics YOLOv5kho lưu trữ GitHub .

Kiến trúc và tính năng: YOLOv5 được xây dựng tập trung vào tốc độ và khả năng truy cập, sử dụng các kiến trúc như CSP Bottleneck và PANet. Nó cung cấp nhiều kích thước mô hình (YOLOv5n, s, m, l, x) để đáp ứng các ngân sách tính toán và nhu cầu hiệu suất khác nhau. YOLOv5 được thực hiện trong PyTorch , giúp nó thân thiện với người dùng và có khả năng thích ứng cao.

Hiệu suất: YOLOv5 cung cấp sự cân bằng giữa tốc độ và độ chính xác, làm cho nó phù hợp với nhiều ứng dụng thực tế. YOLOv5s, một biến thể nhỏ, đạt được 37,4 mAP val 50-95 với tốc độ suy luận nhanh.

Các trường hợp sử dụng: YOLOv5 có tính linh hoạt đặc biệt và phù hợp với những tình huống mà tốc độ và khả năng triển khai dễ dàng là rất quan trọng:

  • Ứng dụng thời gian thực: Lý tưởng cho các ứng dụng yêu cầu suy luận nhanh, chẳng hạn như xử lý video trực tiếp, robot và tầm nhìn máy bay không người lái.
  • Triển khai biên: Các mô hình nhỏ hơn (YOLOv5n, YOLOv5s) phù hợp để triển khai trên các thiết bị biên và nền tảng di động do nhu cầu tính toán thấp hơn.
  • Tạo mẫu và phát triển nhanh: Dễ sử dụng và có tài liệu hướng dẫn chi tiết làm cho YOLOv5 tuyệt vời cho các chu kỳ phát triển nhanh và mục đích giáo dục.

Điểm mạnh:

  • Tốc độ cao: Cung cấp tốc độ suy luận nhanh, đặc biệt là với các biến thể mô hình nhỏ hơn.
  • Dễ sử dụng: Được ghi chép đầy đủ với cộng đồng lớn và năng động, giúp dễ sử dụng và triển khai.
  • Tính linh hoạt: Có nhiều kích cỡ khác nhau và có thể thích ứng với nhiều nhiệm vụ khác nhau bao gồm phát hiện, phân đoạn và phân loại.

Điểm yếu:

  • Độ chính xác thấp hơn so với YOLOv9: Nhìn chung, YOLOv5 các mô hình không đạt được mức độ chính xác tương tự như YOLOv9 mới nhất, đặc biệt là trong các tình huống đòi hỏi khắt khe.
  • Kiến trúc kém sáng tạo hơn YOLOv9: Mặc dù hiệu quả, nhưng kiến trúc của nó không kết hợp các cải tiến mới của PGI và GELAN có trong YOLOv9.

Tìm hiểu thêm về YOLOv5


Người mẫu kích thước (pixel) mAP giá trị 50-95 Tốc độ CPU ONNX (ms) Tốc độ T4 TensorRT10 (ms) tham số (M) FLOP (B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Phần kết luận

Lựa chọn giữa YOLOv9 và YOLOv5 phụ thuộc vào các ưu tiên của dự án của bạn. Nếu độ chính xác là tối quan trọng và có sẵn các nguồn lực để đào tạo, YOLOv9 là lựa chọn tốt hơn. Đối với các ứng dụng ưu tiên tốc độ, dễ sử dụng và tính linh hoạt khi triển khai, đặc biệt là trên các thiết bị biên, YOLOv5 vẫn là lựa chọn tuyệt vời và được áp dụng rộng rãi.

Đối với người dùng quan tâm đến việc khám phá các mô hình khác, Ultralytics cũng cung cấp YOLOv8 , YOLOv7, YOLOv6 và phiên bản mới phát hành YOLO11 , mỗi loại đều có điểm mạnh và khả năng tối ưu hóa riêng. Khám phá tài liệu Ultralytics Models để khám phá đầy đủ các tùy chọn.

📅 Được tạo ra cách đây 1 năm ✏️ Đã cập nhật cách đây 1 tháng

Bình luận