So sánh chi tiết: YOLOv5 so với YOLOv7
Việc lựa chọn mô hình phát hiện đối tượng phù hợp là một quyết định quan trọng, cân bằng giữa nhu cầu về tốc độ, độ chính xác và tính dễ triển khai. Trang này cung cấp so sánh kỹ thuật giữa Ultralytics YOLOv5 và YOLOv7, hai mô hình có ảnh hưởng lớn trong lĩnh vực thị giác máy tính. Mặc dù cả hai đều đã có những đóng góp đáng kể, Ultralytics YOLOv5 nổi bật với sự cân bằng vượt trội về hiệu suất, thiết kế thân thiện với người dùng và một hệ sinh thái toàn diện, được duy trì tốt, khiến nó trở thành lựa chọn ưu tiên cho một loạt các ứng dụng thực tế.
Ultralytics YOLOv5: Tiêu chuẩn công nghiệp đã được thiết lập
Ultralytics YOLOv5, được phát hành vào năm 2020 bởi Glenn Jocher, đã nhanh chóng trở thành một trong những mô hình phát hiện đối tượng phổ biến nhất nhờ sự kết hợp đáng chú ý giữa tốc độ, độ chính xác và tính dễ sử dụng. Được phát triển hoàn toàn bằng PyTorch, YOLOv5 được tối ưu hóa cao, mang lại trải nghiệm hợp lý từ đào tạo đến triển khai.
Tác giả: Glenn Jocher
Tổ chức: Ultralytics
Ngày: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Docs: https://docs.ultralytics.com/models/yolov5/
Kiến trúc và các tính năng chính của YOLOv5
YOLOv5 có một kiến trúc linh hoạt và hiệu quả được xây dựng trên backbone CSPDarknet53 và neck PANet để tổng hợp đặc trưng hiệu quả. Nó sử dụng một head phát hiện dựa trên anchor, đã được tinh chỉnh qua nhiều bản phát hành. Một trong những điểm mạnh chính của nó là sự đa dạng về kích thước mô hình (n, s, m, l, x), cho phép các nhà phát triển lựa chọn sự đánh đổi tối ưu giữa hiệu suất và tài nguyên tính toán. Khả năng mở rộng này làm cho nó phù hợp với mọi thứ, từ các thiết bị biên nhẹ đến các máy chủ đám mây mạnh mẽ.
Điểm mạnh của YOLOv5
- Dễ sử dụng: YOLOv5 nổi tiếng với giao diện Python và CLI đơn giản, tài liệu phong phú, cùng quy trình huấn luyện và suy luận trực quan.
- Hệ sinh thái được duy trì tốt: Được hỗ trợ bởi hệ sinh thái Ultralytics mạnh mẽ, bao gồm phát triển tích cực, một cộng đồng lớn, cập nhật thường xuyên và các công cụ mạnh mẽ như Ultralytics HUB để đào tạo và triển khai không cần code.
- Cân bằng hiệu suất: YOLOv5 đạt được sự cân bằng tuyệt vời giữa tốc độ suy luận và độ chính xác phát hiện, làm cho nó rất thiết thực cho nhiều tình huống thực tế khác nhau.
- Tính linh hoạt và hiệu quả huấn luyện: Nó hỗ trợ nhiều tác vụ thị giác, bao gồm phát hiện đối tượng, phân đoạn thể hiện và phân loại hình ảnh. Quá trình huấn luyện hiệu quả, với các trọng số được huấn luyện trước có sẵn và yêu cầu bộ nhớ thấp hơn so với các kiến trúc phức tạp hơn.
Điểm yếu của YOLOv5
- Giới hạn độ chính xác: Mặc dù có độ chính xác cao, nhưng các mô hình mới hơn đã vượt qua điểm số mAP của nó trên các chuẩn đánh giá tiêu chuẩn như COCO.
- Thiết kế dựa trên Anchor: Việc dựa vào các hộp anchor được xác định trước đôi khi có thể yêu cầu điều chỉnh nhiều hơn cho các bộ dữ liệu có các đối tượng có hình dạng bất thường so với các phương pháp không cần anchor hiện đại.
Các trường hợp sử dụng cho YOLOv5
- Ứng dụng thời gian thực: Lý tưởng cho các ứng dụng đòi hỏi suy luận nhanh, chẳng hạn như robot, thị giác máy bay không người lái trong các ứng dụng thị giác máy tính trong hoạt động máy bay không người lái AI và phân tích video thời gian thực.
- Triển khai Edge: Rất phù hợp để triển khai trên các thiết bị edge với tài nguyên hạn chế nhờ thiết kế hiệu quả và kích thước mô hình nhỏ hơn. Tham khảo hướng dẫn triển khai NVIDIA Jetson.
- Tạo mẫu nhanh: Một lựa chọn tuyệt vời để tạo mẫu và triển khai nhanh chóng các giải pháp phát hiện đối tượng, nhờ tính dễ sử dụng và hỗ trợ mở rộng.
YOLOv7: Tập trung vào độ chính xác cao
YOLOv7, được tạo ra bởi Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao, được phát hành vào ngày 6 tháng 7 năm 2022. Nó giới thiệu một số tối ưu hóa kiến trúc và chiến lược huấn luyện, được gọi là "trainable bag-of-freebies", nhằm mục đích vượt qua các ranh giới của độ chính xác trong khi vẫn duy trì tốc độ thời gian thực.
Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
Ngày: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Docs: https://docs.ultralytics.com/models/yolov7/
Kiến trúc và các tính năng chính của YOLOv7
- E-ELAN: Sử dụng Extended Efficient Layer Aggregation Network (E-ELAN) trong backbone để tăng cường khả năng học.
- Điều chỉnh tỷ lệ mô hình: Triển khai điều chỉnh tỷ lệ phức hợp cho độ sâu và chiều rộng của mô hình để tối ưu hóa cho các mức ngân sách tính toán khác nhau.
- Huấn luyện Head phụ: Sử dụng các head phụ trong quá trình huấn luyện (loại bỏ trong quá trình suy luận) để cải thiện khả năng học đặc trưng.
- Bag-of-Freebies: Tận dụng các kỹ thuật huấn luyện tiên tiến để tăng độ chính xác mà không làm tăng chi phí suy luận.
Điểm mạnh của YOLOv7
- Độ chính xác cao: Đạt được điểm số mAP cao trên các chuẩn mực như COCO, đặc biệt với các biến thể mô hình lớn hơn.
- Efficient Training Techniques: Kết hợp các chiến lược huấn luyện mới để tối đa hóa hiệu suất.
Điểm yếu của YOLOv7
- Độ phức tạp: Kiến trúc và quy trình huấn luyện có thể phức tạp hơn so với phương pháp tiếp cận hợp lý của Ultralytics YOLOv5.
- Hệ sinh thái và Hỗ trợ: Thiếu tài liệu mở rộng, hướng dẫn và hệ sinh thái tích hợp do Ultralytics cung cấp cho YOLOv5.
- Tốn nhiều tài nguyên: Các mô hình lớn hơn đòi hỏi tài nguyên tính toán đáng kể, có khả năng hạn chế việc triển khai trên các thiết bị bị hạn chế.
Các trường hợp sử dụng cho YOLOv7
- Phát hiện hiệu suất cao: Thích hợp cho các ứng dụng mà việc đạt được độ chính xác tuyệt đối cao nhất là rất quan trọng và tài nguyên tính toán ít bị hạn chế hơn, chẳng hạn như trong xe tự hành.
- Nghiên cứu: Được sử dụng trong nghiên cứu học thuật khám phá các kỹ thuật phát hiện đối tượng hiện đại.
So sánh Hiệu suất và Kỹ thuật
So sánh trực tiếp giữa YOLOv5 và YOLOv7 trên bộ dữ liệu COCO cho thấy những khác biệt chính trong hồ sơ hiệu suất của chúng. Các mô hình YOLOv7 thường đạt được điểm mAP cao hơn nhưng thường phải trả giá bằng sự phức tạp và yêu cầu về tài nguyên tăng lên. Ngược lại, Ultralytics YOLOv5 cung cấp hồ sơ cân bằng hơn, vượt trội về tốc độ suy luận CPU và duy trì độ chính xác cạnh tranh, điều này rất quan trọng đối với nhiều triển khai thực tế.
Mô hình | Kích thước (pixels) |
mAPval 50-95 |
Tốc độ CPU ONNX (ms) |
Tốc độ T4 TensorRT10 (ms) |
Tham số (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Kết luận: Bạn nên chọn mô hình nào?
Việc lựa chọn giữa YOLOv5 và YOLOv7 phụ thuộc nhiều vào các ưu tiên của dự án.
YOLOv7 là một lựa chọn mạnh mẽ cho các nhà nghiên cứu và nhà phát triển, những người cần độ chính xác cao nhất có thể trên các tiêu chuẩn thông thường và có quyền truy cập vào các tài nguyên tính toán đáng kể. Các kỹ thuật đào tạo sáng tạo của nó chứng minh cách vượt qua các ranh giới hiệu suất.
Tuy nhiên, đối với phần lớn các ứng dụng thực tế, Ultralytics YOLOv5 vẫn là lựa chọn vượt trội. Những ưu điểm chính của nó—dễ sử dụng, triển khai nhanh chóng, cân bằng tốc độ-độ chính xác tuyệt vời và một hệ sinh thái phát triển mạnh mẽ—làm cho nó trở thành một công cụ vô cùng hiệu quả và đáng tin cậy. Nó cho phép các nhà phát triển xây dựng các giải pháp thị giác máy tính mạnh mẽ một cách nhanh chóng, từ nguyên mẫu ban đầu đến triển khai sản xuất.
Hơn nữa, hệ sinh thái Ultralytics tiếp tục phát triển. Các mô hình mới hơn như YOLOv8 và YOLO11 xây dựng dựa trên nền tảng của YOLOv5, mang lại hiệu suất tốt hơn và tính linh hoạt cao hơn trên các tác vụ như phân đoạn, ước tính tư thế và theo dõi. Đối với các nhà phát triển đang tìm kiếm một khuôn khổ hiện đại, có khả năng thích ứng với tương lai và thân thiện với người dùng, dòng Ultralytics YOLO cung cấp giải pháp toàn diện và hấp dẫn nhất.
Khám phá các Mô hình Khác
Nếu bạn đang khám phá các mô hình phát hiện đối tượng, bạn cũng có thể quan tâm đến các so sánh khác sau:
- YOLOv5 so sánh với YOLOv8
- YOLOv5 so sánh với YOLOv9
- YOLOv7 so sánh với YOLOv8
- YOLOv7 so sánh với YOLO11
- RT-DETR so với YOLOv7
- Khám phá các mô hình mới nhất như YOLOv10 và YOLO11.