Chuyển đến nội dung

So sánh mô hình: YOLOv8 so với YOLOv7 để phát hiện đối tượng

Việc lựa chọn đúng mô hình phát hiện đối tượng là rất quan trọng để đạt được hiệu suất tối ưu trong các tác vụ thị giác máy tính. Trang này cung cấp so sánh kỹ thuật giữa Ultralytics YOLOv8 và YOLOv7, hai mô hình quan trọng trong lĩnh vực này. Chúng ta sẽ phân tích các sắc thái kiến trúc, điểm chuẩn hiệu suất và các ứng dụng lý tưởng của chúng để hướng dẫn quy trình lựa chọn mô hình của bạn, đồng thời làm nổi bật những lợi thế mà hệ sinh thái Ultralytics mang lại. Mặc dù cả hai mô hình đều đã nâng cao trình độ kỹ thuật, YOLOv8 nổi lên như một lựa chọn vượt trội cho các ứng dụng hiện đại nhờ hiệu suất nâng cao, tính linh hoạt và tính dễ sử dụng vượt trội.

YOLOv8: Hiệu quả và khả năng thích ứng vượt trội

Ultralytics YOLOv8, được phát hành vào năm 2023, là mô hình hàng đầu mới nhất từ Ultralytics. Nó được xây dựng dựa trên thành công của các phiên bản tiền nhiệm, giới thiệu một cấp độ hiệu suất, tính linh hoạt và hiệu quả mới. Là một mô hình hiện đại, YOLOv8 được thiết kế để vượt trội trên một loạt các tác vụ thị giác máy tính.

Tác giả: Glenn Jocher, Ayush Chaurasia, và Jing Qiu
Tổ chức: Ultralytics
Ngày: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Tài liệu: https://docs.ultralytics.com/models/yolov8/

Kiến trúc và Thiết kế

YOLOv8 có kiến trúc tinh chỉnh, vừa mạnh mẽ vừa thân thiện với người dùng. Các cải tiến kiến trúc chính bao gồm một đầu dò tìm không neo mới và một backbone hiệu quả hơn. Thiết kế không neo làm giảm số lượng dự đoán hộp, giúp đơn giản hóa các bước hậu xử lý như Non-Maximum Suppression (NMS) và tăng tốc độ suy luận. Điều này làm cho YOLOv8 dễ thích ứng hơn với các hình dạng và kích thước đối tượng khác nhau mà không cần điều chỉnh neo thủ công.

Điểm mạnh

  • Hiệu suất vượt trội: YOLOv8 mang lại sự cân bằng vượt trội giữa độ chính xác và tốc độ, vượt trội hơn các mô hình trước đó trên tất cả các quy mô. Các mô hình nhỏ hơn của nó nhanh hơn và chính xác hơn so với các biến thể YOLOv7 tương đương, trong khi các mô hình lớn hơn của nó đặt ra các tiêu chuẩn mới về độ chính xác.
  • Tính Linh hoạt Vượt trội: Không giống như YOLOv7, vốn chủ yếu là một object detector (trình phát hiện đối tượng), YOLOv8 là một framework thống nhất hỗ trợ nhiều tác vụ ngay khi xuất xưởng: object detection (phát hiện đối tượng), instance segmentation (phân vùng thể hiện), pose estimation (ước tính tư thế), image classification (phân loại ảnh)oriented object detection (OBB) (phát hiện đối tượng theo hướng).
  • Dễ sử dụng: Ultralytics ưu tiên trải nghiệm nhà phát triển được tinh giản. YOLOv8 đi kèm với một Python APICLI đơn giản, tài liệu toàn diện và tích hợp liền mạch với các công cụ như Ultralytics HUB để đào tạo và triển khai không cần code.
  • Hệ sinh thái được duy trì tốt: Là một mô hình Ultralytics chính thức, YOLOv8 được hưởng lợi từ sự phát triển tích cực, cập nhật thường xuyên và một cộng đồng mã nguồn mở vững mạnh. Điều này đảm bảo độ tin cậy, khả năng tiếp cận các tính năng mới nhất và hỗ trợ mở rộng.
  • Hiệu quả về huấn luyện và bộ nhớ: Các mô hình YOLOv8 được thiết kế để huấn luyện hiệu quả, thường yêu cầu ít bộ nhớ CUDA hơn so với các kiến trúc khác như transformer. Các weights (trọng số) đã được huấn luyện trước, có sẵn trên các tập dữ liệu như COCO cho phép hội tụ nhanh hơn trên dữ liệu tùy chỉnh.

Điểm yếu

  • Là một mô hình rất tiên tiến, các biến thể YOLOv8 lớn nhất đòi hỏi tài nguyên tính toán đáng kể cho quá trình huấn luyện, mặc dù chúng vẫn rất hiệu quả so với mức hiệu suất của chúng.

Các trường hợp sử dụng lý tưởng

Hiệu suất vượt trội và tính linh hoạt của YOLOv8 khiến nó trở thành lựa chọn lý tưởng cho một loạt các ứng dụng, từ thiết bị biên đến máy chủ đám mây.

Tìm hiểu thêm về YOLOv8

YOLOv7: Một chuẩn mực trong phát hiện theo thời gian thực

YOLOv7 được giới thiệu vào năm 2022 như một bước tiến đáng kể trong phát hiện đối tượng theo thời gian thực, thiết lập một chuẩn mực mới tại thời điểm phát hành. Nó tập trung vào việc tối ưu hóa các quy trình huấn luyện để cải thiện độ chính xác mà không làm tăng chi phí suy luận.

Tác giả: Chien-Yao Wang, Alexey Bochkovskiy và Hong-Yuan Mark Liao
Tổ chức: Viện Khoa học Thông tin, Academia Sinica, Đài Loan
Ngày: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Docs: https://docs.ultralytics.com/models/yolov7/

Kiến trúc và Thiết kế

YOLOv7 giới thiệu một số cải tiến kiến trúc, bao gồm Mạng Tổng Hợp Lớp Hiệu Quả Mở Rộng (E-ELAN) trong backbone của nó để cải thiện hiệu quả học tập. Đóng góp đáng chú ý nhất của nó là khái niệm "trainable bag-of-freebies", là các chiến lược huấn luyện giúp tăng cường độ chính xác của mô hình mà không làm tăng thêm chi phí suy luận. Chúng bao gồm các kỹ thuật như auxiliary head và gán nhãn từ thô đến tinh.

Điểm mạnh

  • Hiệu suất cao khi phát hành: YOLOv7 cung cấp sự kết hợp tuyệt vời giữa tốc độ và độ chính xác, vượt trội hơn các trình phát hiện khác có sẵn vào thời điểm đó.
  • Huấn luyện hiệu quả: Khái niệm "bag-of-freebies" cho phép nó đạt được độ chính xác cao với các quy trình huấn luyện được tối ưu hóa.
  • Điểm Chuẩn Đã Được Thiết Lập: Đây là một mô hình được đánh giá cao và đã được kiểm tra rộng rãi trên các bộ dữ liệu tiêu chuẩn như MS COCO.

Điểm yếu

  • Tính linh hoạt hạn chế: YOLOv7 chủ yếu là một trình phát hiện đối tượng. Việc mở rộng nó sang các tác vụ khác như phân đoạn hoặc ước tính tư thế đòi hỏi các triển khai riêng biệt, thường là do cộng đồng phát triển, không giống như cách tiếp cận tích hợp của YOLOv8.
  • Độ phức tạp về kiến trúc: Các kỹ thuật huấn luyện và các thành phần kiến trúc có thể phức tạp hơn để hiểu và sửa đổi so với thiết kế được sắp xếp hợp lý của YOLOv8.
  • Hiệu suất kém hơn so với các Model mới hơn: Mặc dù mạnh mẽ, YOLOv7 đã bị YOLOv8 vượt trội về cả tốc độ và độ chính xác. Hệ sinh thái Ultralytics cũng mang lại trải nghiệm toàn diện và thân thiện với người dùng hơn.

Các trường hợp sử dụng lý tưởng

YOLOv7 vẫn là một mô hình có năng lực cho các ứng dụng đã được tích hợp trước khi có các lựa chọn thay thế mới hơn.

  • Hệ thống bảo mật thời gian thực: Phù hợp cho các ứng dụng như ngăn chặn trộm cắp nơi phát hiện nhanh chóng và chính xác là chìa khóa.
  • Các dự án cũ: Một lựa chọn khả thi để duy trì hoặc mở rộng các hệ thống hiện có được xây dựng trên kiến trúc YOLOv7.

Tìm hiểu thêm về YOLOv7

Hiệu năng và điểm chuẩn: YOLOv8 so với YOLOv7

So sánh hiệu năng cho thấy rõ những cải tiến đạt được với YOLOv8. Nhìn chung, các mô hình YOLOv8 mang lại sự cân bằng tốt hơn giữa độ chính xác và tốc độ.

Mô hình Kích thước
(pixels)
mAPval
50-95
Tốc độ
CPU ONNX
(ms)
Tốc độ
T4 TensorRT10
(ms)
Tham số
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Từ dữ liệu, một số hiểu biết quan trọng xuất hiện:

  • Độ chính xác vượt trội: Mô hình lớn nhất, YOLOv8x, đạt 53.9 mAP, vượt qua 53.1 mAP của mô hình YOLOv7x.
  • Tốc độ Vượt trội: Các mô hình YOLOv8 nhanh hơn đáng kể, đặc biệt là trên CPU. Mô hình YOLOv8n tự hào có thời gian suy luận chỉ 80.4 ms trên CPU với ONNX, một chỉ số không có sẵn cho YOLOv7 nhưng nhanh hơn rõ rệt trên thực tế. Trên GPU, YOLOv8n đạt được 1.47 ms đáng kinh ngạc với TensorRT, vượt xa hiệu quả của YOLOv7.
  • Hiệu quả cao hơn: Các mô hình YOLOv8 có ít tham số và FLOPs hơn để có hiệu suất tương đương hoặc tốt hơn. Ví dụ: YOLOv8l đạt mAP gần bằng YOLOv7x (52.9 so với 53.1) nhưng với số lượng tham số (43.7M so với 71.3M) và FLOPs (165.2B so với 189.9B) ít hơn đáng kể.

Kết luận: Tại sao YOLOv8 là lựa chọn ưu tiên

Trong khi YOLOv7 là một mô hình đáng gờm, YOLOv8 là người chiến thắng rõ ràng cho các dự án và phát triển mới. Kiến trúc vượt trội, hiệu suất hiện đại và tính linh hoạt đáng kinh ngạc của nó làm cho nó trở thành công cụ mạnh mẽ và thân thiện với người dùng nhất hiện có để phát hiện đối tượng và các tác vụ thị giác máy tính khác.

Hệ sinh thái Ultralytics tích hợp mang lại một lợi thế đáng kể, cung cấp trải nghiệm liền mạch từ huấn luyện đến triển khai. Đối với các nhà phát triển và nhà nghiên cứu đang tìm kiếm một mô hình mạnh mẽ, được hỗ trợ tốt và hiệu suất cao, YOLOv8 là lựa chọn dứt khoát.

Khám phá các Mô hình Khác

Đối với những ai quan tâm đến việc khám phá thêm, Ultralytics cung cấp một loạt các mô hình và so sánh. Hãy xem xét:

  • YOLOv8 vs. YOLOv5: So sánh YOLOv8 với một mô hình hiệu quả và được ưa chuộng rộng rãi khác.
  • YOLOv8 vs. RT-DETR: Xem YOLOv8 so sánh với các kiến trúc dựa trên transformer như thế nào.
  • YOLO11 so với YOLOv8: Khám phá những cải tiến trong mô hình Ultralytics mới nhất, YOLO11.


📅 Đã tạo 1 năm trước ✏️ Đã cập nhật 1 tháng trước

Bình luận